La gestion des données constitue l'un des défis de la Science Ouverte de la prochaine décennie. Ceci est particulièrement important en Sciences de la Terre et de l'Environnement pour laquelle la multiplication des échantillons de terrain et de mesures qui sont réalisées sur chacun conduit à une croissance exponentielle du nombre de données. Or, l'absence de systèmes d'information dédiés empêche de capitaliser sur cette grande richesse en reliant les échantillons-données entre elles, notamment par des métadonnées riches et fiables.
Dans cette contribution, nous présentons la bancarisation d'informations de terrain collectées lors du prélèvements de carottes sédimentaires (marines, continentales) et glaciaires, soutenu depuis 2014 par l'Equipex Climcor et le Réseau des Zones Ateliers (LTER-France), ainsi que les institutions CNRS, IFREMER et MNHN.
Ce système tend à répondre au plus près des principes d'ouverture de la données F.A.I.R. et est constitué de deux modules opérationnels : i) le CoreBook, qui est une application mobile de collecte d'information sur le terrain sous Android, et ii) le hub de données Cyber-carothèque nationale, qui est un portail d'import multi-institutionnels, de consultation et de diffusion des données d'échantillons collectées. Que ce soit par une opération de synchronisation du Corebook, ou par l'import via un fichier d'inventaire ou encore par un flux de données WFS, les métadonnées de carottage sont ainsi capitalisées et tracées au niveau du portail national. Ainsi, chaque échantillon peut se voir attribuer un identifiant unique au format international IGSN, permettant de les identifier sans ambiguïté pour les citations dans des publications ou l'intégration dans des systèmes d'information tiers. Pour l'utilisateur final, le Portail Cyber-carothèque nationale offre des fonctionnalités de recherche multicritères et constitue une base de référence multi-institutionnelles, structurée, ouverte et standardisée permettant de connaître les échantillons déjà prélevés dans une région donnée, ou de retrouver des échantillons anciens encore disponibles dans les entrepôts de stockage.
En prenant le problème de la gestion des données à la base, au niveau des opérations de terrain, le système fournit à la communauté scientifique nationale un socle solide qui permettra d'aller ensuite vers des bases de données tournées vers les données instrumentales.