Données scientifiques

 

Dans un contexte international d’ouverture et de partage des données scientifiques, la gestion des données produites dans le cadre de travaux de recherche est au cœur des préoccupations des chercheurs mais aussi des responsables des infrastructures informatiques des laboratoires qui doivent faire face à la masse d’informations à conserver parfois sur du moyen ou long terme.
Dans cette perspective, le CINES, fort de sa double expérience en calcul intensif et en archivage pérenne et de ses infrastructures informatiques d’excellence, accompagne les producteurs et gestionnaires de données dans leurs problématiques d’archivage.
L’objectif principal est de garantir l’accessibilité, l’intégrité, la lisibilité et la compréhension des données aussi longtemps que nécessaire en adaptant le niveau d’exigences requis par l’archivage en fonction de cette durée.

Du calcul sur Occigen à l’archivage

Le calcul intensif génère de très grandes quantités de données. Parmi celles-ci, certaines méritent d’être conservées, pour diverses raisons :
– soit elles ont nécessité de très nombreuses heures de calcul (ce qui représente un coût financier non négligeable)
– soit elles doivent être conservées à des fins de comparaison et de validation (tests de non régression)
– soit les deux raisons à la fois.

Lire la suite

Il existe des méthodes de « sauvegarde », mais elles ne sont absolument pas pérennes, et ne dépassent pas, bien souvent, la durée d’un projet de calcul. Il est donc obligatoire de s’appuyer sur un service d’archivage pour s’assurer de la conservation des résultats lorsqu’elle est nécessaire. C’est la raison du versement de certains résultats au service d’archivage numérique du CINES.
La chaîne de traitement est ainsi complète au sein même du CINES, depuis le producteur jusqu’à la conservation et la diffusion. C’est un circuit court, permettant une plus grande rapidité entre le temps de la création et celui de l’archivage. C’est aussi une économie, car les données n’ont plus besoin d’être stockées de façon intermédiaire en différents lieux de la chaîne de traitement.

L’infrastructure de gestion et de préservation des données scientifiques EUDAT

Le projet européen EUDAT (European Data for e-science) vise à la mise en place d’une infrastructure partagée pour gérer l’ensemble du cycle de vie des données des communautés scientifiques européennes.
L’objectif principal est d’offrir un environnement sécurisé pour conserver, trouver, accéder et traiter les données des chercheurs et scientifiques de toutes les disciplines.

Lire la suite


Initié en 2011, le consortium EUDAT a été prolongé dans le cadre d’Horizon 2020 et rassemble à travers 15 pays différents, 35 partenaires avec des compétences multiples : centres de calcul, centres de données, bibliothèques, communautés scientifiques, data scientists. Le CINES est le seul partenaire en France qui soit à la fois centre de données et centre de calcul (de niveau Tier1). Il est également l’unique membre fondateur français de l’ infrastructure européènne distribuée associée.Dans ce cadre le CINES offre notamment des services basés sur les outils EUDAT : « B2SAFE« , « B2STAGE » ou encore « B2HANDLE« .
Plus d’infos sur : EUDATEUDAT

BSN : Bibliothèque Scientifique Numérique

 

La Bibliothèque Scientifique Numérique est un projet porté par le Ministère de l’Enseignement supérieur et de la Recherche depuis 2008. Elle réunit les principaux acteurs nationaux des dix segments d’activité qui la composent en vue d’améliorer l’accès à l’information scientifique et technique numérique.

Lire la suite


Dans ce cadre, le CINES participe au groupe de travail consacré aux données de la recherche (BSN10) dont l’objectif est de coordonner les questions d’acquisition, de production, de référencement, de protection, de stockage, d’archivage, de diffusion et de réutilisation des données produites dans le cadre des travaux de recherche. Dans un contexte international de science ouverte, BSN10 favorise le développement et l’harmonisation des politiques de gestion et de partage des données en France.
Plus d’infos sur : BSN 10

BSN

 

 

Huma-NumFOCUS SUR…

La collaboration CINES—HUMA-NUM

Huma-Num est une très grande infrastructure de recherche (TGIR) visant à faciliter le tournant numérique de la recherche en sciences humaines et sociales (SHS).
Elle développe un dispositif technologique qui permet d’accompagner les différentes étapes du cycle de vie des données numériques. Ainsi, elle met à disposition un ensemble de services pour le stockage, le traitement, l’exposition, le signalement, la diffusion et la conservation sur le long terme des données numériques de la recherche en sciences humaines et sociales.
Elle s’appuie pour cela sur un important réseau de partenaires et d’opérateurs, parmi lesquels le CINES, pour assurer la conservation sur le long terme des données de la recherche en SHS.Parmi les projets menés au CINES en collaboration avec Huma-Num, on peut citer l’archivage de corpus oraux de recherche en linguistique, des images issues de photothèque, des corpus de texte en TEI ainsi que des données archéologiques en 3D.Plus d’infos sur : TGIR Huma-Num

 

Quelques exemples :

 

geosud3

esgf2

Dernière modification le : 22 septembre 2016