Workflow d’archivage

La plateforme PAC respecte les normes et pratiques du domaine. Elle est conforme notamment à la norme OAIS et au standard d’échange de données pour l’archivage. 

Elle a fait l’objet de nombreux tests avant d’archiver ses premiers documents et subit couramment des évolutions. Pour ce faire, le CINES dispose de trois environnements séparés mais similaires : un pour le développement, un autre pour les tests, et enfin l’environnement de production où l’archivage est effectif.

Fonctionnement des échanges entre CINES et producteur/service versant

Avant tout transfert, le représentant du service versant prend contact avec le service PAC du CINES afin d’élaborer un protocole de transfert dans lequel seront définies les composantes du projet d’archives : identification des informations à pérenniser, volumétrie et formats choisis, conformité avec les normes légales et sécuritaires, précisions sur la communicabilité, modalités de versement, formation du personnel du service versant à l’utilisation du système PAC, etc.

Plus de détails sur le déroulement d’un projet d’un projet d’archives au CINES.

Transfert

Le service versant transmet par réseau (via SFTP), ou sur support amovible, les informations à verser au service PAC du CINES. Ces informations se présentent sous la forme d’un SIP (paquet d’information soumis), dans un répertoire de versement structuré de la manière suivante :

  • le sip.xml, fichier de métadonnées décrivant l’objet à archiver ;
  • un répertoire DEPOT, qui contient l’objet à archiver et ses éventuelles métadonnées métier ;
    • les différents fichiers qui composent l’objet à archiver ;
    • un répertoire DESC qui contient les fichiers de métadonnées métier ;
      • les différents fichiers de métadonnées métier.

Cliquez pour agrandir

Le transfert est repéré par l’application PAC qui procède alors à une série de contrôles de validité technique des données transférées : conformité des formats, structure des versements… Si le contrôle est positif, le versement est transféré sur le serveur de stockage où il est archivé. Le service PAC renvoie au service versant un certificat d’archivage comportant l’identifiant unique et pérenne de l’archive transférée ainsi que ses métadonnées. L’identifiant de l’archive est un identifiant unique qui permet au service versant ou à des utilisateurs de PAC de retrouver l’archive.
Dans le cas contraire, une notification d’erreur est envoyée au service versant afin qu’il modifie les éléments non conformes et reverse le paquet d’archives.

Stockage

Lorsqu’il arrive sur le serveur de stockage, tout document à archiver est copié simultanément sur deux disques distincts, et est quotidiennement sauvegardé sur deux bandes magnétiques. Une de ces bandes est stockée sur un site distant. Une étude est également en cours sur la possibilité d’effectuer une réplication croisée de données avec la Bnf : les archives traitées au CINES seraient sur un site plus distant que celui actuellement utilisé. Cette mesure réduirait d’autant plus le risque de pertes de données dans le cas de catastrophes majeures (attentats, inondations, incendies…).
Pour faciliter les recherches, les métadonnées associées au document sont collectées et intégrées dans une base de données.
Il n’y a pas de suppression des documents archivés dans la plateforme. Les mises à jour sont possibles et se superposent aux documents déjà archivés.
La veille technologique concernant les évolutions d’environnement de stockage, les technologies ainsi que les évolutions des formats est réalisée par le CINES. Durant la vie du document dans le système PAC, des opérations d’exploitation courante peuvent être menées (contrôle des supports, migrations de support à support, restaurations, contrôle des métadonnées). Le service producteur ou le service versant n’en sera pas informé. Cependant, lorsque les modifications concernent le format ou une mise à jour des métadonnées, le producteur (ou à défaut le service versant) en est averti. Le service PAC ne prévoit pour l’instant pas de fonction d’élimination, les fonds archivés étant jugés d’intérêt national doivent être conservés indéfiniment.

Stockage

Communication

La communication se fait via le serveur d’accès en conformité avec le modèle OAIS et le standard d’échanges de données pour l’archivage.

On s’assure en premier lieu que l’utilisateur a bien les droits d’accès à la plateforme avant de lui communiquer le catalogue des archives auxquelles il a accès. Il fait alors une demande d’archives qui, après vérification de la communicabilité, lui est accordée ou non. Si l’archive n’est pas communicable, l’utilisateur a la possibilité de demander, via le CINES, une dérogation au service versant/producteur.
Si la communication est autorisée, le serveur d’accès demande l’archive au serveur de stockage, la prépare et la met à disposition de l’utilisateur dans un répertoire dédié.

Acces

Fonctionnalités implémentées

Les différentes fonctionnalités implémentées sont les suivantes :

Transfert (Entrées) Réception des SIP Détection d’un nouveau transfert
Envoi d’un accusé de réception
Contrôle des SIP Conformité des métadonnées sip.xml par rapport au schéma sip.xsd
Correspondance entre la description sip.xml et les fichiers qui composent le document
Contrôle et validation du format des fichiers Calcul de l’empreinte numérique de chaque fichier
Ingestion des éventuelles informations de représentation
Création des AIP Création de l’identifiant du document archivé
Mise à jour des métadonnées : sip.xml -> aip.xml
Transfert de l’AIP au serveur de stockage
Stockage Archivage des AIP Copie multiple de l’AIP sur les différents médias ou supports
Envoi du certificat d’archivage
Outils d’administration et de maintenance des documents archivés Journalisation des évènements (horodatés, historiés, traçables)
Vérification périodique de l’intégrité des AIP archivés
Migration physique (changement de supports)
Migration logique (conversion de formats)
Fourniture d’états et de statistiques
Accès Authentification Contrôle d’authentification de l’utilisateur
Demande d’interrogation Consultation du catalogue des AIP archivés
Fourniture de résultats de recherche Visualisation des métadonnées des documents
Demande de communication Détection d’une demande de communication
Vérification de la communicabilité du document
Préparation du paquet d’informations à communiquer
Mise à disposition d’une copie du document archivé
Demande de dérogation d’accès

 

 

Dernière modification le : 27 mars 2017