Conversion

conversionUne conversion de format de fichiers consiste à transformer un ensemble de fichiers archivés dans un format jugé non pérenne en un autre format jugé pérenne, de manière à assurer la lisibilité des informations qu’ils contiennent.
Elle peut intervenir en amont de l’archivage, si les fichiers à archiver ont été produits dans des formats non pérennes ; ou au cours de la conservation du fichier, si le format retenu lors de l’archivage devient obsolète.

Au CINES, nous avons choisi d’adopter le terme de migration logique, qui englobe la conversion de formats en elle-même ainsi que toutes les étapes de réflexion et de tests préalables.
Cette démarche est expliquée dans le processus de migration logique que nous avons détaillé dans le cadre de la définition de nos processus métier.

Voir la cartographie et la fiche de caractéristiques du processus de migration logique.

Avant de se lancer dans toute conversion effective, il est très important de faire une phase de tests assortie d’une étude de faisabilité de manière à maîtriser complètement l’opération. Il faut notamment savoir :

  • quelles sont les informations importantes à préserver en priorité dans le document,
  • quels sont les procédés qui vont être utilisés (s’ils vont être automatiques ou manuels : tout dépend du nombre de fichiers à migrer),
  • s’il existe déjà des logiciels de migration (gratuits ou payants),
  • et quels vont être les effets de la migration sur les fichiers : pertes acceptables, pas de perte, trop de pertes…

Car toute migration de format entraîne généralement des dégradations de l’information à conserver : dans la forme et/ou le contenu. L’important est de préserver la fidélité du document.

Règles retenues au CINES en matière de migration logique

L’objectif premier est d’effectuer le moins de migrations possible. C’est pour cela que le CINES effectue une sélection rigoureuse des formats acceptés pour l’archivage.
Pour plus d’informations sur la sélection des formats de fichier, voir la rubrique sur l’expertise formats.

Toute conversion de format ne peut avoir lieu sans l’accord explicite du service versant. Cependant, une fois cette autorisation donnée, l’opération reste transparente pour lui et le CINES se charge d’assurer le lien entre les fichiers initialement versés et leur forme migrée.

L’archivage des fichiers migrés dans PAC se fait de la même manière que pour tout projet d’archives et n’entraîne pas la suppression du fichier initialement archivé.
Conformément à la norme ISO 27001, les deux dernières versions migrées d’un fichier seront conservées en sus du fichier initial :

Si F(0) est le fichier au format initial, et F(n) le fichier sous sa dernière forme migrée, alors PAC conservera F(0), F(n) et F(n-1).

Ainsi, lors de la troisième migration d’un même fichier, il convient d’en détruire la première forme migrée, et ainsi de suite.

Dans le cas d’un AIP composé de plusieurs fichiers, seul le (ou les) fichier(s) au format jugé non pérenne est (sont) migré(s). Il ne doit pas y avoir de duplication de l’AIP dans son intégralité, afin d’éviter les redondances dans le stockage. Les liens entre les différents fichiers composants l’AIP initial et le(s) AIP migré(s) sont retranscrits par le biais de tables d’index.
L’archivage dans PAC des fichiers migrés respecte toutefois l’unité des AIP d’origine.

Le sip.xml qui accompagne ces fichiers migrés est une forme réduite du sip.xml ‘classique’ : il ne contient que les métadonnées essentielles à son identification et à son rattachement à l’AIP d’origine. Ce dernier reste l’AIP de référence pour l’utilisateur.
En outre, il est nécessaire de bien documenter et de pérenniser un certain nombre d’informations sur l’opération de migration logique et de lier directement ces données aux fichiers migrés :

  • nom et date de l’opération de migration ;
  • dénomination et version des formats d’origine et cible ;
  • nombre de fichiers concernés ;
  • nom des logiciels de conversion et de contrôle de format utilisés ;
  • liste des caractéristiques du contenu du fichier qui ont voulu être conservées ;
  • etc.

Ces informations sont rassemblées dans un fichier XML de métadonnées. Il y a un fichier de métadonnées par opération de migration et tous les fichiers migrés de la même opération de migration renvoient au même fichier de métadonnées.

Actuellement, aucune migration logique n’a dû être réalisée sur les archives conservées dans PAC.
Les spécifications décrites ci-dessus nous permettent d’envisager le déroulement d’une telle opération.

Voici deux outils du programme européen Planets pour aider à la planification de la préservation

plato-logoPlato

Un outil d’analyse de différents scénarii donnant des recommandations bien documentées et solides aidant au choix d’une stratégie de planification de préservation, selon des critères définis au préalable.

opf-site-logo

 

Open Preservation Foundation

Un environnement de recherche et d’expérimentation dédié où les résultats peuvent être évalués et partagés avec la communauté au sens large. 

Dernière modification le : 30 décembre 2016