Les informations de représentation

Qu’est-ce qu’une information de représentation ?

Au sens large, c’est tout ce qui confère une signification à la chaîne de bits qui constitue l’objet archivé pour restituer le contenu, pour le comprendre et pour l’interpréter. C’est donc ce qui, associé à l’objet numérique, va constituer le contenu d’information selon l’OAIS.

Une information de représentation peut être :

  • une information de structure qui explique la façon dont d’autres informations sont organisées (ex. : les tables de correspondance entre les noms de fichiers et les numéros de page pour un ouvrage numérisé) ;
  • ou une information sémantique qui fournit une information complémentaire sur la signification particulière à associer à chacune des informations de structure (ex. : dans le cas d’une archive composée de texte, l’information sémantique donne des explications sur la langue dans laquelle l’archive est exprimée).

Pour être utile, une information de représentation doit être nécessairement adaptée à la base de connaissance des utilisateurs de l’archive (i.e. la « communauté d’utilisateurs cible » selon l’OAIS), tant actuels que futurs.
Ainsi, prenons l’exemple d’un fonds de littérature chinoise du XIVème siècle qui, après numérisation, serait archivé. Le service d’archives doit s’assurer que la communauté-cible (utilisateurs potentiels) connaît l’alphabet chinois du XIVème siècle ainsi que les codes de cette littérature et l’histoire de la Chine. A défaut, il devra s’assurer que ces informations sont accessibles quelque part de manière pérenne et en garantir le lien ou les archiver dans son système au même titre que les documents numérisés.

La Bibliothèque d’informations de représentation du CINES :

Au CINES, l’ensemble de ces informations est regroupé au sein d’une Bibliothèque d’Informations de Représentation (BIR) sur les formats. Elle contient :

  • les spécifications des formats des fichiers archivés ;
  • les schémas XSD ou DTD documentés des fichiers XML archivés.

Ces informations nous permettent de garantir la lisibilité ou la recouvrabilité d’un fichier à un format donné grâce à la compréhension de la manière dont se constitue ce format.

Ces informations de représentation sont ingérées par le système :

  • pour les spécifications des formats de fichiers : en amont de l’archivage des documents, lors de l’ajout d’un nouveau format dans la liste des formats archivables ;
  • pour les schémas de fichiers XML : lors de l’archivage du fichier, le schéma auquel il fait référence est automatiquement aspiré par la BIR.

Ces informations sont stockées dans une base de données distincte de celle du système d’archivage, qui est sauvegardée.

Dernière modification le : 12 janvier 2017
CINES