Le modèle de référence : l’OAIS

Le modèle de référence OAIS – Reference Model for an Open Archival Information System – est le résultat d’un travail du CCSDS – Consultative Committee for Space Data Systems (organisme international de normalisation des agences spatiales) – réalisé à la demande l’ISO.
Ce travail, auquel ont été associés des représentants de bibliothèques et d’archives institutionnelles, a abouti en 2002 à la rédaction d’un document qui spécifie de manière très générale l’architecture logique et les fonctionnalités d’un système d’archivage. 
C’est aujourd’hui une norme internationale ISO (ISO 14721). Sa traduction en français, projet de norme ISO, est disponible depuis le printemps 2005.

OAIS est un modèle abstrait. Il définit une terminologie et des concepts. Il identifie les acteurs, décrit les fonctions et les flux d’information, et propose un modèle d’informationparticulièrement adapté à la problématique de l’archivage numérique, même s’il ne préjuge pas de la nature des objets à archiver.
OAIS n’est pas un recueil de spécifications techniques destinées à être directement implémentées. C’est un guide qui cerne la problématique dans son ensemble et qui contraint à se poser toutes les bonnes questions.
En tant que modèle conceptuel de référence, OAIS s’est aujourd’hui largement imposé, au niveau international, auprès de tous les acteurs institutionnels de l’archivage numérique.

Les acteurs de l’archivage

acteurs_oais

Le modèle OAIS identifie quatre rôles principaux dans un système d’archivage :

 

  • un acteur interne, l’ « archive », c’est-à-dire l’opérateur du système d’archivage,
  • trois acteurs externes : le « management », les « producteurs » et les « utilisateurs ».
    • Le « management » assure la fonction de décideur politique. Pour le management, le système d’archivage s’insère dans un plan stratégique global dont il n’est qu’un élément parmi d’autres. C’est évidemment au management qu’il revient de soutenir le dispositif, politiquement, financièrement, et sur le très long terme.
    • Les « producteurs » sont les personnes, ou plus vraisemblablement les organismes, qui fournissent les objets à archiver. Les objets numériques sur lesquels travaillent les producteurs avant archivage sont les SIP (submission information package). Une fois archivés, ils deviennent les AIP (archival information package), objets internes à l’Archive.
    • Les « utilisateurs », quant à eux, sont les organismes et les personnes qui ont accès aux copies de ces objets archivés. Les objets numériques mis à la disposition d’utilisateurs sont les DIP (dissemination information package). OAIS identifie une classe particulière d’utilisateurs – la « communauté d’utilisateurs cible » – comme étant la population prioritairement bénéficiaire du service d’archivage. Les services à fournir seront distincts selon que la communauté d’utilisateurs cible est nombreuse ou non, experte ou « grand public », etc.

 

Les fonctions de l’archivage

Le modèle OAIS cartographie un système d’archivage selon 6 grands domaines fonctionnels.

fonctions_oais

L’entité « entrées » reçoit, contrôle et valide les objets à archiver. Les objets eux-mêmes sont transmis à l’entité « stockage », tandis que les informations nécessaires à leur description et à leur gestion dans le temps sont transmises à l’entité « gestion des données ».

L’entité « stockage » assure la conservation physique des objets archivés. Elle tient les objets archivés à la disposition de l’entité « accès ». Conformément aux règles établies par l’entité « administration », elle prend en charge la réalisation des copies multiples et le renouvellement des supports anciens.

L’entité « gestion des données » prend en charge la tenue à jour de toutes les informations internes – base de données – nécessaires au système d’archivage. Elle fournit aux autres entités du système les informations descriptives des objets archivés (notamment à l’entité « accès ») et toutes les informations de gestion techniques et archivistiques nécessaires.

L’entité « administration » assure la coordination générale du système. Elle en établit les règles internes. Elle veille à la qualité globale du service rendu et à son amélioration. Elle rend compte au management.

L’entité « planification de la pérennisation » est la cellule de veille et de planification du système. Elle « écoute » l’environnement extérieur et émet des recommandations en vue de procéder aux évolutions nécessaires, notamment aux évolutions de type technologiques. Elle prépare et planifie ces évolutions. Elle est également responsable du suivi des changements qui peuvent s’opérer dans la « communauté d’utilisateurs cible » cible en vue de garantir que le service d’accès reste conforme aux attentes nouvelles des utilisateurs.

L’entité « accès » regroupe tous les services qui sont en interface directe avec les utilisateurs. Outre les fonctions de contrôle d’accès, il s’agit principalement de permettre aux utilisateurs de rechercher dans le « catalogue » des objets archivés, et de leur fournir les objets dont ils passent commande.

Les différents types d’information

Pour l’OAIS, chaque objet à archiver est contenu dans un paquet d’informations, qui regroupe plusieurs types d’informations à pérenniser afin de garantir une conservation sur le long terme.

Tout objet (contenu de données) archivé est étroitement lié à son information de représentation qui permet de le traduire en des concepts plus explicites (la plupart du temps, il s’agit des spécifications des formats de fichiers).

Au sens large, une information de représentation confère une signification à la chaîne de bits qui constitue l’objet archivé pour restituer le contenu, pour le comprendre et pour l’interpréter. C’est donc ce qui, associé à l’objet numérique, va constituer le contenu d’information selon l’OAIS.

Une information de représentation peut être :

  • une information de structure qui explique la façon dont d’autres informations sont organisées (ex. : les tables de correspondance entre les noms de fichiers et les numéros de page pour un ouvrage numérisé) ;
  • ou une information sémantique qui fournit une information complémentaire sur la signification particulière à associer à chacune des informations de structure (ex. : dans le cas d’une archive composée de texte, l’information sémantique donne des explications sur la langue dans laquelle l’archive est exprimée).

Pour être utile, une information de représentation doit être nécessairement adaptée à la base de connaissance des utilisateurs de l’archive (i.e. la « communauté d’utilisateurs cible » selon l’OAIS), tant actuels que futurs.
Ainsi, prenons l’exemple d’un fonds de littérature chinoise du XIVème siècle qui, après numérisation, serait archivé. Le service d’archives doit s’assurer que la communauté-cible (utilisateurs potentiels) connaît l’alphabet chinois du XIVème siècle ainsi que les codes de cette littérature et l’histoire de la Chine. A défaut, il devra s’assurer que ces informations sont accessibles quelque part de manière pérenne et en garantir le lien ou les archiver dans son système au même titre que les documents numérisés.

Cet ensemble, appelé Contenu d’information, doit être associé à un certain nombre d’informations de pérennisation (PDI), qui sont indispensables à la bonne compréhension de l’objet archivé dans le temps. Ces informations de pérennisation sont de plusieurs sortes :

  • des informations de provenance, qui documentent l’historique du contenu d’information ;
  • des informations de contexte, qui détaillent les liens entre le contenu d’information et son environnement ;
  • des informations d’identification, qui permettent d’identifier sans équivoque le contenu d’information ;
  • des informations d’intégrité, qui décrivent les mécanismes garantissant l’intégrité du contenu d’information.

Ces éléments (contenu d’information + informations de pérennisation) sont reliés entre eux par le biais de l’information d’empaquetage.

L’information de description – description des paquets d’informations – est transmise à l’Entité « gestion des données » pour les fonctions de recherche, commande et récupération des informations contenues dans le système d’archivage. Elle permet d’en constituer le référentiel de base de données.

Une version 2 de l’OAIS a été publiée en août 2012.
Cette nouvelle version apporte plusieurs modifications :

  • elle prend en compte la gestion des risques de manière plus explicite ;
  • une nouvelle catégorie d’informations est identifiée : les informations de droits d’accès sur les documents ;
  • elle rend obligatoire l’existence d’un plan de réversibilité (restitution des données archivées) ;
  • tout en envisageant la destruction des données sous certaines conditions ;
  • enfin, le concept d’« information property » apparaît, qui permet de décrire une partie de l’information que l’on souhaite préserver que l’on souligne dans un but particulier (surtout dans le cas d’une migration de format pour bien insister sur quelle est l’information que l’on souhaite préserver en priorité).

Au terme de cette présentation rapide du modèle OAIS, il peut être utile de préciser un point de terminologie qui est parfois source de confusion. Bien que très voisins, les sigles OAIS et OAI désignent des réalités tout à fait indépendantes l’une de l’autre.
OAI désigne tous les projets et les réalisations en faveur de l’Open Acces Initiative, c’est à dire de l’accès libre à l’information « académique ». Le sigle OAI est parfois développé en Open Archive Initiative (« archives ouvertes » en français), ce qui ne manque pas d’entretenir la confusion avec OAIS.
Le terme « Open » de OAIS signifie simplement que le modèle, c’est-à-dire le contenu du document de référence, n’est pas sous « copyright » et qu’il est donc librement diffusable et utilisable. Mais, le modèle OAIS ne préjuge pas du contrôle ou non de l’accès aux informations archivées et il est donc complètement indépendant des initiatives OAI.

Dernière modification le : 30 décembre 2016