Aree concettuali comuni tra OAIS e PREMIS: costruire archivi resilienti

(Prima parte)
archivio
archivio

Aree concettuali comuni tra OAIS e PREMIS: costruire archivi resilienti

(Prima parte)

 

L’OAIS (Open Archival Information System, ISO 14721:2025) è un modello di riferimento standard per i sistemi di archiviazione digitale a lungo termine. Esso definisce concetti e requisiti generali per garantire la conservazione e l’accesso nel tempo di oggetti digitali, ma non impone una specifica implementazione tecnica. ​PREMIS (Preservation Metadata: Implementation Strategies), invece, è uno standard per i metadati di conservazione: la versione 3.0 (rilasciata nel 2015) fornisce un dizionario di dati dettagliato per descrivere tutte le informazioni necessarie a preservare un oggetto digitale nel tempo​. In termini semplici, OAIS offre un quadro concettuale su cosa va gestito in un archivio digitale (pacchetti informativi, informazioni su contenuto, provenienza, ecc.), mentre PREMIS offre uno schema implementabile per come registrare nel dettaglio quelle informazioni di preservazione. Di seguito analizziamo in profondità le correlazioni tra i due modelli, identificando le aree concettuali comuni, il modo in cui PREMIS 3.0 supporta i requisiti fondamentali di OAIS (gestione delle informazioni, autenticità, conservazione e tracciamento delle trasformazioni), e presentando esempi pratici di integrazione in sistemi di conservazione digitale. L’analisi è supportata da riferimenti a standard, documentazione tecnica e casi di studio.

Aree concettuali comuni tra OAIS e PREMIS

Struttura informativa e metadati di conservazione. Il modello OAIS definisce una Information Model in cui ogni Pacchetto Informativo (SIP, AIP, DIP) è composto da: Content Information (il contenuto digitale vero e proprio insieme alle Representation Information, cioè le informazioni necessarie per interpretarlo) e Preservation Description Information (PDI), ossia le informazioni necessarie a preservare il contenuto (tra cui provenienza, contesto, identificatori, elementi di autenticazione come checksum, ecc.)​

In modo analogo, il modello di dati di PREMIS prevede di descrivere un oggetto digitale attraverso entità chiave: Object (l’oggetto digitale in sé, in vari livelli: file, bitstream, rappresentazione, entità intellettuale), Event (eventi che registrano azioni compiute sull’oggetto), Agent (soggetti o software che effettuano le azioni) e Rights (diritti e permessi legati all’oggetto)​. Queste entità coprono in gran parte le stesse categorie informative di OAIS: ad esempio, gli Object di PREMIS includono identificatori unici, caratteristiche tecniche (es. formato) e valori di fissità (checksum) – corrispondenti alle informazioni sul contenuto e ai dati di autenticazione richiesti da OAIS​. Gli Event PREMIS documentano la storia e le trasformazioni subite dall’oggetto (provenienza), soddisfacendo il bisogno di informazioni di provenienza e contesto previsto da OAIS. Gli Agent e i Rights forniscono rispettivamente il contesto di chi ha compiuto un’azione e con quali diritti, elementi che si riallacciano alle Context Information e alle policy di gestione previste in un archivio OAIS.

Allineamento concettuale e differenze terminologiche

Non sorprende che vi sia una forte sovrapposizione concettuale: PREMIS è nato proprio per implementare in pratica le idee di metadati di “preservazione” delineate da OAIS.

Il rapporto del 2002 dell’OCLC/RLG Preservation Metadata Framework ha elaborato una mappatura dettagliata dei metadati di pconservazione sul modello OAIS, e il successivo Data Dictionary PREMIS è essenzialmente la traduzione di quel framework in unità semantiche implementabili​. Di conseguenza, PREMIS e OAIS condividono gli stessi obiettivi (assicurare vitalità, intelligibilità, autenticità e reperibilità degli oggetti digitali a lungo termine) e molte categorie informative comuni. Ad esempio, OAIS richiede di conservare Provenance Information (la storia dell’oggetto): PREMIS la realizza tramite i suoi Event (che registrano azioni come ingest, migrazioni, controlli di integrità ecc.) legati ad Agent (chi/che cosa effettua l’azione)​. OAIS prevede di conservare Fixity Information (es. impronte per controllare l’integrità): PREMIS include negli Object uno o più checksum e relative date/algoritmi per garantire l’integrità (fixity) nel tempo. OAIS richiede Identifying Information (identificatori unici): PREMIS implementa campi espliciti per identificatori di oggetto, di evento, di agente, assicurando riferimenti incrociati chiari. OAIS parla di Context Information (relazioni con oggetti collegati o con la collezione): PREMIS consente di registrare relazioni fra entità (ad es. un file derivato da un altro, un oggetto facente parte di una rappresentazione più ampia o di un’entità intellettuale), soddisfacendo il concetto di contesto​.

Va notato che OAIS è un modello concettuale, mentre PREMIS è un vocabolario di metadati implementativo. Di conseguenza, a volte usano terminologie differenti o livelli di astrazione diversi. Ad esempio, OAIS include tra le Content Information le Representation Information, ovvero le informazioni necessarie a interpretare correttamente i bit di un oggetto (come specifiche di formato, software, algoritmi)​. Nelle prime versioni di PREMIS queste informazioni di interpretazione non erano completamente modellate (si assumeva di gestirle con metadati tecnici esterni o descrizioni ad hoc), mentre PREMIS 3.0 ha introdotto miglioramenti proprio per descrivere l’ambiente software/hardware necessario a rendere fruibile un oggetto digitale​. In PREMIS 3.0 l’Environment viene rappresentato usando l’entità Object (o anche come Intellectual Entity aggregata), con apposite unità semantiche per descriverne funzioni e configurazioni, e la possibilità di collegarsi a registri esterni (es. identificativo in registri di formati/software)​. In questo modo PREMIS copre meglio l’area delle Representation Information di OAIS, permettendo ad esempio di conservare la descrizione di un software emulatore o di un hardware particolare come parte del pacchetto informativo di conservazione.

Allo stesso modo, PREMIS ha esteso il modello per includere oggetti fisici correlati (es. supporti analogici conservati insieme ai file digitali)​, mentre OAIS tradizionalmente era focalizzato su oggetti digitali ma riconosceva la presenza di oggetti non digitali con metadati di supporto. D’altro canto, OAIS contempla esplicitamente categorie come le Packaging Information (informazioni che legano tra loro le componenti del pacchetto, ad es. struttura di archiviazione) e le Descriptive Information (metadati descrittivi per il reperimento e la comprensione intellettuale dell’oggetto), che esulano dallo scopo di PREMIS. Quest’ultimo infatti non gestisce la “confezione” del pacchetto né i metadati descrittivi bibliografici: tali aspetti vengono demandati ad altri standard o componenti (ad esempio METS per la struttura del pacchetto, Dublin Core/MODS/EAD per i metadati descrittivi, ecc.). In sintesi, OAIS e PREMIS risultano fortemente complementari: OAIS delinea cosa deve fare un sistema di conservazione e quali tipi di informazioni deve raccogliere, mentre PREMIS fornisce uno schema dettagliato per rappresentare (quasi) tutte quelle informazioni di “conservazione” in modo coerent. Dove OAIS rimane generale, PREMIS scende nello specifico (ad esempio distinguendo diversi tipi di eventi, diversi ruoli di agente, dettagli tecnici di formato, ecc.), colmando il divario tra concetto e implementazione​. Viceversa, laddove OAIS prevede componenti fuori dall’ambito di PREMIS (packaging, metadati descrittivi, politiche organizzative), si farà uso di altri standard o convenzioni operative. Nel complesso, entrambi gli approcci costituiscono parti di un ecosistema integrato di conservazione digitale: OAIS come cornice di alto livello, PREMIS come uno dei pilastri per i metadati a supporto della conservazione.

Come PREMIS 3.0 supporta i requisiti fondamentali dell’OAIS

Di seguito vediamo nel dettaglio in che modo PREMIS 3.0 può essere utilizzato per soddisfare i principali requisiti dell’OAIS in un sistema di conservazione digitale, con particolare attenzione a: gestione delle informazioni, garanzia di autenticità, cpnsservazione a lungo termine e documentazione delle trasformazioni nel tempo.

Gestione delle informazioni e metadati nel sistema

Un archivio conforme a OAIS deve saper gestire tutte le informazioni relative agli oggetti digitali conservati, incluse sia le componenti informative (i bit e i metadati) sia le procedure per organizzarle e renderle ricercabili. PREMIS aiuta a realizzare questo requisito fornendo uno schema coerente per organizzare i metadati di conservazione all’interno del sistema. Utilizzando PREMIS, ogni oggetto archiviato (ad esempio un file) è descritto da metadati standardizzati che ne coprono tutti gli aspetti essenziali: identificazione, caratteristiche tecniche, stato di conservazione, storia delle modifiche, vincoli di accesso, ecc. Ciò significa che il Data Management di un sistema OAIS può fare affidamento su record PREMIS per popolare il proprio database o catalogo interno degli oggetti digitali. Ad esempio, ogni AIP potrebbe includere un file XML PREMIS (o record in un database) contenente i metadati dell’oggetto: da questi, il sistema può estrarre l’identificatore univoco, il titolo o nome del file, il formato (es. PDF/A, TIFF), le dimensioni, ecc., informazioni utili per l’inventario e la gestione tecnica. Inoltre, PREMIS incoraggia l’uso di vocabolari controllati (thesaurus) e valori normalizzati (ad es. tipi di eventi predefiniti, ruoli, formati), il che facilita l’interoperabilità e le query automatizzate sui metadati​. Ad esempio, si possono interrogare tutti gli Event per trovare quando è stato eseguito l’ultimo controllo d’integrità su un certo oggetto, oppure elencare tutti gli oggetti in formato image/tiff per pianificare una migrazione di formato: operazioni rese possibili dalla struttura uniforme di PREMIS.

Un altro aspetto chiave è la capacità di mantenere la tracciabilità e le relazioni tra informazioni. OAIS sottolinea l’importanza di sapere dove si trovano i dati, come sono collegati tra loro e come trovarli. PREMIS supporta questo attraverso identificatori e relazioni: ad ogni entità (oggetto, evento, agente) viene assegnato un identificatore univoco, e si possono stabilire riferimenti incrociati (es. un evento conserva l’ID dell’oggetto a cui si riferisce, un file può avere relazioni tipo “è parte di” una certa rappresentazione o “deriva da” un altro file precedente)​. Questi legami espliciti assicurano che, pur con il passare del tempo e l’accumularsi di operazioni, il sistema possa sempre ricostruire il contesto di ogni oggetto digitale (quale sia la sua versione più recente, da quale originale è stato tratto, quali componenti lo costituiscono, ecc.) come richiesto dal concetto di context information dell’OAIS​.

Quindi, l’adozione di PREMIS fornisce al sistema OAIS uno schema concreto per raccogliere, mantenere e utilizzare i metadati di conservazione, garantendo che la gestione delle informazioni avvenga in modo consistente e verificabile.

Vale la pena menzionare che PREMIS è indipendente dalla piattaforma e dalle tecnologie specifiche: può essere implementato via XML, JSON, database relazionali, ecc., in base alle esigenze. Questa flessibilità tecnica (neutralità rispetto a formato e architettura) è allineata ai principi OAIS, che non prescrivono soluzioni software ma richiedono che le funzioni (ingest, archiviazione, gestione dati, ecc.) vengano svolte​. Dunque un repository OAIS può usare PREMIS come base per il proprio schema di metadati interno, sapendo di soddisfare i requisiti informativi del modello di riferimento e al contempo di poter condividere/scambiare quei metadati con altre istituzioni in forma standard.