EA-PDF: la nuova frontiera della conservazione digitale a lungo termine

EA-PDF
EA-PDF

EA-PDF: la nuova frontiera della conservazione digitale a lungo termine

Quando pensiamo alla conservazione digitale dei documenti, il formato PDF è spesso il primo che ci viene in mente. In particolare, negli ultimi anni le istituzioni archivistiche, lle biblioteche e i conservatori hanno adottato lo standard PDF/A, una versione del PDF pensata proprio per garantire che un documento rimanga leggibile e integro anche tra molti decenni. Ma il mondo del digitale evolve in fretta e, con esso, cambiano le esigenze di chi deve assicurare la memoria del nostro tempo.

È in questo scenario che nasce EA-PDF, un nuovo profilo tecnico sviluppato da un gruppo di esperti e istituzioni internazionali coordinati dalla PDF Association. EA-PDF promette di superare molti dei limiti riscontrati nel PDF/A tradizionale e si propone come formato “archival by design”: in altre parole, non semplicemente adattato all’archiviazione, ma progettato fin dall’inizio per rispondere alle esigenze della conservazione a lungo termine.

Perché il PDF/A non basta più?

PDF/A ha rappresentato per anni lo standard di riferimento per la conservazione digitale, soprattutto in ambienti istituzionali come archivi nazionali, biblioteche e musei. Tuttavia, con il passare del tempo, sono emerse alcune criticità. Ad esempio, la gestione non sempre chiara dei caratteri (font), la possibilità di incorporare oggetti o elementi multimediali difficili da gestire in futuro, o ancora ambiguità nella struttura interna che possono generare problemi di visualizzazione con alcuni software.

Un caso concreto: pensiamo a un archivista o una storica che, tra vent’anni, debba aprire una sentenza, una delibera o una memoria digitale in PDF/A e si accorga che il testo risulta illeggibile perché il font usato non è più supportato. Oppure a una situazione in cui un file, apparentemente conforme a PDF/A, contiene delle trasparenze grafiche che solo i software più recenti riescono a mostrare correttamente, lasciando chi lavora con strumenti più datati nell’impossibilità di accedere ai contenuti.

Cosa cambia con EA-PDF

Per risolvere questi e altri problemi, EA-PDF parte dalle basi già solide del PDF/A-2, ma aggiunge un ulteriore livello di rigore e chiarezza. Le regole diventano più stringenti: vengono limitate o addirittura vietate alcune funzionalità considerate rischiose per la conservazione, come l’uso di JavaScript, trasparenze complesse, o la presenza di allegati non documentati.

Uno degli elementi più innovativi di EA-PDF è la grande attenzione riservata alla struttura logica del documento, cioè al modo in cui i vari contenuti  (testo, immagini, tabelle)  sono organizzati e “taggati” all’interno del file. Questo non solo favorisce l’accessibilità, consentendo ad esempio ai lettori di schermo di interpretare meglio il documento, ma rende anche molto più semplice verificare in modo automatico la sua integrità e conformità alle regole.

In pratica, EA-PDF nasce per essere validato e controllato da macchine. Immaginiamo una biblioteca digitale che riceve ogni giorno migliaia di nuovi documenti: grazie a EA-PDF sarà possibile automatizzare la verifica della qualità, dell’accessibilità e della “leggibilità futura” dei file senza bisogno di intervento umano caso per caso.

Approfondimento tecnico: Cos’è un profilo “archival by design”?

Un profilo “archival by design” è un insieme di regole tecniche, basato su uno standard già esistente (come il PDF/A), che viene ulteriormente raffinato per garantire che ogni file creato secondo queste regole sia, da subito, adatto alla conservazione digitale. Questo significa che i documenti prodotti sono già pronti per essere archiviati a lungo termine, senza necessità di ulteriori conversioni o adattamenti. EA-PDF si propone di ridurre il rischio che, a distanza di anni, i documenti diventino illeggibili a causa di dettagli tecnici poco controllati o ambigui.
In sostanza: meno rischi di “brutte sorprese” tra dieci, venti o cinquant’anni.

Esempi pratici di problemi risolti da EA-PDF

Esempio 1: Allegati “pericolosi”
Immaginiamo una pubblica amministrazione che conserva delibere in PDF/A-3, allegando file Excel o Word “interni” ai PDF. Nel tempo, però, i formati allegati potrebbero diventare obsoleti o non più supportati, lasciando parte dell’informazione inaccessibile. EA-PDF limita la possibilità di allegare file e impone regole chiare sulla loro natura, riducendo questo rischio.

Esempio 2: Trasparenze e grafica complessa
Un documento con effetti grafici avanzati o trasparenze può apparire diversamente su viewer diversi. EA-PDF restringe (o vieta) l’uso di questi effetti, garantendo una visualizzazione uniforme nel tempo e tra diversi strumenti.

Esempio 3: Accessibilità
Documenti PDF privi di una struttura logica chiara sono poco accessibili ai lettori di schermo utilizzati da persone con disabilità visiva. Con EA-PDF la marcatura della struttura logica non è più opzionale ma diventa obbligatoria, migliorando notevolmente l’accessibilità del patrimonio digitale.

Casi d’uso reali e scenari di adozione

Alcuni archivi nazionali europei, tra cui la Biblioteca Nazionale di Norvegia e gli archivi digitali dell’Olanda, hanno già avviato sperimentazioni pilota con EA-PDF per la gestione di fondi documentali nativi digitali. Queste istituzioni hanno apprezzato la possibilità di automatizzare il controllo di qualità dei PDF prodotti da terzi (ad esempio fornitori di digitalizzazione o enti produttori) prima del loro versamento in sistemi di conservazione.

Anche nel settore delle biblioteche universitarie, l’adozione di EA-PDF viene vista come un passo avanti verso la sicurezza documentale, soprattutto per collezioni di tesi, pubblicazioni scientifiche e documentazione amministrativa che devono essere garantite nel tempo sia come leggibilità sia come integrità giuridica.

Infine, per le pubbliche amministrazioni che stanno pianificando la digitalizzazione massiva dei propri archivi cartacei (tramite certificazione di processo, allegato 3 delle Linee Guida AgID sul documento informatico), la scelta di un formato “archival by design” come EA-PDF rappresenta una misura concreta per ridurre i costi di futuri interventi correttivi o di migrazione dei dati.

Più collaborazione, più garanzie per il futuro

Non è un caso che EA-PDF sia frutto di una collaborazione internazionale: archivi nazionali, università, fornitori di software e community di esperti hanno contribuito alla sua definizione. L’obiettivo condiviso è quello di arrivare, in futuro, a una vera e propria standardizzazione ISO, ma già oggi EA-PDF rappresenta una soluzione concreta per chi vuole mettere in sicurezza documenti digitali di valore.

Anche istituzioni come la Library of Congress, una delle principali autorità mondiali in materia di conservazione digitale, stanno monitorando con attenzione lo sviluppo di EA-PDF e di altri profili nati negli ultimi anni, riconoscendo la necessità di “mettere al sicuro” la memoria digitale adottando formati chiari, controllabili e trasparenti.

Verso una conservazione più affidabile e “a prova di tempo” (future proof)

EA-PDF si pone come risposta moderna e lungimirante alle sfide della conservazione digitale. Offrendo maggiore affidabilità, validabilità e controllo rispetto ai PDF/A tradizionali, EA-PDF permette agli enti e agli archivi di affrontare con maggiore serenità il futuro della gestione documentale. Per chi lavora ogni giorno con archivi digitali, scegliere un formato “archival by design” come EA-PDF significa investire nella sicurezza, nell’accessibilità e nella continuità della memoria collettiva.

E per tutti noi, significa avere la garanzia che i documenti digitali che raccontano il nostro presente saranno ancora disponibili, leggibili e affidabili per le generazioni che verranno.

Come si può iniziare oggi a usare EA-PDF?

L’adozione di EA-PDF può iniziare già ora, anche se lo standard è ancora in fase di proposta e non è stato formalmente riconosciuto dall’ISO. La specifica EA-PDF è liberamente disponibile e può essere consultata sia dagli sviluppatori che dai responsabili della conservazione (scarica la specifica qui).

Alcuni fornitori di software di digitalizzazione e archiviazione stanno iniziando a integrare la verifica di conformità EA-PDF nei propri prodotti. Sono disponibili anche strumenti open source e validatori online che possono essere utilizzati per testare la conformità dei propri documenti PDF alle regole EA-PDF, tra cui:

  • veraPDF (con profili estesi), utilizzabile per la validazione automatica e integrabile nei workflow di digitalizzazione.
     
  • PDF Association toolkits e script di verifica condivisi dalla comunità.
     

Chi intende sperimentare la creazione di documenti EA-PDF può partire esportando i PDF secondo il profilo PDF/A-2 (meglio se “tagged PDF”), quindi sottoporli a un controllo EA-PDF per identificare e correggere eventuali criticità secondo il nuovo profilo.

Leggibilità e Accessibilità: integrazione tra i profili EA-PDF e PDF/UA

Mentre EA-PDF nasce per garantire la massima affidabilità e validabilità dei PDF nel tempo, rispondendo alle esigenze della conservazione digitale a lungo termine e limitando tutto ciò che può minare la leggibilità futura (script, oggetti non standard, trasparenze, allegati non documentati), PDF/UA (ISO 14289) si concentra sull’accessibilità, ovvero sull’assicurare che i documenti siano pienamente fruibili da tutti, compresi gli utenti con disabilità, grazie a una struttura logica ben marcata e a metadati accessibili ai lettori di schermo.

EA-PDF, infatti, incoraggia (e talvolta richiede) la presenza di “tag” semantici che sono alla base della conformità PDF/UA. Un documento conforme sia a EA-PDF che a PDF/UA offre dunque i massimi livelli di garanzia: è conservabile a lungo termine e, al tempo stesso, pienamente accessibile. In sintesi, adottare le migliori pratiche di entrambi i profili significa produrre PDF realmente “a prova di tempo” e “a misura di persona”.

Bibliografia e riferimenti essenziali

 

  • ISO 14289-2:2024: Document management applications — Electronic document file format enhancement for accessibility. Part 2: Use of ISO 32000-2 (PDF/UA-2)
     
  • Library of Congress – “More formats and more about formats,” The Signal, blog ufficiale, giugno 2024 (link).
     
  • Bär, N., et al. “PDF/A-4: The Next Generation for PDF/A.” In: IS&T Archiving Conference 2021, pp. 100-104.
     
  • ISO 19005-2:2011 – Document management – Electronic document file format for long-term preservation – Part 2: Use of ISO 32000-1 (PDF/A-2).
     
  • veraPDF https://www.verapdf.org/

Mini-guida pratica: come produrre e verificare un EA-PDF

1. Preparazione del documento originale

  • Prediligi file sorgente ben strutturati (DOCX, ODT, XLSX, HTML). Se stai digitalizzando cartaceo, usa software OCR di qualità per testi “riconoscibili”.
     
  • Verifica che il documento sia già “taggato” (strutturato logicamente) per l’accessibilità, specialmente se destinato ad archivi pubblici o a persone con disabilità.
     

2. Esportazione in PDF/A-2 (base per EA-PDF)

  • Utilizza software di creazione PDF che supportino pienamente il profilo PDF/A-2b o, meglio ancora, PDF/A-2u/tagged PDF (LibreOffice, Adobe Acrobat Pro, PDF-XChange, ecc.).
     
  • Imposta le opzioni affinché tutti i font siano incorporati e le immagini non siano compresse eccessivamente.
     
  • Escludi, se possibile, macro, JavaScript e allegati non standard.
     

3. Applicazione dei requisiti EA-PDF

  • Seleziona il profilo EA-PDF all’interno del software (ove disponibile) oppure segui la checklist ufficiale EA-PDF che specifica i limiti aggiuntivi rispetto a PDF/A-2.
     
  • Assicurati che il documento abbia una struttura logica marcata (“tagged PDF”).
     
  • Non inserire oggetti non standard, script, trasparenze avanzate, audio/video o allegati non permessi.
     

4. Validazione automatica

  • Utilizza strumenti di validazione come veraPDF con profili estesi per EA-PDF.
     
  • Carica il documento e verifica che sia segnalato come conforme a PDF/A-2 e ai requisiti EA-PDF.
     
  • In caso di errori, correggi e ripeti la validazione fino all’esito positivo.
     

5. Deposito e conservazione

  • Archivia il file EA-PDF nei sistemi di conservazione, assicurandoti che sia accompagnato dai metadati di gestione (es. data, autore, origine, identificatori univoci).
     
  • Per documenti critici, conserva anche il file sorgente originale e una copia del rapporto di validazione.
     
 

❓ FAQ – Domande frequenti su EA-PDF

Cos’è EA-PDF, in parole semplici?
 È un profilo speciale del formato PDF, nato per garantire che i documenti digitali restino accessibili, leggibili e validabili anche tra molti decenni, senza rischi di incompatibilità o sorprese tecniche.

Posso convertire qualsiasi PDF in EA-PDF?
 No. Solo i PDF che rispettano precise regole tecniche (ad esempio: font incorporati, nessun JavaScript, struttura logica definita) possono essere dichiarati conformi a EA-PDF. Di solito serve partire da documenti ben fatti o esportare da software aggiornati.

Qual è la differenza tra EA-PDF e PDF/A?
 PDF/A è uno standard ISO ampio; EA-PDF ne rappresenta una “versione ancora più restrittiva”, creata per ridurre ogni ambiguità e rendere i PDF davvero “archival by design”.

Posso usare EA-PDF per conservare le email?
 Sì, purché la conversione rispetti tutte le regole del profilo e gli allegati siano normalizzati o convertiti anch’essi. Tuttavia, per valore probatorio, può essere necessario conservare anche l’originale della mail (in formato EML/MSG).

Quali software supportano EA-PDF?
 I principali strumenti sono:

  • Software di authoring (LibreOffice, Adobe Acrobat Pro, alcuni strumenti open source con plugin).
     
  • Validator come veraPDF (con profilo EA-PDF aggiuntivo).
     
  • Alcuni workflow documentali personalizzati già integrano controlli EA-PDF nei processi di archiviazione.
     

EA-PDF è già uno standard ISO?
 Non ancora, ma è pubblicato come specifica comunitaria e punta a diventare uno standard internazionale grazie all’adozione crescente nelle istituzioni.

Come verifico se un PDF è conforme a EA-PDF?
Scarica e usa veraPDF o strumenti analoghi, selezionando il profilo EA-PDF. Il validatore ti segnalerà eventuali non conformità tecniche da correggere.

Quanto costa adottare EA-PDF?
Molti strumenti di produzione e validazione sono gratuiti o open source. I costi principali sono organizzativi: formazione interna, adeguamento dei workflow, eventuale aggiornamento dei software.