Presto o tardi, la maggior parte delle aziende incontra la necessità di implementare un sistema di workflow per i documenti digitali. In questo caso, uno degli aspetti più importanti è relativo alla scelta del formato in cui inserire i documenti, archiviarli e inviarli ad altre aziende oppure a filiali lontane. Qui esaminiamo il confronto tra due formati: PDF e DjVu.
Qualche parola sul DjVu
La storia del DjVu ha inizio nel 1996. All'epoca, una divisione di AT&T incominciò a lavorare alla creazione di un nuovo formato. L'obiettivo principale degli sviluppatori era la creazione di una tecnologia per archiviare e inviare i documenti scannerizzati, ovvero tutti i documenti in forma elettronica. All'epoca, ben poche persone erano tuttavia in grado di prevedere che in futuro le aziende si sarebbero scambiate contratti e documenti attraverso una rete globale. Di conseguenza, con documenti ci si riferiva a documentazione tecnica, libri, riviste e giornali scannerizzati. Nel 1998 comparvero i primi plug-in per visualizzare i documenti DjVu nei browser.
Nel 1999 venne pubblicata una nuova versione del formato DjVu. Venne aggiunta la caratteristica di unire più immagini in un singolo file con la possibilità di sfogliare le pagine, insieme alla capacità di aggiungere i cosiddetti “hot spot”, simili a collegamenti ipertestuali. L'anno successivo comparve la terza versione del formato DjVu. Più o meno nello stesso periodo, AT&T cedette questa innovazione a LizardTech, che iniziò a utilizzarla nei propri prodotti commerciali. Il formato continuò tuttavia a restare un formato di file 'free'. Di conseguenza, oggi sono disponibili molti prodotti software 'free' per lavorare con il formato DjVu.
Di per sé,
il formato DjVu è una soluzione molto interessante, che si presenta come una tecnologia di compressione delle immagini con perdite. Fondamentalmente, suddivide un documento in tre livelli: sfondo, primo piano e una maschera in bianco e nero. Ognuno di questi livelli viene elaborato in un modo specifico. Viene inoltre utilizzata un'intera gamma di tecnologie differenti: un algoritmo per separare il testo dallo sfondo nelle immagini scannerizzate, l'algoritmo di compressione IW44 basato su wavelet, l'algoritmo JB2 per la compressione delle immagini in bianco e nero, l'algoritmo di compressione universale ZP e un algoritmo per lo scompattamento su richiesta. Questo approccio consente di ottenere il massimo livello di compressione con la minima distorsione. Una pagina di libro scannerizzata in formato DjVu occupa soltanto 10-25 kilobyte.
Qualche parola sul PDF
Il pubblico sentì parlare per la prima volta del PDF (Portable Document Format) nel 1991. In quell'anno, Adobe Systems lo annunciò come una nuova tecnologia per presentare in forma elettronica qualsiasi prodotto stampabile. Questo nuovo formato incontrò un grande successo. Già l'anno seguente, il formato PDF fu premiato alla prestigiosa manifestazione internazionale Comdex Fall. Adobe Systems dedicò molta attenzione allo sviluppo della sua invenzione. Nel 1994 comparve il formato PDF versione 1.1, in cui vennero aggiunti il supporto di link esterni, colori indipendenti dal dispositivo, thread degli articoli, commenti e alcune caratteristiche correlate alla sicurezza. La versione successiva del formato comparve nel 1996. In questa occasione vennero implementati il supporto per le specifiche OPI 1.3 e lo spazio di colori CYMK.
Il formato PDF 1.3 venne rilasciato nel 1999. Differiva dalla versione precedente per il supporto dei font CID a 2 byte, specifiche OPI 2.0 e la presenza di una tecnologia che consentiva sfumature e gradienti omogenei. La versione successiva del formato venne pubblicata nel 2001. In questa versione furono introdotte alcune caratteristiche importanti, come il supporto per le trasparenze, la crittografia a 128 bit e la possibilità di impostare la qualità di stampa. Infine, la versione attuale più recente del formato PDF è la 1.7, comparsa nel 2006.
La principale caratteristica differenziante del formato PDF è la sua ampia diffusione. Oggi molti manuali, pubblicazioni periodiche, documentazione tecnica e altre forme di documenti vengono presentati esattamente in questo formato. Inoltre, praticamente in tutti i computer è installato un software per visualizzare i documenti in formato PDF.
Formati DjVu e PDF: vari tipi di utilizzo
Se si intende usare il formato DjVu o PDF per organizzare un sistema di workflow dei documenti digitali, è opportuno prestare attenzione alle particolarità di ognuno di questi formati, descritte qui di seguito. Il vantaggio principale offerto dal formato DjVu sono le dimensioni ridotte dei file. Ciò è particolarmente utile quando si lavora con documenti che contengono molti elementi indecifrabili: immagini, progetti e formule. Inoltre, il DjVu funziona a meraviglia nelle situazioni in cui è necessario inviare non soltanto il testo, ma anche le sue impostazioni: colori e schemi dell'originale, oltre ai difetti esistenti e alle tracce lasciate da altri oggetti. Di conseguenza, il DjVu è un formato ottimale per l'archiviazione di documentazione tecnica come istruzioni e manuali, ma anche di documenti storici o semplicemente rari. Attualmente, sulla rete globale è disponibile un'ampia libreria di ogni possibile tipo di letteratura registrata in questo formato.
Bisogna tuttavia tenere conto del fatto che, ogni volta che si parla di file in formato DjVu, si allude a documenti scannerizzati che esistono effettivamente sulla carta o su un altro supporto. La situazione non è così semplice. Questo formato è stato creato originariamente per l'archiviazione delle copie scannerizzate dei documenti. Oggi tuttavia non esiste virtualmente nessuno strumento per creare i file DjVu, così come non c'è nessuna necessità di crearli.
L'uso del formato DjVu per i sistemi di workflow dei documenti digitali è accompagnato da molti svantaggi. Per prima cosa, comprime i dati con perdite. Questo non è un aspetto molto positivo quando si parla di contratti, atti e altri documenti legali. Secondariamente, la scarsa diffusione del DjVu impedisce alle aziende di usarlo liberamente per scambiare informazioni con partner e clienti. Nella maggior parte dei computer domestici e aziendali, il software per visualizzare questi documenti elettronici non è semplicemente presente. Terzo, questo formato è completamente privo di strumenti per garantire la sicurezza e riservatezza dei documenti.
Il PDF è più adatto all'organizzazione dei sistemi di workflow dei documenti digitali. L'aspetto più importante è l'ampia diffusione del PDF. Come abbiamo già accennato, praticamente tutti i personal computer, indipendentemente dal sistema operativo utilizzato, hanno installato un software che consente non solo di leggere i documenti PDF, ma anche di "materializzarli" su qualsiasi dispositivo di stampa. Non solo, ma anche nella stessa forma esatta in cui sono stati creati. In questo si elimina il problema della compatibilità - uno dei problemi più gravi nell'organizzazione di un sistema di workflow dei documenti digitali.
Il secondo vantaggio offerto dal formato PDF è rappresentato dalla sua difesa integrata dall'accesso non autorizzato. Grazie a questo aiuto, l'utente può proteggere qualsiasi documento dall'uso o visualizzazione da parte di altre persone. Come strumento di protezione viene usata la tecnologia crittografica, collaudata più volte dagli sviluppatori del software e da esperti di sicurezza delle informazioni.
Infine, il terzo vantaggio del PDF è la standardizzazione ISO (International Organization for Standardization). Attualmente, questo formato possiede già lo status di standard per l'archiviazione dei documenti e per l'interscambio di informazioni in forma elettronica tra le aziende. Ma questo è soltanto l'inizio. Gli sviluppatori di questo formato intendono fornire le relative specifiche all'organizzazione pubblica The Association for Information and Image Management. In questo caso, è molto probabile che il PDF diventerà lo standard internazionale per i sistemi di workflow dei documenti digitali.
Quali conclusioni si possono trarre da tutto ciò?
Ne risulta che i formati DjVu e PDF non si possono considerare rivali. Poiché sono stati progettati in modo specifico per risolvere problemi diversi, non sono in concorrenza ma si complementano vicendevolmente. Come base per un sistema di workflow dei documenti digitali è ovviamente preferibile scegliere il formato PDF, che è diventato lo standard di fatto a livello mondiale. È opportuno notare che presso alcune aziende esistono già degli archivi digitali DjVu per la documentazione tecnica e di altro tipo, creati attraverso la scannerizzazione di documenti cartacei. Ciò non rappresenta tuttavia un fattore fondamentale per scegliere questo formato specifico. È preferibile costruire un sistema moderno e funzionante per il workflow dei documenti digitali e convertire semplicemente in formato PDF tutti i file DjVu già esistenti.
Come convertire i documenti da DjVu in PDF
Per implementare un sistema di workflow dei documenti digitali si usa un normale software che consente di lavorare con i file nel formato prescelto, compresi i programmi distribuiti gratuitamente. Esiste tuttavia un'operazione che questi software non sono in grado di gestire.
Questa operazione è la conversione dei documenti in PDF dal formato DjVu. Per risolvere questo problema bisogna usare del software aggiuntivo, come Universal Document Converter. Si tratta di un prodotto universale per la conversione dei documenti in vari formati, che nel nostro caso funziona perfettamente.
Il principio su cui si basa il funzionamento di Universal Document Converter è quello della stampante virtuale. Durante la procedura di installazione, nel sistema operativo viene creato un ulteriore dispositivo di stampa che risulta accessibile da qualsiasi programma. Stampando su questa stampante, l'utente ottiene il file nel formato desiderato. In pratica, questo approccio è molto più comodo. Per prima cosa velocizza il processo di conversione, praticamente senza richiedere nessun lavoro di preparazione. Secondariamente, è così facile che non richiede nessuna formazione degli utenti finali.
L'algoritmo per la conversione di un file dal formato DjVu in documento PDF con l'aiuto del programma Universal Document Converter opera come segue. Per prima cosa l'utente deve aprire il file DjVu desiderato. Questa operazione si può effettuare usando il programma Internet Explorer con uno speciale plug-in installato in precedenza. Successivamente, l'utente deve semplicemente premere il pulsante “stampa” e selezionare Universal Document Converter quale dispositivo di stampa.
Marat Davletkhanov
Per conto di fCoder Group, Inc.