Flussi di lavoro: dall'XML all'HTML, l'esperienza di Hachette

Copertine Hachette
In un articolo pubblicato di recente su xml.com, Dave Cramer, referente per l’editoria digitale del gruppo Hachette, ha raccontato la propria esperienza con il passaggio da un flusso di produzione basato in parte sull’XML e in parte su software di impaginazione tradizionale a un flusso di produzione basato sull’HTML
 
Da ormai sette anni Hachette produce libri sia per il digitale che per la stampa utilizzando HTML e CSS. Considerare carta stampata e digitale come due manifestazioni di uno stesso contenuto ha dato vita a un flusso allo stesso tempo più veloce, migliore e meno costoso. Ma per arrivare a questo stato delle cose il processo è stato lungo e difficile.
 
Prima di approdare ad Hachette, Cramer lavorava per una piccola azienda in Vermont, ed era abituato a un flusso produttivo basato sull’XML: a partire da un documento elaborato in Word e poi convertito in DocBook, uno schema XML utilizzato per arrivare al prodotto libro, veniva fatta una conversione XSLT e poi tutto veniva importato in InDesign. A questo punto veniva prodotto il PDF da inviare allo stampatore, e l’XML veniva esportato, riprocessato e usato come punto di partenza per la produzione dell’e-book. 
Gli svantaggi erano principalmente due: da una parte, alcune piccole modifiche fatte in InDesign per questioni grafiche relative alla stampa potevano restare nell’e-book finito (spazi, trattini, ecc.); dall’altra, con InDesign non era possibile separare forma e contenuto, quindi edizioni diverse del medesimo libro (come per esempio il cartonato e la copertina morbida per il cartaceo) richiedevano la preparazione di un InDesign diverso. 
 
Serviva qualcosa di meglio, e questo qualcosa si rivelò Dante, un’applicazione web multi formato pensata per il publishing. Scritta in Python e basata sul framework Django e con una manipolazione del contenuto basata sull’XSL, Dante introdusse tre grandi cambiamenti: l’HTML sostituì l’XML come linguaggio; i PDF vennero creati direttamente dall’HTML con gli stili CSS; la produzione, in precedenza esterna, venne internalizzata. 
Il nuovo flusso prevedeva una conversione dei manoscritti in Word in HTML utilizzando LibreOffice. Il file esportato in XHTML così ottenuto veniva poi convertito a sua volta in HTML tramite i fogli stile XSL. In questo modo si veniva a creare una sorta di collezione di HTML del testo diviso in capitoli, a cui venivano poi applicati dei tool per il design e l’editing. In questo modo, per preparare una nuova edizione digitale del libro era sufficiente modificare foglio stile e metadati invece di creare un file InDesign nuovo. 
 
Un aspetto che colpì Cramer molto positivamente fu la facilità con cui si poteva far pratica con l’HTML: erano (e sono) infatti sufficienti un editor di testo e un browser. Attualmente in Hachette viene utilizzato Prince, scritto con Mercury, per creare PDF per la stampa partendo da HTML e CSS. Oltre a implementare HTML, CSS, SVG e MathML, ci sono altri aspetti convenienti, come la possibilità di supportare font OpenType, l’algoritmo per giustificare il testo e, in generale, la qualità dell’output è piuttosto buona. 
Tutto troppo bello per essere vero? Beh, alcuni difetti permangono, come la necessità di aggiustare a mano orfani e vedove e intervenire sulla spaziatura tra parole e lettere nei paragrafi che lo richiedono usando un file CSS differente. 
 
L’accoppiata HTML + CSS, tuttavia, pur rappresentando un work in progress, resta al momento la scelta migliore, una scelta che “sposa” la filosofia del Born Digital, che implica il pensare al contenuto come a un prodotto digitale e non a una trasmigrazione dal cartaceo. In linea con questa evoluzione, si sta facendo un ulteriore passo in avanti e la filosofia del Born Digital è sempre più sopravanzata dalla filosofia del Born Accessible, che riguarda i testi digitali pensati già in modo da risultare accessibili a tutti i lettori e adattabili alle esigenze del singolo tramite l’utilizzo della taggatura semantica. 
L’articolo originale sull’esperienza di Cramer può essere consultato al seguente link: