lunedì 6 ottobre 2008

Snapter, un modo alternativo allo scanner per digitalizzare i vostri libri



Pubblico qui l’ottima recensione di Alberto Zocchi. Ricordo che fotocopiare o scannerizzare un libro è un reato ai sensi della legge n. 633 del 22 aprile 1941, modificata dal Decreto Legislativo n. 68/2003: è legittima solo la riproduzione, per uso personale, in fotocopia, xerocopia o sistema analogo come la scansione, di un'opera protetta dal diritto d'autore, nei limiti del 15 % del volume, a fronte di un compenso da devolvere all'autore e all'editore. La scansione di libri che non si possiedono è quindi reato in quanto non è possibile devolvere all’autore e all’editore i diritti che spettano loro. Se si possiede il libro, la scansione è permessa ma il documento scansito deve rimanere per uso strettamente personale e non può venir diffuso. Questo blog non si assume nessuna responsabilità su eventuli problemi legali o di qualsiasi altro tipo provocati dalla lettura e messa in atto delle informazioni di questo articolo in quanto ad ogni lettore spetta il dovere di informarsi relativamente alle normative vigenti sull’argomento e di agire secondo tali leggi.


Prendere appunti, disegnare, registrare una lezione, sottolineare e “pasticciare” un eBook: le potenzialità di un tablet sono impressionanti.
Una delle funzionalità più interessanti e che merita un approfondimento è quella di poter portarsi sempre dietro 1, 10, 100 libri contemporaneamente, senza dover tener conto dello spazio occupato (se non quello dell’hard disk). Come? Digitalizzandoli ovviamente.
Il lavoro richiede alcune ore ma con un po’ di tecnica ed utilizzando alcuni particolari programmi non sarà così dura. Cosa ne otterrete in cambio? Meno peso per le vostre spalle, i libri sempre con voi pronti per essere pasticciati (e permettendovi inoltre di ottimizzare il tempo per lo studio) e quelli originali intatti nella vostra biblioteca.
Il metodo classico per digitalizzare un libro consiste nell’utilizzo di uno scanner. Richiede parecchio tempo ma il risultato è molto buono.
Non mi addentrerò però nella descrizione perché l’oggetto della recensione è invece un programma shareware assolutamente innovativo di nome Snapter, della Atiz.

COSA VI SERVE

- Una macchina fotografica (risoluzione consigliata di almeno 5 megapixel)
- Il programma Snapter Ice (licenza in prova per 14 giorni con piene funzionalità; dopodiché si può continuare ad usarlo ma comparirà una pubblicità sul fondo della pagina. Il costo è di 49 dollari per la licenza completa).

COME FUNZIONA

La necessità che avevo era quella di digitalizzare parti di libri per la scrittura della tesi, in modo tale da avere a portata di click la bibliografia completa: la scelta è ricaduta su Snapter.
La logica di fondo è molto semplice: fare una foto alle pagine del libro anziché usare un classico scanner e poi farle processare dal programma che, grazie ad un potente algoritmo, eliminerà le imperfezioni dovute all’inclinazione della camera e all’ondulatura del libro e vi fornirà l’agognato PDF. Il tutto con un clic.
La realtà non è molto diversa dalla semplicistica descrizione e con i dovuti accorgimenti otterrete un libro in PDF di ottima fattura.

FASE 1: FOTOGRAFARE

È la fase più delicata poiché dalla qualità dell’immagine dipenderà l’esito finale.
Per scattare ad esempio le foto di 350pagine (quindi 175 scatti) ho impiegato una trentina di minuti.
Le precauzioni da prendere per ottenere un buon risultato sono le seguenti:

- Porre il libro su un piano orizzontale. Molto importante è che ci sia un elevato contrasto tra le pagine del libro e lo sfondo, in modo tale che il software ne riconosca i bordi.
- Utilizzare una camera con risoluzione di almeno 5 megapixel (soprattutto qualora vogliate effettuare il riconoscimento OCR del testo alla fine).
- Scattare le foto avendo cura di posizionarsi esattamente al di sopra del libro (tale accortezza non è richiesta qualora si stia fotografando un foglio singolo o una copertina perché in tal caso il software è in grado di eliminare l’inclinazione dell’inquadratura).
- Scattare le foto in condizioni di buona luce.
- Mantenere la macchina fotografica in posizione stabile (ancora meglio se avete un treppiedi o costruite un struttura per far star ferma la macchina fotografica – nella foto potete vedere cosa mi sono inventato) e non abbiate paura di mettere le dita per fermare le pagine, purché siano esclusivamente sui bordi laterali (verrano eliminate con il software).

La struttura artigianale che ho creato in 5 minuti per la macchina fotografica
- Salviamo le nostre foto in una cartella, possibilmente in ordine di pagina in modo tale da semplificarci il lavoro successivo.

Foto tipo di un libro da inserire poi nel programma
FASE 2: IL SOFTWARE

Questa è la schermata iniziale. Come si vede è molto semplice e chiara
- La prima cosa da fare è scegliere cosa si vuole digitalizzare. Nel caso preso in esame è un libro quindi non si dovrà far altro che cliccare l’opzione BOOK.
- Fatto questo carichiamo le foto nel programma e controlliamo che l’algoritmo tagli esattamente l’immagine nel punto voluto. Qualora l’immagine non risulti dall’anteprima perfettamente tagliata possiamo modificare i bordi spostandoli in base alle esigenze (utile per eliminare le dita). Se si vuole avere un lavoro perfetto è necessario controllare foto per foto per evitare pagine tagliate male.
Il lavoro richiesto è stato di circa 60 minuti.
- Si possono modificare alcune opzioni sia per il documento inserito che per quello ottenuto dopo l’applicazione dell’algoritmo. Particolarmente interessante sono la possibilità di separare le pagine del libro, acquisire l’immagine a colori, in bianco nero o in scala di grigi e scegliere con quale risoluzione processarla.

Caso 1: separazione delle pagine

Caso 2: pagine lasciate unite
- Ultima fase è quella del salvataggio. È possibile salvare gli output singolarmente lasciandoli nel formato originale (es. jpeg) per poi convertirli in pdf ed unirli in unico file tramite adobe acrobat oppure salvarli immediatamente con Snapter come file unico pdf.
- Qualora vogliate effettuare il riconoscimento OCR (riconoscimento ottico dei caratteri) del testo, si deve per forza usare un altro programma (Acrobat professionale, finereader ecc..). Questa funzionalità è parecchio utile per poter ricercare immediatamente tramite il comando trova (presente anche in acrobat reader) una parola o un concetto all’interno del libro.

CONSIDERAZIONI FINALI

Ad appena 3 ore dallo scaricamento del programma avevo “già” il mio primo libro digitalizzato e perfettamente leggibile. La qualità non sarà come quella di un’ebook classico ma il risultato è comunque molto buono come potete vedere.


PRO:

- Programma semplice da utilizzare.
- Digitalizzazione del libro più veloce di quella tramite scanner.
- Non richiede la presenza di uno scanner (quindi effettuabile virtualmente ovunque purchè si abbia la macchina fotografica con sè).

CONTRO:
- Il programma è gratuito solo per 14 giorni.
- Il software non è impeccabile e non sempre la conversione delle pagine è perfetta.

In conclusione consiglio caldamente di provare questo programma, specialmente qualora vogliate dimezzare i tempi di digitalizzazione senza perdere troppo in qualità.
Inoltre l’idea di digitalizzare un libro o un documento senza l’uso di uno scanner merita un plauso, anche se il software necessita ancora miglioramenti prima di poterlo definire perfetto.

5 commenti:

Koral ha detto...

ho letto questo articolo e lo trovo interessantissimo! al + presto proverò!
Avrei una domanda che forse c'entra poco..quando converto un pdf col convertitore di windows journal..i caratteri non risultano proprio come nel pdf ma + sgranati, sfuocati..come mai? sbaglio qcosa io?

Night ha detto...

Qualcuno (tu o un tuo conoscente) ha mai provato ad usare come fotocamera quella di un cellulare? Chiaramente mi riferisco a cellulari di fascia medio-alta ad esempio della serie N di nokia.

il Custode ha detto...

Per Koral: devi "stamparlo" modificando le impostazioni avanzate e dicendo di stamparlo come immagine

Ventu ha detto...

l'ho provato, ma ha molti difetti, secondo me. buono il proposito di tagliare lo sfondo, ma per il resto, come migliorare la qualità del testo scandito, raddrizzare la pagina o eseguire l'OCR trovo migliore acrobat.

Antonio Manno ha detto...

Grazie per i preziosi suggerimenti. Qual'è la risoluzione da usare per ottenere il miglior risultato che mi consenta di avere file .jpg non troppo pesanti e tali da consentirmi una conversione OCR prossima al 100%?
Un cordiale saluto
Antonio Manno