El proceso de digitalización

Problemática:

  • Deterioro de la Obra. El pegamento de los libros y revistas muy antiguos cede al doblar las páginas para escanearlas.
  • Tiempo. El proceso es lento y laborioso. Existen escáneres fabricados especialmente para este propósito pero son muy costosos y si bien facilitan el trabajo, no quitan de estar en frente del escaner cambiando de páginas y vigilando que todo esté en orden.

Herramientas utilizadas:

  • Impresora multifunción(A4). No necesitamos nada mas para hacerlo, aunque un escaner mas grande (A3) nos da mas espacio para el escaneo y podremos escanear de dos en dos las páginas.
  • GNU/Linux: Utilizo este sistema operativo por su fiabilidad y sencillez de su repertorio de programas.

Si queremos no estar días delante del escaner tenemos que optimizar el tiempo de escaneado con pequeños detalles.
Podría haber usado Windows y el software de HP para escanear los documentos pero la lentitud y el peso en memoria de éste me angustiaba. En su lugar utilizo la "Utilidad de Escaneo" un software muy sencillo que nos permitirá agilizar el proceso en un 30 % dado su sencillez.

Primero echemos un vistazo a las opciones que nos da el programa al abrirlo:

La resolución de escaneo será el factor determinante en la calidad y el peso de las imágenes escaneadas. Una imagen escaneada de una revista a 600 dpi pesa ~30 Mb, mientras que una a 200 dpi pesa 3-5 Mb. Yo he elegido esta última e incluso podría haber elegido una de menor resolución. Ademas posteriormente cambiaré el formato a jpeg reduciendo un poco mas la calidad de la imagen. Podréis apreciar en las revistas que he escaneado que aún así siguen conservando una calidad aceptable. Es importante reducir el peso de todas las imágenes si no queremos encontrarnos con un archivo Pdf de 300-400 Mb. Que nos dificultará la visualización y difusión de la obra digitalizada.
En Archivo elegimos una carpeta en la que se guardarán las imágenes y un nombre de archivo que no modificaremos a lo largo de todo el proceso. Las imágenes se guardarán con nombre Diario-16-XX.jpeg donde XX será el numero de cada imagen escaneada e irá aumentando en cada página escaneada:
Diario-16.jpeg                  ------------------>           Primera imagen escaneada.
Diario-16-1.jpeg              ------------------>            Segunda imagen escaneada.
..............
.......
..Etc
Colocamos el libro o revista con mucho cuidado. Suele ser habitual, sobretodo con obras viejas, que al abrir la página y apretarla contra el escaner, para obtener una buena calidad de imagen, se despeguen o estropen algunas páginas. A cambio la tendremos digitalizada para siempre ;)
Hacemos Click en Escanear y esperamos a que el proceso termine.

Cuando se complete ya se habrá guardado la imagen en la carpeta anteriormente seleccionada. Preparamos siguiente página y hacemos Click en Adelante y asi hasta que terminemos de escanear la obra.
Como podeis ver la simplicidad de este programa es increíble y para nuestro propósito nos reduce el tiempo que tendremos que estar delante del escaner volteando el libro / revista. 
Una vez terminado abrimos un Terminal e introducimos los siguientes comandos:
cd /ruta/a/la/carpeta/destino/
En mi caso /home/joanrufe/Revistas/


En este directorio tengo guardadas todas las imagenes desde Diario-16.png hasta Diario-16-133.png
ahora ejecutamos un comando para recortar las imagenes a una resolución adecuada:
convert *.png -extent 1385x1900 *.jpg
Ahora unimos todas las imágenes en un pdf con el comando:
convert *.jpg Diario-16-Numero-1.pdf
El cual nos generará el archivo de la Obra Digitalizada Diario-16-Numero-1.pdf.

Existen otros programas que nos permiten transformar todas las imágenes en un Pdf, pero yo uso ImageMagick con el comando convert por ser liviano y simple, siguiendo la filosofía linux


Nota:También he usado un par de herramientas para mejorar la calidad de las imágenes digitalizadas y darle mas contraste.