You are on page 1of 10

Escneres "hazlo t mismo": digitalizacin de bajo costo para archivos y bibliotecas con software libre, cmaras fotogrficas y filosofa

hacker 1.

Autora: Evelin Heidel Ciudad / Pas: Capital Federal, Argentina Ttulo: estudiante de Letras y estudiante de Bibliotecologa y Cs. de la Informacin Lugar de trabajo: Facultad de Filosofa y Letras, Universidad de Buenos Aires / Fundacin Va Libre / Creative Commons Argentina Email: eheidel@vialibre.org.ar

Resumen: En la actualidad, la mayora de las bibliotecas y los archivos sienten una necesidad imperiosa de digitalizar sus acervos bibliogrficos. Sin embargo, esta tarea puede ser costosa, puede requerir una gran pericia tcnica, en ocasiones implica lidiar con grandes trabas burocrticas para la adquisicin o importacin de los equipos, y si estos llegaran a romperse, los costos de reparacin son tan altos que los programas de digitalizacin emprendidos se detienen. El modelo del escner "Do It Yourself" (hazlo t mismo) es una solucin fcil, sencilla y barata de implementar, realizada 100% con hardware y software libre, y diseada para cumplir con los estndares bibliotecarios para la digitalizacin. Actualmente se implementa en la Facultad de Filosofa y Letras (UBA) y pasar a implementarse en otras bibliotecas del pas en breve.

Palabras claves: SOFTWARE LIBRE - HARDWARE LIBRE - DIGITALIZACIN ESCNERES

1 Este trabajo est licenciado con una licencia Creative Commons Atribucin Compartir Igual 2.5, Argentina. Ver
ms en: http://creativecommons.org/licenses/by-sa/2.5/ar/

Introduccin A finales de 2010, la Subsecretaria de Bibliotecas de la Facultad de Filosofa y Letras de la Universidad de Buenos Aires, comenz a indagar opciones para la digitalizacin de los acervos bibliogrficos de la facultad. Los presupuestos para la adquisicin de un escner profesional oscilaban entre los 10.000 a 90.000 dlares, sin haber nunca un presupuesto intermedio. Ninguno de los escneres cumpla adems con una serie de requisitos necesarios para la facultad, a saber: 1. que el escner fuera slido y robusto; 2. que fuera adaptable a ms de un tipo de libro o de archivo; 3. que no daara los libros forzndolos a abrirse ms de lo necesario; 4. que fuera rpido digitalizar un libro; 5. que la digitalizacin cumpliera con estndares mnimos de calidad, tales como obtener imgenes a 300 DPI. La mayora de los escneres, adems de quedar fuera de las posibilidades de la facultad en trminos econmicos, no cumplan con al menos una de las cinco condiciones. En ocasiones, el diseo del escner exiga forzar la apertura del libro (como en el caso de los escneres planos o de los escneres orbitales con vidrio); en otros casos el sistema de toma de las imgenes tomaba demasiado tiempo, y finalmente, en otros casos, los costos de reparacin si algo se daaba ascendan a sumas en dlares que en muchos casos volveran irrecuperables las mquinas. Adems, se sumaba en este caso el problema de la cantidad de escneres. En la medida en que todos los escneres necesitan ser operados por una persona, el lmite temporal de la persona para la digitalizacin, se impone por sobre la velocidad de la toma de la imagen. De este modo, para iniciar un programa de digitalizacin, se necesita tener ms de un escner y ms de una persona para las operaciones. Al de por s ya alto costo unitario, se impona un costo an mayor si se necesitaba adquirir ms de un escner.

Fue as como, finalmente, tras haber indagado por los caminos comerciales, el blog Derecho a Leer2, integrado por el diseador grfico Juan Pablo Surez y por m, decidimos construir un escner casero utilizando cmaras compactas o de bolsillo, como solucin alternativa al problema presentado por la Subsecretaria de Bibliotecas de la Facultad de Filosofa y Letras. Los escneres DAL, que toman su nombre del acrnimo del sitio web ya mencionado, "Derecho A Leer", son escneres desarrollados con mtodos de autoconstruccin diseados por comunidades colaborativas globales de especialistas en diversos campos, tales como fotografa, digitalizacin y programacin, que por fuera de canales institucionales y a travs de Internet, ofrecen soluciones a bajo costo para la digitalizacin de acervos bibliogrficos3. El escner DAL incorpora como dispositivos de digitalizacin cmaras fotogrficas, y las coloca sobre una estructura que garantiza la preservacin del material bibliogrfico. Al contrario de los escneres comerciales tradicionales, las ventajas de un escner DAL pueden resumirse en: 1. gran capacidad de adaptacin a distintos tipos de libros y archivos; 2. bajos costos de reparacin de los materiales; 3. amplio rango de calidad, dado que la tecnologa se encuentra mayormente depositada en las cmaras; 4. desmontable y fcil de trasladar, por lo que puede ser llevado a otras instituciones u institutos de investigacin, sin necesidad de trasladar el material; 5. fcil de operar; 6. veloz.

2 http://derechoaleer.org 3Do It Yourself Book Scanner (http://www.diybookscanner.org) es una comunidad global de hackers, especializados en la construccin de escneres utilizando tcnicas, materiales y herramientas de fcil acceso, cuyo principal objetivo es colaborar con organizaciones dedicadas a preservar y dar acceso a acervos bibliogrficos.

Fotos de los escneres terminados

Ilustracin 1: Uno de los escneres actualmente en uso en la Facultad de Filosofa y Letras, UBA.

Ilustracin 2: El primer escner construido en 2011.

Desarrollo de los escneres Los componentes principales del escner DAL son: 1. estructura de madera o metal; 2. cmaras fotogrficas; 3. lmparas (iluminacin).

Estructura de madera o metal La estructura puede hacerse de mltiples materiales, aunque por razones obvias, la madera resulta el ms barato y el ms prctico. Hay otros modelos de escneres que pueden observarse en la comunidad DIY Book Scanner, algunos de ellos hechos con extrusiones de aluminio 80/20, entre otros materiales. Sin embargo, en lneas generales, la madera gana por sobre el resto de los materiales por su costo y su versatilidad. La base de la estructura posee unas guas de aluminio (vulgarmente conocidas como correderas, que se utilizan en cajones o en los portateclados), que van adheridas a los costados de la base. Sobre las guas se monta a su vez la base de la forma en V que se observa en la foto. La forma en V es donde descansa el libro durante el proceso de digitalizacin. Esta apertura, calculada en un ngulo de 30 grados, le permite al libro no forzar su apertura en exceso, y funciona con libros nuevos o de tapa blanda, e incluso con libros que estn daados o cuyas letras estn demasiado cercanas a los mrgenes del nacimiento de las hojas. La forma en V puede deslizarse hacia un costado segn el tamao del libro. De esta forma, se garantiza que cualquier libro pueda ponerse sobre la base, sin importar si el lomo es grande o pequeo, o la cantidad de pginas. Es conveniente colocar goma espuma sobre la base en V, para corregir ligeras curvaturas que puedan producirse. El libro permanece abierto y fijo en la misma posicin durante todo el proceso de digitalizacin, aunque lo hace en una posicin que puede denominarse como natural.

Sobre la forma en V, y en el nacimiento de la parte posterior de la base, van colocadas otras guas, tambin de aluminio, que sostienen dos acrlicos -tambin en forma en V- y que siguen un movimiento arriba-abajo. Los acrlicos sirven para aplanar la hoja y corregir la curvatura natural que tiene el libro cuando se encuentra abierto en una posicin no forzada. El espesor de los acrlicos permite a su vez llegar hasta los mrgenes internos cuando las letras se encuentran demasiado cercanas a ellos. A su vez, los acrlicos en V tienen un sistema de poleas para aligerar su peso, resultando de esta forma un dispositivo liviano para el operador, quien de lo contrario se vera afectado por el peso total de los acrlicos, de las guas y del aglomerado al que estn adheridos los acrlicos. Sobre los costados, van adheridos los brazos, que funcionan como sostenes de las cmaras. Los brazos pueden ser de posicin variables (movibles) o fijos, siempre y cuando respeten una distancia predeterminada de la cmara con respecto a los acrlicos. La estructura finaliza con un sostn para las lmparas, que son las que proveern de la iluminacin necesaria para obtener una imagen uniforme. Cabe destacar que este es slo un enfoque entre las mltiples formas de aproximacin que pueden hacerse al problema de la base y de la estructura. Otros enfoques contemplan la posibilidad de mover el libro en lugar de los acrlicos; hay escneres que llevan vidrio en vez de acrlico; otros ponen las luces a los costados en vez de encima de los acrlicos; en fin, pueden explorarse diferentes ideas en la comunidad de DIY Book Scanner. Por el momento, la decisin de elegir esta aproximacin es su alto nivel de estandarizacin dentro de la propia comunidad de DIY Book Scanner.

Cmaras fotogrficas En la actualidad, las cmaras fotogrficas han conseguido un desarrollo impresionante, que ha provocado que tengan cada vez mayor calidad en menor tamao.

Las mejoras en la tecnologa CCD, adems de la ampliacin de la cantidad de pxeles reales en las cmaras de buena calidad, hacen que las cmaras compactas puedan y sean, de hecho, una buena opcin para la digitalizacin de bajo costo. Actualmente, el mnimo necesario de megapxeles para la digitalizacin est en el orden de los 8 MP reales, cantidad que tiene cualquier cmara de baja gama. Se puede utilizar una sola cmara y hacer un libro en dos pasadas, o utilizar dos cmaras y hacer un libro en una sola pasada. El inconveniente de las dos pasadas es, adems del tiempo, que debe ser cuidadosamente controlado por el operador humano para no cometer errores. Las cmaras deben dispararse de manera sincronizada y consecutiva (es decir, la cantidad de imgenes pares e impares deben coincidir). Para que eso suceda pueden usarse dos mtodos de control de disparo: electrnico (va USB y software) o bien de manera mecnica. En el caso de los escneres DAL, la opcin ha sido la va electrnica. Las cmaras van conectadas a un USB hub, un dispositivo que cuenta con cuatro entrada adicionales para fichas USB. El dispositivo se conecta a su vez a un transformador de 5 volts que va conectado a una zapatilla que lo provee de energa elctrica, y a un cable con un disparador en la punta que funciona precisamente como disparador. Los cables USB van enchufados al USB Hub y a las cmaras. La desventaja de esta opcin es que deben utilizarse cmaras Canon. Sobre la tarjeta de memoria se monta un firmware llamado CHDK (Canon Hackers Development Kit), que funciona sobre la tarjeta de memoria, sin alterar el firmware original de la cmara. Se corre un pequeo script (conjunto de instrucciones) que hace que la cmara reconozca el impulso elctrico de los 5 volts que se otorgan a travs del disparador, como si efectivamente se estuviera presionando el disparador original de la cmara.

Lmparas Las lmparas son en este caso lmparas comunes, fluorescentes, de luz fra, cuyo grado de temperatura es muy bajo y que tienen una vida til de ms de 8.000 horas, y cuyo consumo elctrico es menor a los 23W. Si bien las lmparas fluorescentes no tienen un espectro tan amplio de luz como s tienen las lmparas halgenas, se opt por utilizar fluorescentes porque nunca llegan a alcanzar los niveles de temperatura que alcanzan las halgenas. Adems, las halgenas pueden daar la vista del operador de la mquina y exponerlo a quemaduras por sobreexposicin al UV de la lmpara. Tambin podran haberse utilizado lmparas dicroicas (de museo), pero su alto costo, sumado a que se necesitan mltiples lmparas (alrededor de ocho lmparas en total), con un bajo rendimiento y un alto consumo (alrededor 8 amperes), hacen que sean fcilmente descartables para este tipo de tareas.

Proceso de digitalizacin El proceso de digitalizacin est dividido en dos partes: una parte correspondiente a la toma de las imgenes, y una segunda parte correspondiente al postproceso. Brevemente, la parte correspondiente a la toma de las imgenes consiste en: 1. Se coloca el libro sobre la base en V, ajustando las planchas en V segn el tamao del lomo. 2. Se mide la distancia de las cmaras entre s y de las cmaras respecto del acrlico. Tienen que guardar una distancia proporcional e igual. 3. Se configuran los parmetros de la cmara para que estn iguales (asas, exposicin focal, apertura focal, zoom, entre otros). 4. Se conectan las cmaras al USB Hub. 5. Se activa el script. 6. Se procede a la digitalizacin del libro.

El postproceso, al igual que todo el proceso de digitalizacin, utiliza software libre. El desarrollo de software libre, adems de ser muy conveniente en cuanto a los costos, tiene una lnea poltica coincidente con la misin y los valores de la universidad 4. En este caso, el nico punto donde el software libre falla un poco respecto del software privativo es en el OCR. Brevemente, el postproceso de las imgenes contina de esta forma: 1. Se bajan las imgenes a la computadora con Gtkam (basado en gphoto). 2. Se rotan masivamente con Phatch. 3. Se renombran masivamente con Krename o similar. 4. Se procesan con ScanTailor. 5. Se les aplica OCR con el motor de Tesseract, aplicado en Ocropus, montado en gscan2pdf. El resultado es un PDF de imgenes, que pueden estar en blanco y negro, color o combinado. Una vez terminado el proceso de digitalizacin, pueden subirse a la web o al repositorio institucional de la facultad. Por supuesto, el diseo de los pasos del postproceso no es fijo ni estanco, y podra disearse de otra forma. En todo caso, lo que interesa es que todo puede realizarse con software libre y que, an ms, el software libre resulta aqu una opcin con mayor capacidad de prestacin y rendimiento que el software privativo.

Un plan de digitalizacin, para qu? Es importante destacar, a su vez, que el programa de digitalizacin en la FFyL se ha pensado como una poltica integral en relacin con la poltica general de la facultad, por lo tanto su desarrollo es mucho ms que la simple digitalizacin y contempla cuatro reas de desarrollo principales: acceso, preservacin, servicios de extensin y formacin. Es una estrategia de democratizacin de acceso al saber y al conocimiento, a la par que

El software libre, segn la Free Software Foundation, se refiere a la libertad de los usuarios respecto de la posibilidad de ejecutar, copiar, distribuir, estudiar y modificar el software, y distribuir copias de esas modificaciones.

concebida con un fuerte desarrollo de la extensin, permitiendo que otras instituciones puedan digitalizar sus acervos bibliogrficos y puedan, a su vez, apropiarse de lo realizado por la Facultad, tanto en trminos de los resultados finales como de todo el proceso de aprendizaje y experiencia que conlleva el desarrollo del programa. En este sentido, cabe aclarar tambin que los escneres DAL, si bien estn utilizndose intensivamente en Filosofa y Letras, tambin han sido solicitados por otras instituciones, entre ellas el SEDICI de la Universidad Nacional de La Plata, y se est llevando adelante un plan con la Asociacin Civil Wikimedia Argentina, consistente en la manufacturacin de escneres para su entrega en commodato en bibliotecas de universidades pblicas, instituciones culturales o de investigacin y bibliotecas populares.

Conclusin Todas las instituciones que resguardan acervos bibliogrficos necesitan digitalizar o contar con un escner que les permita digitalizar material, ya sea porque el material que tienen actualmente se encuentra deteriorado y necesitan sacarlo de circulacin; porque se cuenta con una nica copia del material; porque el material es muy valioso, de dominio pblico, y no se encuentra en ningn otro sitio; entre muchos otros factores. Una poltica de digitalizacin puede, adems, ser un gran instrumento para pensar en la extensin cultural de la biblioteca. Sin embargo, los costos actuales de los escneres comerciales son una barrera para masivizar una herramienta tecnolgica tan importante para la vida de las bibliotecas. Los escneres caseros DIY o "hazlo t mismo", pueden ser una opcin que permitan desarrollar un plan intensivo de digitalizacin a bajo costo y con gran calidad. Quedar para otra discusin la situacin actual de la legislacin de propiedad intelectual, que es un obstculo enorme para el desarrollo integral de proyectos de digitalizacin en las bibliotecas.

You might also like