POSTER: "Preservación del patrimonio cultural- Digitalización y reconocimiento de documentos manuscritos"

De Giusti, Marisa Raquel; Vila, María Marta; Villarreal, Gonzalo Luján

Acta Académica

| Crear un perfil | Crear un evento

Marisa De Giusti > Trabajos

POSTER: "Preservación del patrimonio cultural- Digitalización y reconocimiento de documentos manuscritos"

De Giusti, Marisa Raquel, Vila, María Marta y Villarreal, Gonzalo Luján.

IV Simposio Internacional de Bibliotecas Digitales. Consorcio Iberoamericano para Educación en CyT/ Ibero American Science and Tecnology Education Consortium (ISTEC) y Universidad de Málaga, Málaga, 2006.

Dirección estable: https://www.aacademica.org/marisa.de.giusti/79

ARK: https://n2t.net/ark:/13683/ptyc/mDk

Resumen

El proceso de reconocimiento de la escritura manuscrita forma parte de las iniciativas que propenden a la preservación de patrimonio cultural resguardado en Bibliotecas y archivos donde existe una gran riqueza de documentos y hasta fichas manuscritas que acompañan libros incunables. Este trabajo es el punto de partida de un proyecto de investigación y desarrollo orientado a la digitalización y reconocimiento de material manuscrito y la ponencia que aquí se presenta discute diferentes algoritmos utilizados en una primera etapa dedicada a "limpiar" la imagen de ruido para mejorarla antes de comenzar el reconocimiento de caracteres. Dado que PrEBi-SeDiCI forman parte integrante de redes de bibliotecas que intercambian documentos digitalizados vía scanning, el presente desarrollo ha tenido una utilización adicional relacionada al mejoramiento de las imágenes de documentos de intercambio que presentaban problemas comunes en la digitalización: bordes, impurezas, descentrado, etc.., si bien no es esta la finalidad de esta investigación no por ello resulta una utilidad menor en el marco de intercambios de consorcios de bibliotecas. Para que el proceso de digitalización y reconocimiento de textos manuscritos sea eficiente debe estar precedido de una etapa de "preprocesamiento" de la imagen a tratar que incluye umbralización, limpieza de ruido, adelgazamiento, enderezamiento de la línea base y segmentación de la imagen entre otros. Cada uno de estos pasos permitirá reducir la variabilidad nociva al momento de reconocer los textos manuscritos (ruido, niveles aleatorios de grises, inclinación de caracteres, zonas con más y menos tinta), aumentando así la probabilidad de reconocer adecuadamente los textos. En este trabajo se consideran dos métodos de adelgazamiento de imágenes, se realiza la implementación y finalmente se lleva adelante una evaluación obteniendo conclusiones relativas a la eficiencia, velocidad y requerimientos, así como también ideas para futuras implementaciones. En la primera parte del documento, se presentan algunas definiciones relacionadas con los métodos utilizados, luego se muestran los resultados obtenidos sobre un mismo conjunto de imágenes aplicando las teorías propuestas y finalmente, se exponen algunas ideas para optimizar los algoritmos elegidos.

Texto completo

Descargar PDF

Dirección externa:

http://www.uma.es/ficha.php?id=79799

Esta obra está bajo una licencia de Creative Commons.
Para ver una copia de esta licencia, visite https://creativecommons.org/licenses/by-nc-nd/4.0/deed.es.