Toolkit para el preprocesamiento de imágenes para Reconocimiento de Texto Manuscrito

El proceso de reconocimiento de texto manuscrito forma parte de las iniciativas que se encargan de la preservación de patrimonio cultural resguardado en Bibliotecas y archivos donde existe una gran riqueza de documentos. Es bastante común que los documentos manuscritos, y más especialmente los documentos antiguos, sufran problemas de degradación. Además, otro tipo de dificultades que suelen aparecer en las páginas de estos documentos pueden ser, por ejemplo, diferentes tipos y tamaños de fuentes, palabras subrayadas y/o tachadas, etc. Para que el proceso de reconocimiento de documentos manuscritos sea eficiente debe estar precedido de una etapa de preprocesamiento de la imagen a tratar. Este preprocesamiento prepara la imagen a través de la aplicación de varias funcionalidades (eliminación de ruido, correccióon de la inclinación de los caracteres, etc.) para que el proceso de reconocimiento sea más sencillo y esté más libre de errores. El toolkit de preprocesamiento de imágenes desarrollado por el grupo Pattern Recognition and Human Language Technologies de la Universitat Politecnica de Valencia permite un proceso de reconocimiento posterior de textos manuscritos con menos errores.

Ficha técnica

Tipo de tecnología SOFTWARE
Inventores Verónica Romero Gómez, Alejandro Héctor Toselli , Moisés Pastor Gadea, Enrique Vidal Ruiz, Mauricio Villegas Santamaría
Responsable Pastor Gadea Moisés