Explora I+D+i UPV

Volver atrás Proyecto

CONTEXTO, MULTIMODOLIDAD Y COLABORACION DEL USUARIO EN PROCESO DE TEXTO MANUSCRITO

Centro Propio de Investigación Pattern Recognition and Human Language Technology

Compartir
Año de inicio

2016

Organismo financiador

MINISTERIO DE ECONOMIA Y COMPETITIVIDAD

Tipo de proyecto

INV. COMPETITIVA PROYECTOS

Responsable científico

Martínez Hinarejos Carlos David

Resumen

El procesado de documentos manuscritos es una tarea de amplio interés para diversos propósitos, como aquellos relacionados con la preservación del acervo cultural. Las técnicas de reconocimiento de texto manuscrito se han aplicado con éxito en la última década para obtener transcripciones de documentos manuscritos, y las técnicas de detección de palabras clave se han aplicado en la búsqueda de términos específicos en colecciones de imágenes correspondientes a textos manuscritos. Sin embargo, los resultados de transcripción e indexado están lejos de ser perfectos, aunque los modelos usados tanto para el reconocimiento de texto manuscrito como para la detección de palabras clave han experimentado una sensible evolución y los resultados actuales han mejorado ampliamente con respecto a los obtenidos con las propuestas iniciales. En este marco, el uso de nuevas fuentes de datos surge como el nuevo paradigma que debería permitir una mejor transcripción e indexado de documentos manuscritos. Existen tres fuentes principales de datos distintas a considerar: contexto del documento (estilo, escritor, época histórica, temáticas, ...), datos multimodales (representaciones del documento en una modalidad distinta, como la señal de audio de un dictado del texto), y la realimentación del usuario (correcciones, enmiendas, ...). El proyecto CoMUN-HaT se orienta a la integración de estas fuentes de datos en las tareas de transcripción e indexado para documentos manuscritos. El proyecto estudiará el uso del contexto derivado del aná¡lisis de los documentos con el fin de mejorar los resultados de reconocimiento, que podrán ser usados para transcripción e indexado. Además, explorará cómo la multimodalidad puede ayudar en el proceso de reconocimiento parra obtener transcripciones más precisas. Además, en el caso de documentos antiguos puede ser interesante obtener una transcripción automática en una versión moderna del idioma, o incluso en otro idioma. Así, el objetivo final será la inclusión de contexto, multimodalidad y modernización en un marco de transcripción de texto asistido con implicación del usuario, incorporando capacidades como la contextualización de documentos, entrada multimodal, traducción de términos y realimentación del usuario. Todo ello se reflejará en la construcción de una plataforma de transcripción e indexado usable tanto por profesionales como por no profesionales, pudiendo contribuir en actividades colaborativas de preservación de la herencia cultural y de obtención de versiones accesibles de los corpus involucrados. Finalmente, el acceso a los datos generados podrá realizarse tanto por profesionales de un área específica como por no profesionales con distintos intereses.