R-16021-2011 - Prototipo de Transcripción Multimodal Interactiva de Textos Manuscritos

Gran parte de la documentación utilizada hoy en día está en forma manuscrita. Por ejemplo, cheques bancarios, recetas médicas, documentos históricos y formularios manuscritos. En muchos casos sería de gran utilidad disponer de la transcripción de dichos documentos con el objetivo de proporcionar nuevas formas de indexar, consultar y trabajar con ellos. Hasta la fecha, los sistemas de reconocimiento automático de texto manuscrito están lejos de proporcionar transcripciones perfectas. Estos sistemas son de gran utilidad en tareas restringidas con vocabularios pequeños y con restricciones en el estilo de escritura. Sin embargo, en tareas reales sin ningún tipo de restricción, la tecnología actual proporciona resultados insuficientemente precisos. Por tanto, una vez los sistemas de reconocimiento han proporcionado un posible reconocimiento del documento a transcribir, el transcriptor humano debe leerlo y corregir los errores generados por el sistema. Esta solución llamada post-edición es bastante incómoda e ineficiente para el corrector humano. La transcripción asistida por computador supone un marco más cómodo y eficiente para el transcriptor humano, donde se combina la eficiencia de los sistemas de reconocimiento de texto manuscrito con la precisión de los expertos, permitiendo una transcripción perfecta de las imágenes con un coste admisible. La transcripción asistida por computador se basa en un sistema de transcripción predictiva interactiva que, a partir de una imagen de texto a transcribir, genera una o varias sugerencias como posible transcripción, que el usuario debe confirmar o corregir. De este modo, el usuario lee la sugerencia hasta que llega al punto en el que considera necesario introducir alguna corrección y la efectúa, obteniéndose así un nuevo prefijo. Como este nuevo prefijo es correcto, las nuevas sugerencias ofrecidas por el sistema se construyen a partir de él. Este proceso se repite hasta conseguir una transcripción completamente validada de la imagen de texto de entrada (un ejemplo de este proceso se puede ver en la figura 1). Por tanto, en este tipo de sistemas se incluye un proceso interactivo en el cual el usuario participa activamente. Los beneficios esperados son mayor comodidad de trabajo e incremento de productividad. Esta tecnología viene siendo desarrollada por el grupo Pattern Recognition and Human Language Technology (PRHLT) de la Universidad Politécnica de Valencia (UPV) desde hace bastante tiempo. En la actualidad, el grupo dispone de un prototipo para transcripción interactiva de texto, donde el usuario puede interactuar con el sistema, bien utilizando periféricos convencionales como el teclado y el ratón, o bien mediante un lápiz electrónico o una pantalla táctil.

Ficha técnica

Tipo de tecnología SOFTWARE
Inventores Luis Leiva Torres, Verónica Romero Gómez, Vicente Alabau Gonzalvo, Jorge Civera Saiz, Moises Pastor Gadea, Joan Andreu Sánchez Peiró, Alejandro Hector Toselli ., Enrique Vidal Ruiz