Explora I+D+i UPV

Volver atrás Patentes

Software de Transcripción Multimodal Interactiva de Textos Manuscritos

Compartir
Gran parte de la documentación utilizada hoy en día está en forma manuscrita. Por ejemplo, cheques bancarios, recetas médicas, documentos históricos y formularios manuscritos. En muchos casos sería de gran utilidad disponer de la transcripción de dichos documentos con el objetivo de proporcionar nuevas formas de indexar, consultar y trabajar con ellos. Hasta la fecha, los sistemas de reconocimiento automático de texto manuscrito están lejos de proporcionar transcripciones perfectas. Estos sistemas son de gran utilidad en tareas restringidas con vocabularios pequeños y con restricciones en el estilo de escritura. Sin embargo, en tareas reales sin ningún tipo de restricción, la tecnología actual proporciona resultados insuficientemente precisos. Por tanto, una vez los sistemas de reconocimiento han proporcionado un posible reconocimiento del documento a transcribir, el transcriptor humano debe leerlo y corregir los errores generados por el sistema. Esta solución llamada post-edición es bastante incómoda e ineficiente para el corrector humano. La transcripción asistida por computador supone un marco más cómodo y eficiente para el transcriptor humano, donde se combina la eficiencia de los sistemas de reconocimiento de texto manuscrito con la precisión de los expertos, permitiendo una transcripción perfecta de las imágenes con un coste admisible. La transcripción asistida por computador se basa en un sistema de transcripción predictiva interactiva que, a partir de una imagen de texto a transcribir, genera una o varias sugerencias como posible transcripción, que el usuario debe confirmar o corregir. De este modo, el usuario lee la sugerencia hasta que llega al punto en el que considera necesario introducir alguna corrección y la efectúa, obteniéndose así un nuevo prefijo. Como este nuevo prefijo es correcto, las nuevas sugerencias ofrecidas por el sistema se construyen a partir de él. Este proceso se repite hasta conseguir una transcripción completamente validada de la imagen de texto de entrada (un ejemplo de este proceso se puede ver en la figura 1). Por tanto, en este tipo de sistemas se incluye un proceso interactivo en el cual el usuario participa activamente. Los beneficios esperados son mayor comodidad de trabajo e incremento de productividad. Esta tecnología viene siendo desarrollada por el grupo Pattern Recognition and Human Language Technology (PRHLT) de la Universidad Politécnica de Valencia (UPV) desde hace bastante tiempo. En la actualidad, el grupo dispone de un prototipo para transcripción interactiva de texto, donde el usuario puede interactuar con el sistema, bien utilizando periféricos convencionales como el teclado y el ratón, o bien mediante un lápiz electrónico o una pantalla táctil.
Tipo de tecnología

SOFTWARE

Inventores

Sánchez Peiró Joan Andreu, Alabau Gonzalvo Vicente, Romero Gómez Verónica, Toselli Alejandro Héctor, Pastor Gadea Moisés, Vidal Ruiz Enrique, Leiva Torres Luis Alberto, Civera Saiz Jorge

Estado de protección


Texto de la patente

Responsable contacto

Romero Gómez Verónica

Más información

Rellena este formulario y nos pondremos en contacto contigo. Le informamos que los datos de carácter personal que Vd. facilite serán utilizados única y exclusivamente para dar respuesta a su consulta.