Sistemas de transcripción asistida para texto manuscrito

Los sistemas de Reconocimiento Óptico de Caracteres (OCR) ofrecen prestaciones pobres cuando se emplean en texto manuscrito o en fondos documentales de texto impreso con características especiales, como los archivos históricos. Dada su flexibilidad, los motores de reconocimiento capaces de aprender a partir de ejemplos constituyen una solución apropiada para transcribir textos en dominios restringidos o con características singulares. Estos motores pueden integrarse ventajosamente en sistemas interactivos de Transcripción Asistida por Computador, incluso si no alcanzan prestaciones comparables a las de sistema ROC para tipografías modernas. En este ámbito, nuestro grupo cuenta con más de 15 años de experiencia en la investigación en tecnologías del habla y escritura.

Aplicaciones

  • Integración de sistemas de interacción escrita en dispositivos.

Ventajas técnicas

  • Facilitar la accesibilidad a los servicios de información que utilicen sistemas informáticos.

Beneficios que aporta

  • Ampliar la accesibilidad de los servicios que pueda presentar una empresa y que requiera interacción con los usuarios.
  • Ampliar los fondos bibliográficos digitalizados.

Experiencia relevante

  • El grupo de investigación de Reconocimiento de Formas e Inteligencia Artificial (RFIA) cuenta con más de 15 años de experiencia en la investigación en tecnologías del habla y escritura. Desarrolla sus actividades en el Departamento de Sistemas Informáticos y Computación (DSIC) de la Universidad Politécnica de Valencia (UPV). Desde el punto de vista teórico, el trabajo del grupo se ha centrado en el desarrollo de algoritmos de inferencia de ciertos tipos de gramáticas formales a partir de ejemplos para el aprendizaje automático de modelos estructurales. Algunos resultados sobre modelos estocásticos también han sido obtenidos extendiendo los resultados anteriores. Desde el punto de vista práctico, las técnicas referidas anteriormente han sido aplicadas a la Decodificación Acústico-Fonética y al modelado del lenguaje en sistemas de Reconocimiento del Habla Continua. Recientemente, algunas de esas técnicas han sido también aplicadas con éxito al desarrollo de sistemas entrenables de Comprensión del Lenguaje y Traducción en tareas de dominio limitado.