Centro Propio de Investigación Pattern Recognition and Human Language Technology

Principales cifras de actividad del último año

investigadores 22
subvenciones 378.145 €
contratación 96.521 €

Principales clientes

ALCANZIA ENERGIA, MATHS FOR MORE, BBVA DATA & ANALYTICSU., CARNEGIE MELLON UNIVERSITY, PANGEANIC BI EUROPA, QIDENUS GROUP GMBH

Líneas I+D+i

  • Image Analysis. Análisis de imagen.
    Identificación de los objetos en una imagen. Se utilizan técnicas de reconocimiento de patrones estadísticos y sintácticos. Aplicaciones: OCR y análisis de documentos, diagnóstico médico, identificación biométrica, recuperación de imágenes y videos, clasificación de cromosomas, ayudas para minusválidos, control de calidad de fabricación, etc. .
  • Interacción multimodal. Interacción multimodal.
    Tecnologías para hacer frente a un cambio de paradigma reciente en el diseño de sistemas de Reconocimiento de Patrones, donde el concepto tradicional de automatización total se está cambiando a sistemas en los que el proceso de decisión está condicionado por los comentarios humanos. Los problemas y las aplicaciones consideradas en esta área incluyen: recuperación de información basada en la relevancia (imagen) y procesamiento Predictivo Interactivo para la Traducción Automática Asistida por Computadora, así como para la Transcripción Interactiva de flujos de audio de voz y documentos de imagen de texto..
  • Procesamiento de lenguaje natural. Recuperación de script y recuperación de información en varios idiomas.
    Para muchos idiomas que usan scripts indígenas no basados en Romanos (por ejemplo, árabe, griego e idiomas índicos) a menudo se puede encontrar una gran cantidad de contenido transliterado generado por el usuario en la Web en la escritura romana. El IR en dicho espacio es un desafío porque las consultas escritas en los guiones nativos o romanos deben coincidir con los documentos escritos en ambos guiones. Además, el contenido transliterado presenta amplias variaciones de ortografía. Proponemos una solución de principios para manejar la coincidencia de términos entre guiones y la variación de ortografía, donde los términos de los guiones se modelan conjuntamente en una arquitectura de aprendizaje profundo y se pueden comparar en un espacio abstracto de baja dimensionalidad..
  • Reconocimiento de texto manuscrito. Reconocimiento de texto manuscrito.
    Reconocimiento de texto escrito a mano. Los modelos ocultos de Markov se emplean en el back-end de esta tecnología después del preprocesamiento y la extracción de características de las imágenes de línea. Aplicaciones: extracción de texto legible electrónicamente a partir de documentos escritos a mano, como formularios, encuestas, documentos antiguos históricos, etc..
  • Reconocimiento de voz. Reconocimiento automático de voz.
    Las expresiones del habla se decodifican en cadenas de palabras o en cadenas de unidades semánticas. Las gramáticas de estados finitos se utilizan como base de dichos sistemas. Estas gramáticas de estado finito se aprenden automáticamente a partir de ejemplos reales de enunciados o texto. Aplicaciones: servicios de central telefónica, control de dispositivos por voz, consultas de información, etc..
  • Traducción automática. Máquina traductora.
    Las actividades del grupo de traducción automática comenzaron hace algunos años con el uso de modelos de estado finito para la traducción de voz a voz y para la traducción de texto a texto en dominios limitados. Este grupo ha desarrollado varios modelos de traducción con los algoritmos de aprendizaje correspondientes y una serie de prototipos para la traducción del habla y la traducción asistida por computadora. Actualmente, el grupo de traducción automática está dedicado al desarrollo de nuevas técnicas predictivas interactivas para la traducción asistida por computadora, técnicas para la adaptación de dominio y para representaciones de texto continuo..