Aprendizaje automático (¿machine learning¿) y reconocimiento de formas (¿pattern recognition¿)

El centro de investigación ¿Pattern Recognition and Human Language Technology¿ (PRHLT) tiene un largo recorrido investigando en áreas fundamentales como son el aprendizaje automático (¿Machine Learning¿), reconocimiento de formas (¿Pattern Recognition¿) e interacción Hombre-Máquina multimodal (¿Multimodal Interaction¿). Algunos de sus miembros comenzaron sus investigaciones en estas áreas en los años 80 del siglo XX.

La aplicación de estas áreas fundamentales se traduce en proyectos de investigación y soluciones para distintas áreas de investigación aplicada, como son la traducción automática (¿Machine Translation¿), el procesamiento del lenguaje natural (¿Natural Language Processing¿), el reconocimiento automático del habla (¿Speech Processing¿), el reconocimiento de escritura manuscrita (¿Handwritten Text Recognition¿), la Biometría (¿Biometrics¿), y la visión artificial (¿Computer Vision¿), que incluye la descripción de imágenes y vídeos (¿Image and Video description¿).

Uno de los puntos fuertes del PRHLT, a nivel teórico, es el diseño de algoritmos de inferencia de gramáticas formales a partir de ejemplos para aprender automáticamente modelos estructurales. Modelos que han servido como base teórica para numerosos proyectos de I+D+i en relación a la comunicación oral hombre-máquina, aportando tanto en el campo del reconocimiento y comprensión del habla, como en el desarrollo de sistemas de diálogo. Estos modelos también han servido para el desarrollo de sistemas de transcripción de texto manuscrito, de gran utilidad en la tarea de digitalizar fondos documentales como son los archivos históricos.

Recientemente, la aparición de Big Data gracias al desarrollo tecnológico en general y de Internet en particular durante los años 90 del siglo XX y la primera década del siglo XXI, ha traído consigo la generación grandes volúmenes de datos en distintos ámbitos (redes sociales, industria, sanidad, banca, transporte, etc.).

El PRHLT aplica su experiencia en Aprendizaje Automático al análisis de datos, en particular a la Minería de Datos (¿Data Mining¿), que consiste en la extracción de conocimiento útil y comprensible, previamente desconocido, desde grandes cantidades de datos almacenados en distintos formatos. Para ello, se utilizan tecnologías de Reconocimiento de Patrones y de Procesamiento del Lenguaje Natural, entre otras.

Las capacidades del PRHLT en relación al análisis de grandes volúmenes de datos cubre desde la aplicación de transformaciones a los datos en bruto hasta la visualización de datos y resultados, pasando por el desarrollo de modelos predictivos. Los resultados del análisis de datos se aplican a la toma de decisiones en empresas, administración pública y gobiernos.

La amplia experiencia del PRHLT en las áreas de investigación fundamentales, permite llevar a cabo el análisis de grandes bases de datos, reduciendo el tiempo y costes del procesamiento de datos.

La experiencia de haber desarrollado la tecnología es lo que más diferencia al PRHLT. Cuando una empresa o institución necesita resolver un problema concreto, y las soluciones comerciales o de software libre existentes no encajan o no consiguen los resultados óptimos, la experiencia del PRHLT por haberse enfrentado a los detalles más internos de la tecnología, permite saber qué configuraciones de los modelos predictivos o descriptivos son las más adecuadas para el problema a resolver.

Quien necesita de la tecnología (empresa o institución) gana en tiempo porque no es necesario probar a ciegas todas las posibles configuraciones, el problema se aborda sabiendo qué opciones son las más prometedoras. Y también gana en que la solución desarrollada se puede adaptar al máximo al problema gracias a los desarrollos propios. Es un factor diferencial.

Responsable científico: Casacuberta Nolla Francisco
Participantes Paredes Palacios Roberto, Casacuberta Nolla Francisco, Gómez Adrian Jon Ander

Aplicaciones

  • Desarrollo de modelos predictivos para toma de decisiones en distintos dominios de aplicación, por ejemplo, predicción de consumo de energía, detección de fraude en transacciones con tarjetas de crédito y débito, reconocimiento facial.
  • Aplicaciones donde el reconocimiento de voz sea un elemento base, como sería el caso de sistemas biométricos, sistemas de diálogo, o sistemas de recuperación de información mediante consultas que el usuario realiza mediante su voz.
  • Desarrollo de sistemas de reconocimiento de patrones para ayudar en el diagnóstico médico, principalmente a partir de imágenes biomédicas, pero también en base a otras fuentes de datos.
  • Sistemas asistidos para el reconocimiento de escritura manuscrita. De ayuda a los expertos.
  • Sistemas asistidos de traducción. Realizan una primera traducción automática a revisar por expertos.

Ventajas técnicas

  • Soluciones más eficientes en tiempo y precisión obtenida.

Beneficios que aporta

  • Adaptación al problema gracias al desarrollo propio de la tecnología.
  • El conocimiento profundo de la tecnología a emplear y sus diferentes variantes permiten llegar a un grado de personalización que otros competidores del mercado no pueden aportar.

Experiencia relevante