Explora I+D+i UPV

Volver atrás Servicio de I+D

Los interfaces multimodales enfrentan el desafío de reconocer y procesar entradas diversas como texto escrito, voz, pulsaciones en pantalla táctil y movimientos de ratón. La dificultad radica en combinar estas entradas de manera óptima para lograr un reconocimiento preciso y mejorar la interacción del usuario con los sistemas. Sin una adecuada integración, los sistemas de traducción asistida y otras aplicaciones pueden ser ineficientes y menos intuitivos para los usuarios.

Las soluciones tradicionales suelen enfocarse en interfaces unimodales, es decir, sistemas que dependen de un único tipo de entrada, como solo texto o solo voz. Estos sistemas no explotan el potencial de combinar múltiples tipos de entradas para mejorar la precisión y la usabilidad. Además, los métodos tradicionales pueden no estar adaptados a las necesidades específicas de los usuarios, lo que puede resultar en una experiencia menos satisfactoria y una menor productividad.

Nuestra investigación y desarrollo en interfaces multimodales se centra en entornos de traducción asistida que utilizan diversas entradas, como texto, voz, y las interacciones con ratón y teclado. Al trabajar con estas combinaciones de entradas, optimizamos la precisión del reconocimiento y mejoramos la experiencia del usuario. Este enfoque se aplica a una variedad de sistemas interactivos, como ayuda a la traducción, transcripción de texto y voz, y aplicaciones avanzadas como recuperación de imágenes, diagnóstico médico y clasificación de textos.
Responsable científico

Martínez Hinarejos Carlos David

Aplicaciones

  • Sistemas interactivos de ayuda a la traducción
  • Transcripción de texto y voz
  • Recuperación de imágenes, diagnóstico médico, clasificación de textos, etc.

Ventajas técnicas

  • Mayor adaptación de la interfaz al usuario y mejor usabilidad del sistema final.

Beneficios que aporta

  • Aumento de la usabilidad de las interfaces y consiguiente aumento de la productividad de los usuarios.

Experiencia relevante

  • El grupo cuenta con experiencia en el desarrollo de prototipos multimodales de ayuda a la traducción y transcripción de voz y texto, debido a su participación en proyectos nacionales e internacionales, así como en desarrollos con empresas privadas. Se dispone de demostradores.