Explora I+D+i UPV

Volver atrás Patentes

Software para la indexación para búsqueda de información en documentos manuscritos

Centro Propio de Investigación Pattern Recognition and Human Language Technology

Compartir
Bibliotecas digitales de todo el mundo están digitalizando grandes cantidades de documentos manuscritos antiguos para facilitar su acceso al público en general. Están siendo publicados en forma de imágenes en bibliotecas digitales de todo el mundo. Gran parte de estos documentos no están transcritos o lo están parcialmente. Para permitir el acceso rápido a la información contenida en todo este material, se requieren sistemas de recuperación de información, entre los que podemos encontrar los sistemas de detección de palabras aisladas (key word spotting, KWS). La función de un sistema KWS consiste en detectar todas las ocurrencias de una palabra dada en un documento o colección de documentos con una determinada fiabilidad. De acuerdo al tipo de consulta, los sistemas de KWS pueden clasificarse en: Query-by-example (QBE) y Query-by-string (QBS). Mediante la aproximación QBE, el usuario selecciona una o varias imágenes de la palabra a buscar y el sistema KWS devuelve todas las posiciones de imágenes de palabras con una forma similar a la buscada. Por otra parte, con la aproximación QBS, el usuario introduce la palabra a buscar directamente mediante el teclado y el sistema KWS recupera todas las posiciones en la imagen en las que esta palabra aparece. Otra taxonomía que se encuentra en la literatura para KWS es aquella que considera los sistemas que utilizan una estructura auxiliar previamente construida (tablas de índices), sobre la cual se realiza a posteriori la búsqueda. La aproximación de sistema KWS que ha desarrollado el grupo Pattern Recognition and Human Language Technologies (PRHLT) de la Universitat Politècnica de València, implementa el tipo de consulta QBS y está orientada a la indexación previa del documento.
Tipo de tecnología

SOFTWARE

Inventores

Toselli Alejandro Héctor, Romero Gómez Verónica, Pastor Gadea Moisés, Leiva Torres Luis Alberto, Vidal Ruiz Enrique, Sánchez Peiró Joan Andreu

Estado de protección


Texto de la patente

Responsable contacto

Toselli Alejandro Héctor

Más información

Rellena este formulario y nos pondremos en contacto contigo. Le informamos que los datos de carácter personal que Vd. facilite serán utilizados única y exclusivamente para dar respuesta a su consulta.