RECUPERACIÓN DE INFORMACIÓN

El objetivo es localizar información en grandes colecciones de documentos en formato electrónico. Los usuarios de estos sistemas formulan consultas (búsquedas) que expresan qué contenidos desean localizar. Para ello es preciso que el sistema procese previamente la colección de documentos a fin de construir estructuras de acceso (índices) que permitan una localización rápida. Los buscadores en Internet son los sistemas de recuperación de información más populares.

Es posible distinguir distintos tipos de sistemas de recuperación de información o, lo que es lo mismo, distintos tipos de búsqueda, dependiendo del formato de los documentos con los que se trabaja, del idioma en que se encuentran o de las características de la consulta. En Daedalus distinguimos:

  • Búsqueda multimedia. Contempla búsquedas sobre vídeo, audio, imagen y/o texto. Para ello, complementando la explotación de metadatos asociados a este tipo de contenidos, se obtiene un conjunto de descriptores de alto y bajo nivel para cada formato. En ocasiones se explotan técnicas de Reconocimiento de Voz para obtener transcripciones de los contenidos de audio, y, en otras situaciones se emplean características de color, brillo, etc. En nuestra web de demostradores puede acceder a nuestro sistema de búsqueda sobre vídeos, DALI (Digital Audio Library Indexing), y también a una herramienta para localizar imágenes similares a una dada, denominado Sistema de Búsqueda de Imágenes Basada en Contenido.

  • Búsqueda multilingüe. El objetivo consiste en localizar información en un idioma partiendo de otro idioma diferente. Por ejemplo, permite localizar textos en inglés a partir de expresiones de consulta en español, o textos en español partiendo de una consulta en catalán. Si quiere verlo en funcionamiento, puede acceder al demostrador disponible en búsqueda multilingüe, en nuestro sitio de demostración. Nuestro producto STILUS Trans incorpora tecnología de traducción propia de Daedalus, utilizada por clientes como Yell Publicidad y partners como FutureSpace.

  • Búsqueda borrosa. En ocasiones las palabras empleadas en las expresiones de búsqueda contienen errores ortográficos que dan lugar a listas de resultados vacías. En estas situaciones resultaría de utilidad localizar palabras presentes en los documentos de la colección similares a la palabra de búsqueda. A este tipo de búsqueda se le denomina aproximada, difusa, borrosa o, en inglés, fuzzy. Puede probar su eficacia en nuestro demostrador búsqueda borrosa. El producto STILUS Fuzzy encapsula esta tecnología, puesta en servicio en clientes como Yell Publicidad o SGAIM.

Daedalus ha desarrollado herramientas en el ámbito de la recuperación de información entre las que nos gustaría destacar:

  • Búsqueda de imágenes basada en contenido (CBIR): Los sistemas CBIR se basan en características gráficas de las imágenes como el color, el brillo, las texturas y su distribución espacial, para reconocer patrones similares en las distintas imágenes. Mediante diferentes funciones, los sistemas CBIR extraen un gran número de características de cada imagen. Nuestra aplicación se basa en un sistema CBIR de código libre llamado FIRE - Flexible Image Retrieval Engine, con diferentes adaptaciones y mejoras propias en la extracción de características de las imágenes y las medidas de distancia, optimizando la base de datos utilizada y mejorando la calidad de los resultados obtenidos.Nuestra herramienta le permite buscar en una base de datos de imágenes de arte, de esta manera, nuestra aplicación encontrará imágenes de cuadros para que usted pueda encontrar el autor u otra información  de un cuadro con solo subir la imagen que quiera.

  • Look4leaks: Es una herramienta que le permite buscar cables de Wikileaks conforme a diversos criterios (fecha, origen de la comunicación o grado de confidencialidad) y en cinco lenguas: castellano, inglés, francés, italiano y portugués. Para ello se han empleado herramientas de traducción automática, además de componentes de identificación de entidades, búsqueda aproximada, etiquetado semántico, etc.

Le recordamos que puede acceder a nuestro sitio de demostraciones, Showroom, para conocer de primera mano más ejemplos reales de aplicación de nuestras tecnologías.

¿Desea saber más sobre los productos de Daedalus para recuperación de información?

White paper sobre Tecnologías Avanzadas de Búsqueda

Descárgalo >>

Showroom

Pruebe nuestros productos...

Showroom >>