BUSCADORES AVANZADOS
Las múltiples facetas de la búsqueda
Encontrar información relevante en la web o en bases de datos es una tarea que, por más que esté trivializada por el uso generalizado de los buscadores en Internet, sigue planteando retos de difícil solución para las organizaciones. Daedalus ofrece soluciones especializadas que abordan muchos de esos problemas desde una perspectiva integradora, montando esas soluciones sobre las plataformas utilizadas por nuestros clientes o desplegadas al efecto por Daedalus.
Algunos escenarios habituales de nuestros clientes son los siguientes. ¿Se ve reflejado en ellos?
Escenario 1. Búsqueda aproximada
CLIENTE— La información está en mis bases de datos o en mi sistema de gestión documental. Sin embargo, no se localiza por diferencias menores entre los contenidos buscados y las expresiones de búsqueda que se introducen en la caja de entrada de texto del buscador.
Daedalus— Los usuarios pueden cometer errores ortotipográficos al plantear sus búsquedas, y sus expresiones pueden diferir en algunos caracteres de los contenidos (también sujetos a errores y variabilidades) utilizados en los documentos o bases de datos. Es necesario emplear técnicas de reconocimiento borroso (fuzzy) para encontrar los textos relevantes. Es la funcionalidad típica del “Usted quiso decir…” de los buscadores en Internet.
Escenario 2. Búsqueda multilingüe
CLIENTE— Tengo documentos en varios idiomas y deseo poder localizarlos haciendo consultas en una sola lengua, cosa imposible con mi sistema actual.
Daedalus— Es habitual que en las organizaciones se manejen documentos en diversas lenguas (por ejemplo, en las lenguas cooficiales del estado en España, en inglés o en otras). La mejor opción pasa por incorporar sistemas que traduzcan una consulta expresada en castellano a las demás lenguas, con el fin de localizar cualquier documento relevante, con independencia del idioma utilizado.
Escenario 3. Búsqueda multimedia
CLIENTE— Tengo contenidos en diversos formatos, incluso archivos de audio y vídeo. Estos últimos solo pueden ser encontrados a través de los títulos y etiquetas incorporadas en los descriptores estándar. Me gustaría poder localizar cualquier término (organización, localidad, concepto, etc.) que sea mencionado en el audio. ¿Es posible?
Daedalus— Por supuesto, es posible procesar los archivos multimedia para obtener una transcripción de la banda de audio que sirva para encontrar esos términos. El reconocimiento de habla independiente del locutor tiene una precisión suficiente para incorporar esta tecnología en aplicaciones de búsqueda.
Escenario 4. Búsqueda semántica
CLIENTE— Me gustaría poder localizar referencias a conceptos de mi interés y moverme por los contenidos en función de las relaciones entre esos conceptos.
Daedalus— Usted necesita un sistema que realice un análisis semántico de los contenidos. Para ello se necesitan dos elementos: 1) un modelo de esos conceptos y sus relaciones mutuas, lo que se denomina una ontología, y 2) una herramienta que analice lingüísticamente textos llegando al nivel semántico, a fin de localizar esos conceptos relevantes para su organización. Daedalus adapta o desarrolla ontologías a medida, y dispone de estas herramientas de análisis.
Escenario 5. Escasa precisión de los resultados de búsqueda
CLIENTE— En ocasiones, mi buscador devuelve resultados aparentemente incorrectos.
Daedalus— Los buscadores, en general, tratan de filtrar las expresiones de consulta con fines de normalización: pueden eliminar algunas palabras o quitar acentos y terminaciones. Este proceso suele estar muy simplificado, y conduce a veces a resultados antiintuitivos. Es necesario indexar los textos o las bases de datos con criterios lingüísticos especiales (refinados para la lengua en que están escritos) o en función del uso que se vaya a hacer de la búsqueda. Los buscadores habituales hacen un tratamiento muy superficial de estas cuestiones; por el contrario, Daedalus lematiza y desambigua el texto para obtener los resultados más precisos
Nuestros clientes en el ámbito de la búsqueda especializada van desde las empresas de servicios de información (Yell Publicidad, con sus Páginas Amarillas on line y el 11888), los medios de comunicación (Unidad Editorial), organismos y empresas en el sector de Defensa y hasta organismos como el Instituto Cervantes.
