STILUS Fuzzy
Búsqueda aproximada, borrosa o difusa
La funcionalidad de búsqueda incorporada en los sistemas de información (bases de datos, colecciones de documentos, etc.) tiene como objetivo la localización de los elementos más relevantes (parecidos) a una cierta expresión de búsqueda (introducida en el sistema por los usuarios), para lo cual ésta se compara con un índice construido a partir de diferentes procesos y fuentes de información, que liga los términos considerados como relevantes y los documentos asociados.
Si la correspondencia no es exacta, los sistemas suelen devolver una respuesta vacía, indicando que no se han encontrado los términos de búsqueda. Este comportamiento provoca la insatisfacción en los usuarios, al no ver cubierta su necesidad de información de una manera eficaz.
Sin embargo, un sistema de búsqueda aproximada (también llamada borrosa o difusa, en inglés, fuzzy search) es capaz de realizar un tratamiento adicional sobre los términos de búsqueda y sobreponerse a esta falta de resultados. Para este fin, se construyen posibles alternativas que corrigen errores ortográficos comunes, calculando la similitud entre los términos de búsqueda y los términos de indización y ofreciendo posibilidades de selección al usuario (del tipo "quizás en vez de... usted quiso decir..."), con la posible utilización de sinónimos de los términos presentes en la búsqueda original. De esta manera, el sistema consigue refinar y anticiparse a los deseos de los usuarios.
STILUS Fuzzy es el sistema de búsqueda aproximada desarrollado por Daedalus que puede ser utilizable por sí mismo (como programa ejecutable independiente) o integrado de forma sencilla en un sistema de producción que ya esté en funcionamiento para complementar su funcionalidad.
Para generar las sugerencias de búsqueda, STILUS Fuzzy se basa en un diccionario de términos: una lista de palabras en un determinado idioma, nombres propios de personas, organizaciones, lugares, etc. Desde la versión 2.0 incorpora soporte multidiccionario, es decir, permite usar de forma simultánea varios diccionarios.
Los términos de STILUS Fuzzy pueden tener asociados uno o varios alias, que se utilizan para incluir de forma muy sencilla las diferentes formas flexivas de una palabra ("comer" -> alias "comiendo", "comido"...), sinónimos u otros términos relacionados ("policía" -> alias "comisaría", "cuartel", "prefectura", "guardia civil"...).
Además, para mejorar las prestaciones, es posible incorporar listas de palabras de parada (que se ignoran en el procesamiento) y de errores frecuentes (sugerencias habituales de sustitución).
STILUS Fuzzy está disponible tanto para plataformas Windows como Unix, en cualquiera de sus variantes, y en particular para Linux con sus diferentes distribuciones, sin establecer ninguna restricción respecto a la versión del núcleo y de las bibliotecas de funciones libc.
En el sitio web de demostración de Daedalus se incluye un servicio de búsqueda aproximada sobre títulos de canciones basado en STILUS Fuzzy.
