BÚSQUEDA DE RESPUESTAS
Un sistema de búsqueda de respuestas (en inglés Question Answering) proporciona respuestas concretas a preguntas. Por ejemplo, si un usuario realizase la pregunta "¿Qué país ganó la última Copa del Mundo?" el sistema debe ofrecer como respuesta "España", y un conjunto de páginas web donde es posible encontrar información sobre el mundial de fútbol y/o la selección española. Este es un comportamiento diferente al que tienen los buscadores habituales como Google o Yahoo!, donde la respuesta es un conjunto de páginas web que el usuario debe inspeccionar para encontrar por sí mismo la información que busca. Además, los sistemas de búsqueda de respuestas se alimentan de cualquier tipo de repositorio, no solo de páginas web o de bases de datos específicas.
En los sistemas de búsqueda de respuestas actuales (la mayoría de ellos en estado experimental) es posible reconocer una secuencia de operaciones comunes que permitirían definir una arquitectura genérica basada en los siguientes componentes:
- Análisis de la pregunta. Para poder responder a una pregunta es necesario disponer de ciertas características entre las que, en casi todos los casos, se encuentra el tipo de pregunta y el tipo esperado para la respuesta. El tipo de pregunta determina si se quiere localizar un hecho concreto (por ejemplo, "¿qué país ganó el mundial de fútbol de 2006?"), en cuyo caso se habla de preguntas factuales, o si se quiere obtener una definición de un concepto (por ejemplo, "¿qué es la osteoporosis?"), donde se habla de preguntas de definición. Dependiendo del sistema considerado, se incluyen otros tipos como si es una pregunta de tipo lista, es decir, si se espera una lista de valores como respuesta (por ejemplo, "¿qué países forman la Unión Europea?"). También se determina en esta fase el tipo esperado en la respuesta que, básicamente, viene a indicar si se está buscando un nombre de persona, una organización, una fecha concreta, etc.
- Recuperación de información. Los sistemas de búsqueda de respuestas que trabajan sobre contenidos web necesitan de algún mecanismo que facilite una lista de páginas web que puedan contener la respuesta buscada. A estos sistemas se les denomina sistemas de recuperación de información y entre ellos se encuentran los buscadores de todos conocidos.
- Selección de pasajes. Una vez se dispone de documentos con posibilidades de contener una respuesta, es necesario estudiarlos para seleccionar aquellas frases o conjuntos de frases (pasajes) que puedan contener una repuesta a la pregunta efectuada. Los pasajes seleccionados serán los que se empleen como entrada del siguiente componente.
- Extracción de respuestas. Por último, queda recorrer las frases que contienen las respuestas para proceder a extraer la respuesta precisa que solicita el usuario. En esta fase se hace uso del tipo esperado en la respuesta, así como del tipo de pregunta, para seleccionar las palabras concretas que forman la respuesta o, en su caso, la frase o pasaje que la constituye.
Como puede adivinarse, para llevar a cabo con éxito este proceso de búsqueda es necesario disponer de tecnología para efectuar análisis lingüísticos profundos de los textos involucrados. En Daedalus trabajamos en la integración de nuestra tecnología lingüística en un sistema completo de búsqueda de respuestas.
Antes de esta iniciativa, en Daedalus ya habíamos desarrollado soluciones con versiones parciales de este tipo de sistemas. La idea base es indexar textos de tamaño reducido (pasajes –por ejemplo, párrafos– en lugar de documentos completos), con lo que es posible ubicar mejor la respuesta a una consulta determinada. En concreto, hemos empleado estas soluciones para responder automáticamente a consultas a partir de listas de preguntas y respuestas (en inglés, Frequently Asked Questions, FAQ), de las que se disponía de versiones en varios idiomas, y también a partir de manuales de usuario. Es el tipo de problema que se da en los call centers (centros de información y servicio a los usuarios). El cliente de referencia para esta tecnología es Linguaserve.
¿Desea ampliar información sobre los productos de Daedalus aplicables a búsqueda de respuestas?
