STILUS Class

Clasificación automática de textos

STILUS Class es uno de los componentes de la familia STILUS de productos de tecnología lingüística, que ofrece funcionalidad para la clasificación automática de textos a partir de un modelo previamente entrenado. El algoritmo de clasificación es un modelo híbrido estadístico con filtrado basado en reglas, con los siguientes pasos:

  • Paso I: selección de las categorías posibles mediante un algoritmo estadístico basado en la comparación del texto a clasificar con cada categoría, mediante el algoritmo kNN (k-Vecinos más cercanos)

  • Paso II: filtrado (aceptar/desechar) categorías mediante un sistema de reglas basado en una lista de términos (multipalabra) obligatorios (que deben aparecer en el texto) y términos eliminatorios (que no deben aparecer)

  • Paso III: ordenación de las categorías según relevancia descendiente

En el sitio web de demostración de Daedalus, Showroom, se ofrecen demostradores de las capacidades de clasificación de STILUS Class, tanto con el estándar IPTC (International Press Telecommunication Council, una organización internacional que agrupa a las más destacadas agencias de noticias y empresas de comunicación, y se centra en el desarrollo y publicación de estándares técnicos para mejorar el intercambio de noticias) como con el tesauro Eurovoc (tesauro plurilingüe que abarca todos los ámbitos de actividad de las Comunidades Europeas y permite indizar los documentos en los sistemas de documentación de las instituciones europeas y de sus usuarios).

White paper sobre Tecnologías de la Lengua

Descárgalo >>

Showroom

Pruebe nuestros productos...

Showroom >>