RECONOCIMIENTO DE HABLA
La tecnología de Reconocimiento de Habla, también conocida como Reconocimiento de Voz, se emplea para convertir la señal acústica correspondiente al habla de una persona en texto. En los últimos años esta tecnología está recuperando el interés de desarrolladores y usuarios debido, entre otros, a los siguientes motivos: en el ámbito social, la conversión de voz a texto es clave para aumentar la accesibilidad de los sistemas informáticos; desde el punto de vista empresarial, la demanda de contenidos audiovisuales subtitulados crece constantemente, haciendo ineficiente y costosa la transcripción manual y, en el sector de Internet, se hace cada vez más necesario disponer de métodos de tratamiento de contenidos audiovisuales que van más allá del texto.
La base de cualquier sistema de Reconocimiento de Voz recae en dos elementos principales: el modelo acústico, que permite aproximar la señal de voz de la entrada a las correspondientes a los fonemas del lenguaje y el modelo del lenguaje, que permite corregir posibles errores del modelo acústico descartando estructuras no válidas en el lenguaje. Conviene distinguir, además, entre enfoques orientados al locutor, donde se requiere un entrenamiento específico de los modelos para las personas cuya voz se desea reconocer, y los enfoques independientes del locutor, válidos para cualquier hablante sin necesidad de entrenamiento previo.
En Daedalus estamos especialmente interesados en los procesos independientes del locutor y, por un lado, aplicamos nuestra tecnología y conocimientos lingüísticos para perfeccionar los modelos de lenguaje de los sistemas de Reconocimiento de Voz; por otro lado, integramos tecnología de este tipo en sistemas de recuperación de información, permitiendo así la búsqueda sobre contenidos de audio y vídeo. Además, empleamos esta tecnología en el proceso de generación automática de subtítulos para contenidos audiovisuales, reduciendo tiempos y costes. El producto STILUS Subtitler incorpora la tecnología de generación de subtítulos de Daedalus.
Daedalus trabaja con tecnología de reconocimiento de voz de terceros, tanto productos comerciales, como los de Sail Labs o Nuance, como, sobre todo en el ámbito de proyectos de investigación, productos de código abierto, como HTK o Sphinx. En Daedalus adaptamos estos sistemas a los entornos y dominios de negocio de nuestros clientes.
En el sitio web de demostración, Showroom, se incluye el demostrador Digital Audio Library Indexing (DALI).
¿Desea más información sobre el producto de Daedalus para generación automática de subtítulos?
