Investigadores españoles desarrollan un nuevo algoritmo altamente eficiente en el reconocimiento de idiomas

Actualizado: viernes, 15 abril 2016 11:54


MADRID, 15 Abr. (EUROPA PRESS) -

Un grupo de investigadores del 'Grupo de Biometría y Reconocimiento de Patrones ATVS' de la Universidad Autónoma de Madrid (UAM - Escuela Politécnica Superior) ha presentado un sistema de reconocimiento de idioma hablado basado en redes neuronales, "con resultados muy satisfactorios".

"El reconocimiento de idioma tiene como objetivo distinguir cuál es el idioma hablado en un segmento de audio. En un mundo cada vez más globalizado, este tipo de sistemas actúan como una etapa de pre-procesado en sistemas de reconocimiento de voz multilingües (como por ejemplo, "Siri")", advierten.

En un artículo publicado recientemente en la revista 'PLoS ONE', los investigadores han comparado un sistema clásico, cuyo rendimiento está más que demostrado y aceptado en la comunidad, con un sistema basado en redes neuronales. Para ello, han utilizado audios con una longitud inferior a 3 segundos, que han sido extraídos de una evaluación competitiva organizada por el Instituto de Estándares y Tecnología de Estados Unidos (NIST).

"El sistema ha sido entrenado para distinguir entre 8 idiomas diferentes (inglés, español, dari, francés, pastún, ruso, urdu y chino), utilizando más de 1600 horas de audio en total. Este sistema está basado en un tipo de red neuronal con unidades de memoria (LSTMs, por sus siglas en inglés) que permite extraer información no sólo de la entrada que recibe, sino de una secuencia completa de audio", explican los investigadores.

Según destacan los investigadores, los resultados de este nuevo sistema presentan una mejora relativa de un 26,15% frente al sistema de referencia basado en i-vectors, cuyas distintas variantes han sido el estado del arte durante los últimos años. El sistema propuesto consigue reconocer correctamente más del 70% de los ficheros, en tan sólo 3 segundos, e incluso más del 50% de los mismos, en menos de 1 segundo.