i

Volvemos a recibir manuscritos para la sección general, para los números de diciembre de 2024 en adelante. Recuerden revisar nuestras normas editoriales.

Rendimiento de parámetros acústicos-fonéticos en el reconocimiento de hablantes

Autores/as

  • Mario Bernales Lillo Universidad de la Frontera
  • Jorge Díaz Villegas Universidad de la Frontera
  • Roberto Paredes Ruminot Universidad de la Frontera
  • Ricardo de Figueiredo Molina Universidad Estatal de Campinas

Resumen

Este es un trabajo de carácter interdisciplinario en el campo de la lingüística y la computación que da a conocer el desarrollo de un sistema automatizado para el reconocimiento de hablante a través de la voz humana, partiendo de un corpus fónico grabado por un número potencial de informantes seleccionados al azar que constituyen la muestra de la investigación. La selección de los mismos se hizo con el apoyo de un fonoaudiólogo y entre las características principales se tuvo en cuenta que fueran hablantes del dialecto del español de Chile (ciudad de Temuco); pertenecieran al nivel estándar; fueran de sexo masculino y no presentaran dificultades articulatorias.

El registro de sus voces se realizó en dos ocasiones con un intervalo de tiempo equivalentes a seis meses, con el objeto de comparar más tarde los valores fonéticos-acústicos de ambos registros. Las grabaciones reunieron diversas modalidades de habla, tanto espontánea como quella proveniente de la lectura de textos (fluida, veloz, de tablas numéricas aleatorias, de combinaciones silábicas, de palabras y frases claves).

Para el análisis de los parámetros acústico-fonéticos (Fo, Formantes, ELT, FFT, Amplitud, Coeficientes de Reflexión, etc.) de cada informante se utilizó el equipo Computerized Speech Laboratory (CSL) 4300B fabricado por la casa Kay Elemetrics. Con ellos se construyó la base de datos en un archivo con formato especial (Software de Identificación de Hablantes). Luego se procedió a "alimentar" la red neuronal para que ésta "aprendiera" los padrones acústicos de cada hablante, optimizando los coeficientes de penalidad estadísticos de que dispone la red. Finalmente, en el proceso de identificación se ingresó la información correspondiente a un segundo análisis acústico del mismo informante (etapa predictiva) y, de este modo, la red debía entregar resultados estadístcos y probabilísticos  correspondientes a cada una de las variables consideradas. Así, ella aceptó o rechazó la identificación del hablante.

La posibilidad de utilizar los parámetros acústicos como dispositivos complementarios de identificación tendrá gran aplicación a corto plazo. Los sistemas de verificación automática de hablantes podrán ser empleados, por ejemplo, en transacciones bancarias y comerciales como filtros para identificar a personas que ponen en peligro la seguridad individual, etc.