CONICET | Buscador de Institutos y Recursos Humanos

INVESTIGADORES

SCHLOTTHAUER Gaston

datos académicos

artículos

capítulos de libros

congresos y reuniones científicas

Título:

Desarrollo de un modelo para la síntesis de voz irregular basado en parámetros acústicos

Autor/es:

GABRIEL ALEJANDRO ALZAMENDI; GASTÓN SCHLOTTHAUER; HUGO LEONARDO RUFINER; MARÍA EUGENIA TORRES

Lugar:

Mar del Plata

Reunión:

Congreso; XVIII Congreso Argentino de Bioingeniería y VII Jornadas de Ingeniería Clínica; 2011

Institución organizadora:

Sociedad Argentina de Bioingeniería

Resumen:

La señal de voz normal presenta irregularidades intrínsecas necesarias para que seperciba natural. Cuando existen patologías estas irregularidades aumentan volviéndose másevidentes, incluso para un oído no entrenado. Los parámetros acústicos que las cuantificanson útiles en la práctica médica para caracterizar la voz y detectar patologías. Aquí sepropone un modelo para la síntesis de voz irregular que permite fijar dos parámetrosacústicos, habitualmente empleados en la práctica médica, relacionados con las perturbaciones instantáneas en la amplitud y el periodo fundamental: Shimmer y Jitter. Se genera la señal glótica artificial a partir de un tren de pulsos equi-espaciados, modicando la amplitud y periodo de cada pulso y aplicando a la señal resultante un filtro lineal autorregresivo equivalente al del tracto vocal, obteniendo así una señal de voz sintética. Se desarrollaron modelos para la perturbación de la amplitud y del periodo a partir de métodos estadísticos sencillos.Mediante algoritmos de predicción lineal se generó el filtro del tracto vocal usando vocesreales. Se generó un conjunto de señales y se analizó el desempeño del modelo. Las señalessintetizadas resultaron morfológicamente similares a las voces reales, aunque aún distan depercibirse como naturales. Los valores de las medidas de Shimmer y Jitter obtenidos coincidieron mayoritariamente con los valores teóricos. Sin embargo, se observó que el Jitter se aleja del comportamiento ideal para valores pequeños debido a la frecuencia fundamental y a la naturaleza temporal discreta de las señales sintetizadas. Los resultados sugieren que el modelo desarrollado es úil para generar voces articiales, tanto sanas como patológicas, para un amplio rango de valores de los indicadores de Shimmer y Jitter.

enviar mensaje