INVESTIGADORES
SCHLOTTHAUER Gaston
congresos y reuniones científicas
Título:
Desarrollo de un modelo para la síntesis de voz irregular basado en parámetros acústicos
Autor/es:
GABRIEL ALEJANDRO ALZAMENDI; GASTÓN SCHLOTTHAUER; HUGO LEONARDO RUFINER; MARÍA EUGENIA TORRES
Lugar:
Mar del Plata
Reunión:
Congreso; XVIII Congreso Argentino de Bioingeniería y VII Jornadas de Ingeniería Clínica; 2011
Institución organizadora:
Sociedad Argentina de Bioingeniería
Resumen:
La señal de voz normal presenta irregularidades intrínsecas necesarias para que seperciba natural. Cuando existen patologías estas irregularidades aumentan volviéndose másevidentes, incluso para un oído no entrenado. Los parámetros acústicos que las cuanti ficanson útiles en la práctica médica para caracterizar la voz y detectar patologías. Aquí sepropone un modelo para la síntesis de voz irregular que permite fi jar dos parámetrosacústicos, habitualmente empleados en la práctica médica, relacionados con las perturbaciones instantáneas en la amplitud y el periodo fundamental: Shimmer y Jitter. Se genera la señal glótica artifi cial a partir de un tren de pulsos equi-espaciados, modi cando la amplitud y periodo de cada pulso y aplicando a la señal resultante un fi ltro lineal autorregresivo equivalente al del tracto vocal, obteniendo así una señal de voz sintética. Se desarrollaron modelos para la perturbación de la amplitud y del periodo a partir de métodos estadísticos sencillos.Mediante algoritmos de predicción lineal se generó el fi ltro del tracto vocal usando vocesreales. Se generó un conjunto de señales y se analizó el desempeño del modelo. Las señalessintetizadas resultaron morfológicamente similares a las voces reales, aunque aún distan depercibirse como naturales. Los valores de las medidas de Shimmer y Jitter obtenidos coincidieron mayoritariamente con los valores teóricos. Sin embargo, se observó que el Jitter se aleja del comportamiento ideal para valores pequeños debido a la frecuencia fundamental y a la naturaleza temporal discreta de las señales sintetizadas. Los resultados sugieren que el modelo desarrollado es úil para generar voces arti ciales, tanto sanas como patológicas, para un amplio rango de valores de los indicadores de Shimmer y Jitter.