CONICET | Buscador de Institutos y Recursos Humanos

INVESTIGADORES

SCHLOTTHAUER Gaston

datos académicos

artículos

capítulos de libros

congresos y reuniones científicas

Título:

Clasificación automática de voces patológicas

Autor/es:

MARÍA EUGENIA TORRES; GASTÓN SCHLOTTHAUER

Lugar:

Tandil, Argentina

Reunión:

Congreso; IV Congreso Latinoamericano de Biología Matemática; 2005

Institución organizadora:

Asociación Latino Americana de Biomatemática y Red Latino Americana de Ecología Matemática

Resumen:

Aún cuando la fonación normal y los desordenes de la voz pueden ser distinguidos cualitativamente por el oído humano debidamente entrenado, no existen en la actualidad sistemas que permitan realizar una cuantificación y estimación de la distribución de los datos correspondientes a las diferentes patologías. Este trabajo esta motivado por el interés clínico puesto de manifiesto por los fonoaudiólogos y la necesidad de contribuir al desarrollo de técnicas que se orienten en este sentido.En el área de la fonoaudiología es de interés clínico determinar, en primer lugar, si la fonación de un paciente es normal o patológica. Esta tarea resulta más complicada cuando se necesita precisar la patología, dado que en ciertos casos las voces de los pacientes suelen tener características similares aunque con patologías diferentes. Un caso importante es discriminar entre dos disfonías: disfonía por tensión muscular (muscular tension disphonia, MTD) y disfonía espasmódica (spasmodic disphonia, SD). La importancia yace en que los tratamientos para cada una de ellas son totalmente diferentes, y solamente pocos especialistas altamente entrenados pueden realizar un diagnóstico diferencial correcto. Las medidas temporales clásicas, basadas en la variación de la frecuencia fundamental y de la amplitud de períodos consecutivos de la señal de voz respectivamente, resultan de ayuda para distinguir entre voces normales y patológicas, pero no han sido suficientes para discriminar entre las disfonías arriba mencionadas. En la actualidad no existen herramientas que permitan la clasificación automática de estas patologías. Tal ausencia nos motivó a desarrollar nuevas técnicas que resulten de utilidad en el diagnóstico automático a partir del registro de la fonación de la vocal /a/ sostenida. En el presente trabajo en primer lugar realizamos una clasificación entre voces normales y patológicas. Posteriormente, procedemos a discriminar entre las dos patologías de interés. Para este fin utilizamos diferentes parámetros calculados a partir de la señal de voz. Estos son la fracción de señal localmente no vocalizada, el grado de quiebre vocal, tres medidas distintas de jitter (grado de variación de frecuencias fundamentales consecutivas de la voz en vocales sostenidas), y tres medidas distintas de shimmer (grado de variación de la amplitud de períodos consecutivos en vocales sostenidos). Con estos parámetros construimos los patrones para representar a cada uno de los pacientes. Se analiza el comportamiento como reconocedor automático de patrones de redes neuronales y de máquinas de soporte vectorial (support vector machines, SVM). Las redes neuronales se entrenaron mediante diferentes métodos, obteniendo resultados dependientes de tales métodos. En el caso de las SVMs se estudia aquí su comportamiento para diferentes kernels. Los avances aquí presentados indican una vía para el desarrollo de un método de diagnóstico diferencial automático que puede resultar de ayuda al profesional fonoaudiólogo.

enviar mensaje