CONICET | Buscador de Institutos y Recursos Humanos

La frecuencia con que se repiten los sonidos del habla es de interés teórico y aplicado. Desde el punto de vista teórico, la distribución de las unidades caracteriza a la lengua. Desde el punto de vista de las aplicaciones, esta información es apreciada en el campo de la percepción del habla, reconocimiento automático del habla, síntesis de habla, patologías del habla, identificación del locutor, psicoacústica, procesos cognitivos, neurolingüística, entre otros. Existes varios trabajos que reportan distribuciones de ocurrencias de fonemas para las distintas variantes del español. En particular para el español hablado en argentina, nos remitiremos al trabajo pionero de Guirao y Borzone de 1972, y de Guirao y García que realizaron el conteo de fonemas sobre el texto de cinco libros de cuentos y novelas. Los tamaños de los córpora utilizados hay ido evolucionando: desde 5.000 fonemas hasta 3.650.000 fonemas. El corpus Emilia fue diseñado para la creación de una voz para el sistema Aromo de conversión de texto en habla (TTS, del inglés Text-To-Speech). En este contexto, se define la cobertura de un corpus como la capacidad de sintetizar una palabra cualquiera del idioma. Aromo realiza la síntesis del habla mediante el método de selección de unidades previamente guardadas. La unidad empleada es el difono, que se define como el segmento de habla que va desde el punto medio estable de un fono al punto medio estable del siguiente fono. Una forma de estimar si el sistema puede o no sintetizar una palabra es comparando las unidades presentes en el corpus que utiliza el sistema TTS con las unidades necesarias para realizar la tarea de síntesis. El objetivo de este trabajo fue construir un corpus de texto de referencia: Lana, transcribirlo a fonemas, y realizar una estadística sobre las unidades fonéticas para poder estimar la cobertura de corpus de textos en general y en particular del corpus de texto Emilia.

enviar mensaje