INIGEM   23989
INSTITUTO DE INMUNOLOGIA, GENETICA Y METABOLISMO
Unidad Ejecutora - UE
informe técnico
Título:
Informe de técnico: Medición preliminar de la velocidad de conversión del sistema TTS AROMO
Autor/es:
HUMBERTO MAXIMILIANO TORRES
Fecha inicio/fin:
2013-12-18/2013-12-25
Páginas:
1-7
Naturaleza de la

Producción Tecnológica:
Informática (software)
Campo de Aplicación:
Otros campos
Descripción:
La síntesis por selección de unidades consiste en elegir, de entre todas las secuencias posibles de unidades que sinteticen el texto de entrada, aquella que en forma conjunta se acerque más a la secuencia predicha y la que tenga menos ruidos por la concatenación. En el sistema de conversión de texto en habla AROMO, se ha implementado un algoritmo de programación dinámica que permite encontrar la mejor secuencia posible de síntesis. Este proceso es el que tiene mayor costo computacional de todo el sistema: aproximadamente 95% del tiempo de proceso. Se han analizado las propuestas para aumentar la velocidad de conversión. Se implementaron una serie de mejoras, algunas de las cuales no modifican la secuencia de unidades óptimas, y otras que si lo hacen reduciendo el ancho de la búsqueda. Se ha logrado reducir el costo computacional en aproximadamente 30%. Al ajustar el ancho de búsqueda para que el sistema trabaje en tiempo real, solo se eligen 8% de las unidades distintas de las óptimas. Resta realizar pruebas perceptuales para determinar en que grado se ve afectada la calidad del habla generada al disminuir al acho de búsqueda.