INVESTIGADORES
GRAVANO Agustin
congresos y reuniones científicas
Título:
Detección on de palabras claves usando pocos datos de entrenamiento
Autor/es:
PABLO BRUSCO; LUCIANA FERRER; AGUSTÍN GRAVANO
Lugar:
La Matanza, Pcia. de Buenos Aires
Reunión:
Congreso; XX Congreso Argentino de Ciencias de la Computación (CACIC); 2014
Institución organizadora:
Universidad Nacional de La Matanza
Resumen:
Estudiamos el problema de detección de palabras claves (keyword-spotting) para idiomas que no disponen de corpus de datos con grabaciones y transcripciones fonéticas. Este problema es de central importancia para poder realizar búsquedas en bases de datos de grabaciones de habla. Usando el Boston University Radio Speech Corpus como corpus de referencia, analizamos diversas topologías y parametrizaciones de Modelos Ocultos de Markov para la detección de palabras sobre habla continua. Los modelos se basan en el uso de "fillers" para palabras no buscadas, y empleamos fonemas como unidades mínimas de detección. Para las pruebas, utilizamos un conjunto de 20 keywords entrenadas con 14 minutos de datos transcriptos y fillers entrenados con 7 horas sin transcripciones. Los resultados muestran que el mejor modelo alcanza rendimientos superiores a un 0.47 de FOM promedio, un porcentaje de detecciones correctas del 72.1 % y 3.95 falsas alarmas por hora por keyword.