INVESTIGADORES
XAMENA Eduardo
artículos
Título:
Human Action Recognition in Videos using a Robust CNN LSTM Approach
Autor/es:
OROZCO, CARLOS ISMAEL; XAMENA, EDUARDO; BUEMI, MARÍA ELENA; BERLLES, JULIO JACOBO
Revista:
Ciencia y Tecnología
Editorial:
Facultad de Ingeniería - Universidad de Palermo
Referencias:
Lugar: Buenos Aires; Año: 2020 vol. 2020 p. 21 - 34
ISSN:
1850-0870
Resumen:
El reconocimiento de acciones en videos es actualmente un tema de interés en el área de visión por computadora, debido a potenciales aplicaciones como: indexación multimedia, vigilancia en espacios públicos, entre otras. En este artículo proponemos: (1) Implementar una arquitectura CNN?LSTM para esta tarea. Primero, una red neuronal convolucional VGG16 previamente entrenada extrae las características del video de entrada. Luego, una capa LSTM determina la clase particular del video. (2) Estudiar cómo la cantidad de unidades LSTM afecta el rendimiento del sistema. Para llevar a cabo las fases de entrenamiento y prueba, utilizamos los conjuntos de datos KTH, UCF-11 y HMDB-51. (3) Evaluar el rendimiento de nuestro sistema utilizando la precisión como métrica de evaluación, dado el balance existente entre las clases de los conjuntos de datos. Obtenemos un 93%, 91% y 47% de precisión respectivamente para cada conjunto de datos, mejorando los resultados del estado del arte para los primeros dos. Además de los resultados obtenidos, la principal contribución de este trabajo yace en la evaluación de diferentes arquitecturas CNN-LSTM para la tarea de reconocimiento de acciones.