CIEM   05476
CENTRO DE INVESTIGACION Y ESTUDIOS DE MATEMATICA
Unidad Ejecutora - UE
congresos y reuniones científicas
Título:
Índices de Similitud para Series de Tiempo
Autor/es:
BELLASSAI GAUTO, JUAN CARLOS; OJEDA SILVIA MARÍA
Lugar:
San Miguel de Tucumán
Reunión:
Congreso; XLVII COLOQUIO ARGENTINO DE ESTADÍSTICA V JORNADA DE EDUCACIÓN; 2019
Institución organizadora:
Sociedad Argentina de Estadística
Resumen:
La detección de similitudes es un problema central en el análisis de bases de datos de series temporales. Objetivo: En este trabajo adaptamos un índice propuesto originalmente para comparar imágenes digitales, al problema de comparar dos series de tiempo. Llamamos al nuevo índice SSIMT e inicialmente lo aplicamos en forma global. Luego, aplicamos SSIMT en forma local, sobre ventanas móviles y deslizantes de las series. Metodología: Definimos un algoritmo de clasificación de series temporales basado en SSIMT y SSIMT por ventanas. Luego realizamos tres experimentos para comparar el desempeño de estas dos propuestas. En el primero consideramos el modelo AR(1) y variando el valor del parámetro autorregresivo generamos tres grupos de series que fueron clasificadas aplicando el algoritmo y el método de Monte Carlo. En el segundo experimento aplicamos el mismo diseño de trabajo, pero considerando tres grupos de series definidos por modelos AR(1), MA(1) y ARIMA. Finalmente en el tercer experimento aplicamos el algoritmo para clasificar series temporales reales. Resultados: En el primer experimento, ambas propuestas obtuvieron resultados similares, clasificando correctamente alrededor del 58% de las series. En el segundo experimento, el índice SSIMT por ventanas móviles clasificó correctamente un 96% de las series, contra el 94% de SSIMT. Finalmente en el caso de las series reales, SSIMT clasificó bien el 98% de las series y SSIMT por ventanas el 100%. Conclusiones: SSIMT define una herramienta útil para comparar series temporales. Si bien aplicado localmente sobre ventanas deslizantes mostró ser levemente mejor que SSIMT global, su alto costo computacional, desalienta su uso en situaciones prácticas.