IANIGLA   20881
INSTITUTO ARGENTINO DE NIVOLOGIA, GLACIOLOGIA Y CIENCIAS AMBIENTALES
Unidad Ejecutora - UE
congresos y reuniones científicas
Título:
Contrastes entre la desviación absoluta media y mediana como herramientas para detectar valores atípicos
Autor/es:
BASTIDAS, LUIS; CAROLINA LAURO; ALBERTO I.J. VICH; SEBASTIAN OTTA; EDUARDO MARTINEZ CARRETERO; EMILCE VACCARINO
Lugar:
Virtual
Reunión:
Encuentro; E-ICES 15; 2020
Institución organizadora:
CNEA-UNCUYO
Resumen:
Los valores atípicos (outliers) representan datos fuera del rango común de una serie temporal determinada. Pueden tener origen antrópico (por errores de medición) o por fluctuaciones extremas naturales. A partir de caudales históricos mensuales de dos estaciones del río Atuel (Argentina), el objetivo se orientó en contrastar los parámetros de la media y mediana para detectar outliers. La herramienta se basó en la metodología MAD-score (desviación mediana absoluta), cuyos autores propician que sea utilizada con la mediana en vez de la media. Dado que la ecuación se aplica en la serie temporal completa, el estudio también se centró en establecer las diferencias entre esta característica y la basada en las medias/medianas mensuales (caudales mensuales). Con el objetivo de comparar las metodologías y propuestas anteriores, éstas se contrastaron con el método del U.S. Water Resources Council (WRC), comúnmente utilizado por los hidrólogos argentinos. Finalmente, se compararon cronológicamente los resultados de las estaciones consideradas, a fin de establecer si los valores atípicos de una estación están presentes también en la otra. Entre los resultados obtenidos, se destaca la sensibilidad y robustez de la mediana sobre la media para la detección de outliers. Por otra parte, se observó el potencial de utilizar el MAD-score para cada mes de la data media mensual por sobre la totalidad de la serie. Adicionalmente y en función del contraste entre las estaciones, se observaron datos atípicos en la misma posición cronológica de ambas, lo cual indicaría un origen natural de los mismos. Relacionado al contraste con WRC, se destaca el potencial sensible de MAD-score como estimador de la dispersión desde la mediana muestral. La importancia de la identificación fiable de valores atípicos, radica tanto en la depuración de las series de datos (origen antrópico), como en el análisis de crecidas y pulsos de inundación en el río.