BECAS
HURTADO Santiago Ignacio
congresos y reuniones científicas
Título:
ANÁLISIS COMPARATIVO DE MÉTODOS DE RELLENADO DE DATOS DE CAUDAL MEDIO DIARIO EN LA CUENCA ALTA DEL RÍO NEUQUÉN
Autor/es:
RICETTI, LORENZO; HURTADO, SANTIAGO I.; EDUARDO A. AGOSTA
Reunión:
Congreso; XXIX Reunión Científica de la Asociación Argentina de Geofísicos y Geodestas; 2021
Resumen:
Tener series hidrológicas continuas y confiables de caudal medio diario resulta esencial para múltiplesfines, tanto para investigaciones científicas como para aplicaciones. Entre los estudios científicos sepueden mencionar estudios ecológicos y climatológicos, análisis de calidad de agua y transporte desedimentos. En términos de aplicación, son necesarias para una eficiente planificación y gestión delrecurso hídrico en aplicaciones industriales, de agricultura, de generación de energía hidroeléctrica, desuministro de agua potable y de control de inundaciones. A pesar de la gran relevancia que revistenestos datos, es común encontrar series temporales incompletas. Estas suelen presentar no solo datosfaltantes aislados, sino también periodos completos sin medición. En consecuencia, surge la necesidadde implementar algún método de rellenado de estos datos que permita obtener series continuas.El desempeño de cualquier método de rellenado depende de múltiples factores como la orografía,ubicación en el globo, diseño y densidad de la red de medición, ciclo anual y sus variaciones de lavariable en cuestión, entre otros factores. Por esto, es necesaria la evaluación local del desempeño dedistintos métodos de rellenado de datos para seleccionar el más adecuado (Hurtado et al., 2021). Casocontrario, podrían introducirse errores que comprometan la fiabilidad de los análisis subsiguientes apartir de la utilización de métodos de rellenado inadecuados.El presente trabajo evalúa el desempeño de varios métodos de rellenado de datos de caudal mediodiario en la cuenca alta del Río Neuquén (CARN) considerando el período 1980-2019. El caudal delos cursos en la cuenca presentan dos fases marcadas, una de bajos caudales de enero a junio y otra dealtos caudales de julio a diciembre. Esta característica se debe a su régimen pluvio-nival consecuenciade la precipitación invernal y la fusión nival en primavera (Lauro et al., 2019).Los métodos de rellenado de datos comúnmente utilizados en la bibliografía se pueden separar en tres,los que utilizan la autocorrelación de la propia serie para el rellenado de datos, los que utilizan la co-variabilidad con registros de estaciones cercanas, y los que se basan en modelos de escorrentíautilizando la precipitación.Los métodos que se basan en la utilización de la propia serie son particularmente efectivos cuando nose disponen de datos cercanos. Entre estos métodos se encuentra en la bibliografía el método del valormedio (VM), que es el promedio entre el valor previo y el siguiente al dato a rellenar. Este métodosencillo sólo puede utilizarse únicamente para datos faltantes aislados. Por otro lado, otros autoresutilizan la autocorrelación de la serie aplicando ya sea modelos autorregresivos (AR), modelos AR demedias móviles (ARMA), o modelos AR integrados de medias móviles (ARIMA). El modelo AR esuna regresión lineal múltiple con la propia serie desfasada desde 1 hasta el orden N (a definir). Elmodelo ARMA agrega al modelo AR un modelo de medias móviles de los errores del modelo AR, yel modelo ARIMA agrega al modelo ARMA una diferenciación de la serie para alcanzar laestacionariedad. En este trabajo se consideró tanto el método VM como el ARIMA. No seconsideraron los modelos AR y ARMA, ya que las series son no estacionarias lo que justifica el usode ARIMA.Los métodos que se basan en el uso de estaciones cercanas para la interpolación utilizan,generalmente, un modelo de regresión lineal múltiple (MLR, por sus siglas en inglés) entre lasestaciones cercanas (predictoras) y la estación que se quiere rellenar (predictando). En este sentido, seutilizó MLR con las estaciones cercanas disponibles. Considerando el potencial desfasaje en tiempoque puede tener el caudal de una estación cercana corriente abajo o arriba de la estación a rellenar,también se utilizó MLR con estaciones cercanas y sus respectivos desfasajes en tiempo (método alque referimos como MLR_ds). Además, considerando la autocorrelación que presenta el caudal pornaturaleza, se consideró un tercer modelo MLR, que considera no solo el desfasaje de las estacionescercanas, sino que también el de la propia serie (método al que referimos como MLR_ar).Por otro lado, los métodos de rellenado basados en modelos de escorrentía son muy variados. En elpresente trabajo se utilizaron los datos del modelo de reanálisis hidrológico GloFAS en su versiónV3.0. El GloFAS se basa en el reanálisis meteorológico ERA5, cuyo gran desempeño y resoluciónespacial producen una sustancial mejora en el reanálisis hidrológico (Alfieri et al., 2020). Los datosdel GloFAS fueron utilizados de dos formas distintas. Por un lado, el dato crudo (a lo que referimoscomo GloFAS_raw) y por otro lado, el dato regresionado con la serie a rellenar (a lo que referimoscomo GloFAS_reg).Es importante considerar que no todos los métodos nombrados pueden ser utilizados en todos loscasos. Ya que, para períodos continuos sin medición (?gaps?) los métodos que se basan en laautoregresión de la propia serie utilizan datos rellenados para rellenar los siguientes datos,propagando de esta forma errores. En cambio los métodos GloFAS_raw, GloFAS_reg, MLR yMLR_ds no cambian su error entre faltantes aislados o continuos, ya que no utilizan los datosanteriores de la propia serie.Como la co-variabilidad de las series puede diferir entre las distintas fases del ciclo anual, los modelosde regresión (MLR, MLR_ds, MLR_ar y GloFAS_reg) fueron ajustados de dos formas distintas. Porun lado se ajustaron los modelos a partir de la serie completa de predictores (Serie completa) y por elotro, considerando sólo el subconjunto correspondiente a cada fase (Subconjunto Fase).Los residuos de cada método fueron calculados a partir de la metodología ?Leave-one-out cross-validation?, dado que de este modo es posible estimar el error de cada método simulando lascondiciones en las cuales dicho método será implementado (utilizando todos los valores posibles paraajustar el modelo a excepción del valor a interpolar). Para poder comparar los errores entre lasdistintas estaciones de caudal consideradas, se utilizaron métricas basadas en el error relativo.En términos generales, los métodos que usan la autocorrelación de la propia serie presentan errorespromedios en torno al 10%, mientras que los métodos que no la utilizan presentan errores promediosmayores al 30%. Por otro lado, ambas aplicaciones de GloFAS presentan errores promedios mayoresal 100%.