INVESTIGADORES
BALZARINI Monica Graciela
congresos y reuniones científicas
Título:
Filtrado y depuración de datos georreferenciados en agricultura de precisión.
Autor/es:
VEGA, A.; CÓRDOBA, M.; BALZARINI, M.
Lugar:
Buenos Aires
Reunión:
Congreso; 1° Congreso Argentino de Estadística (CAE I) XLIII Coloquio Argentino de Estadística XX Reunión Científica del GAB; 2015
Institución organizadora:
Grupo Argentino de Biometría y Sociedad Argentina de Estadística
Resumen:
En la agricultura moderna la utilización de tecnologías de agricultura de precisión basadas en sensores remotos y proximales, permiten obtener numerosos datos dentro de un mismo lote y asociar a cada medición información exacta sobre su posición en el terreno. En el proceso de captura de los datos georeferenciados suelen producirse errores en las mediciones de las variables. La eliminación de estos datos (i.e. otuliers) ha sido abordada utilizando métodos que aplican secuencias de filtros. Algunos de ellos requieren conocimientos previos de la variable relevada (i.e. rendimiento, índice de vegetación, conductividad eléctrica del suelo) para el establecimiento de un umbral superior e inferior que permita identificar los datos erróneos. Sin embargo, aplicando este criterio se produce una pérdida importante de "buenos datos" y no se ocupa de los valores extremos locales (inliers espaciales). Los inliers son datos que difieren significativamente de su vecindario pero se sitúan dentro del rango general de variación del conjunto de datos. En este trabajo se presenta un procedimiento de dos pasos para identificar y filtrar tanto los outliers como los inliers: 1) se eliminan los datos que se encuentran fuera de la media ± 3 SD, 2) se utiliza el índice autocorrelación espacial Local de Moran para identificar y eliminar aquellos datos que son inconsistentes con sus puntos vecinos. La implementación del procedimiento se ilustra sobre datos de 30 mapas de rendimiento de cultivos de grano. Los resultados mostraron que el método propuesto fue eficaz en la exclusión de inliers e identificar diferentes tipos de errores, respecto los procedimientos de filtro que utilizan los límites superior e inferior. El procedimiento de dos pasos mostró una reducción del efecto nugget en los mapas de rendimiento obtenidos por interpolación geoestadística.