INVESTIGADORES
TURJANSKI Pablo Guillermo
congresos y reuniones científicas
Título:
Comparación de procesos de limpieza de bases de datos antropométricos
Autor/es:
DRAMIS, AGUSTÍN; FERNÁNDEZ, MARÍA SOLEDAD; TURJANSKI, PABLO
Lugar:
Buenos Aires
Reunión:
Otro; XXXVI Escuela de Ciencias Informáticas (ECI) - FCEyN - UBA; 2023
Institución organizadora:
FCEyN-UBA
Resumen:
Introducción. Las grandes bases de datos antropométricos generadas por sistemas de salud son valiosas para el análisis de datos a gran escala, permitiendo detectar la malnutrición a nivel individual y su prevalencia en diferentes niveles jurisdiccionales. Uno de los indicadores clave es la baja talla para la edad, considerada el mejor indicador de desigualdades en la salud infantil, que afecta el desarrollo físico y cognitivo de los niños, siendo también un factor de transmisión intergeneracional de pobreza y desigualdad. Estas bases de datos son utilizadas para monitorear y definir políticas públicas basadas en evidencia. Sin embargo, debido a posibles errores e inconsistencias en el proceso de recopilación y centralización de los datos, es necesario implementar un proceso de limpieza previo al análisis, removiendo tanto datos biológicamente no plausibles como longitudinalmente inconsistentes.Objetivos. Evaluar el desempeño de un procesos de limpieza de desarrollo propio y compararlo con uno de la literatura en base a distintas métricas de performance.Discusión y conclusiones. El método propuesto por Daymont et al parece desempeñarse mejor en cuanto a la detección de mayor cantidad de registros erróneos (minimizando error de tipo I), mientras que el método propio muestra una menor proporción de falsos positivos, minimizando la pérdida de datos. En el futuro se experimentará con criterios de exclusión más restrictivos que los utilizados previamente, a fin de eliminar una mayor cantidad de datos erróneos.