BECAS
LOPEZ Sabrina Laura
congresos y reuniones científicas
Título:
Ciencia de datos con R con impacto en salud pública. Una experiencia de uso de tidyverse para la detección de embarazos
Autor/es:
LOPEZ SABRINA LAURA; MENGONI GOÑALONS, CAROLINA; NANTON, MARÍA CRISTINA; RODRÍGUEZ TABLADO, MANUEL
Reunión:
Conferencia; LatinR 2021. Conferencia Latinoamericana sobre Uso de R en Investigación + Desarrollo; 2021
Resumen:
La implementación de una historia clínica electrónica en el sistema de salud pública de la Ciudad de Buenos Aires derivó en una base de un gran volumen de datos. No obstante, al ser una base transaccional cuyo objetivo es mejorar la atención de pacientes, el uso secundario de análisis de datos presenta un desafío por el tipo de datos registrados (semi-estructurados, incompletos, subjetivos). Al día de la fecha la historia clínica no cuenta con un módulo destinado a identificar y caracterizar embarazos. La detección de embarazos es de gran relevancia ya que facilita el acceso a derechos de la salud sexual y reproductiva, y permite destinar fondos para ello. Durante el 2021, integrantes del equipo de ciencia de datos de la Gerencia Operativa de Gestión de Información y Estadísticas en Salud del Ministerio de Salud de la Ciudad Autónoma de Buenos Aires ejecutaron un proyecto de mejora del proceso existente de detección de embarazos y de consolidación de una base específica con actualización periódica. Este proyecto fue llevado a cabo por un equipo interdisciplinario y desarrollado en el lenguaje R utilizando principalmente la librería tidyverse para la exploración, manipulación y visualización de datos masivos. El primer paso del proceso resultó novedoso ya que consistió en utilizar una nueva fuente de información, el sistema de admisión, pases y egresos sobre internaciones hospitalarias. Así, se integró esta información sobre eventos obstétricos a los registros obtenidos a partir de la historia clínica -mediante el uso de expresiones regulares de los campos de texto estructurado y texto libre-. Los siguientes pasos consistieron en la extracción y el cálculo de variables, la clasificación de cada registro, la discriminación entre embarazos de una misma persona y la caracterización de cada uno.El uso de tidyverse fue central para el éxito del proyecto, que se encuentra en una etapa de cierre y evaluación.