INVESTIGADORES
MILONE Diego Humberto
congresos y reuniones científicas
Título:
Impacto del desbalance de género en la detección de patologías en imágenes médicas mediante redes neuronales profundas
Autor/es:
VICTORIA PETERSON; NICOLÁS NIETO; AGOSTINA LARRAZABAL; MAXIMILIANO FERNANDEZ; ENZO FERRANTE; DIEGO MILONE
Lugar:
Santa Fe
Reunión:
Congreso; Congreso Internacional de Género en Ciencia, Tecnología e Innovación; 2019
Institución organizadora:
Provincia de Santa Fe, Universiadades
Resumen:
Introducción. En la actualidad, los algoritmos basados en inteligencia artificial (IA) para la clasificación de imágenes se encuentran presentes en nuestra vida cotidiana. Redes sociales, teléfonos móviles e incluso los equipos de captura de imágenes médicas ya incluyen este tipo de tecnologías para identificación de rostros o asistencia al diagnóstico de enfermedades. Recientemente se ha mostrado que dichos algoritmos pueden presentar un sesgo en su proceso de aprendizaje cuando las bases de datos utilizadas para su entrenamiento no son cuidadosamente diseñadas [1]. El aprendizaje con datos desbalanceados (donde determinadas poblaciones se encuentran sub-representadas) suele resultar en un proceso de clasificación sesgado, con alta tasa de error de clasificación en grupos minoritarios. En particular, en este trabajo nos centraremos en el análisis del desbalance de género en bases de datos de imágenes médicas, donde un algoritmo de IA para detección automática de enfermedades es entrenado mayoritariamente con imágenes de pacientes de género masculino, pero evaluado en pacientes del género femenino.Métodos. Se utilizará una base de datos pública de radiografías torácicas compuesta por más de 100.000 imágenes de pacientes sanos y enfermos, incluyendo 8 patologías (neumonía, cardiomegalia, neumotórax, entre otras) [2], con su correspondiente información demográfica. Se utilizarán redes neuronales convolucionales [3] entrenadas para distinguir entre pacientes sanos y patológicos, considerando distintos desbalances de género en la base de datos. Dicho desbalance incluirá datos de entrenamiento compuestos sólo por imágenes de pacientes auto-percibidos como género masculino, femenino o bien una mezcla de ambos en distintas proporciones. El objetivo será evaluar el rendimiento en dichos casos, para comprender el potencial impacto que conlleva el entrenamiento de algoritmos de IA usando bases de datos desbalanceadas. Nótese que aquí utilizamos una base de datos pública acotada, construída por el National Institute of Health (NIH) de los Estados Unidos, en la cual el género reportado por los participantes ha sido restringido al binarismo masculino/femenino.Resultados y conclusiones. Se espera que la caracterización obtenida en este trabajo sirva para concientizar a la comunidad de IA sobre la relevancia del diseño balanceado de bases de datos de entrenamiento para la asistencia al diagnóstico médico. En el futuro, se pretenden desarrollar soluciones algorítmicas que permitan mitigar el impacto de dicho desbalance, con el objetivo de construir algoritmos con menor sesgo y concebidos desde una perspectiva de género.