INVESTIGADORES
PETERSON Victoria
congresos y reuniones científicas
Título:
Desbalance de datos en términos de atributos protegidos: análisis de su impacto en un clasificador lineal
Autor/es:
ESCALAS EUGENIA; RODRIGO ECHEVESTE; VICTORIA PETERSON; ENZO FERRANTE
Reunión:
Simposio; XXI Simposio Argentino de Inteligencia Artificial (ASAI 2020); 2020
Institución organizadora:
SAIO
Resumen:
En este trabajo se busca estudiar el impacto del desbalanceen los datos utilizados para entrenar un clasificador lineal, centrandoel an´alisis en atributos protegidos. Dichos atributos, tales como g´enero,grupo ´etnico o edad, no constituyen la clase objetivo del clasificador,sino que corresponden a caracter´ısticas demogr´aficas que pueden ser o noparte del problema a resolver. Los resultados obtenidos mediante experimentos sint´eticos simples muestran que la exactitud sobre una poblaci´ondada se deteriora cuando se encuentra subrepresentada en el conjuntode datos de entrenamiento. En todos los casos, el rendimiento del clasificador sobre la poblaci´on completa es m´aximo cuando este conjunto dedatos se encuentra balanceado en lo que respecta a atributos protegidos.Estas conclusiones son el primer paso de un trabajo que busca mostrarc´omo puede atenuarse este inconveniente incorporando penalizantes quedesincentiven un aumento de la exactitud sobre un subconjunto de lapoblaci´on en desmedro de otra.