SINC(I)   25518
INSTITUTO DE INVESTIGACION EN SEÑALES, SISTEMAS E INTELIGENCIA COMPUTACIONAL
Unidad Ejecutora - UE
congresos y reuniones científicas
Título:
Desbalance de datos en términos de atributos protegidos: análisis de su impacto en un clasificador lineal
Autor/es:
ECHEVESTE, RODRIGO; PETERSON, VICTORIA; ESCALAS, EUGENIA; FERRANTE, ENZO
Lugar:
(online)
Reunión:
Workshop; Workshop ASAI 2020. SIMPOSIO ARGENTINO DE INTELIGENCIA ARTIFICIAL (JAIIO); 2020
Resumen:
Abstract. En este trabajo se busca estudiar el impacto del desbalanceen los datos utilizados para entrenar un clasificador lineal, centrandoel anáfisis en atributos protegidos. Dichos atributos, tales como género,grupo étnico o edad, no constituyen la clase objetivo del clasificador,sino que corresponden a. características demográficas que pueden ser o noparte del problema a. resolver. Los resultados obtenidos mediante experimentos sintéticos simples muestran que la exactitud sobre una poblacióndada se deteriora cuando se encuentra subrepresentada en el conjuntode datos de entrenamiento. En todos los casos, el rendimiento del clasificador sobre la población completa es máximo cuando este conjunto dedatos se encuentra balanceado en lo que respecta, a. atributos protegidos.Estas conclusiones son el primer paso de un trabajo que busca mostrarcómo puede atenuarse este inconveniente incorporando penalizantes quedesincentiven un aumento de la exactitud sobre un subconjunto de lapoblación en desmedro de otra.