ISISTAN   23985
INSTITUTO SUPERIOR DE INGENIERIA DEL SOFTWARE
Unidad Ejecutora - UE
congresos y reuniones científicas
Título:
Clasificación multi-etiqueta utilizando computación distribuida
Autor/es:
JUAN MANUEL RODRIGUEZ; ALEJANDRO ZUNINO; DANIELA GODOY; CRISTIAN MATEOS
Lugar:
Bariloche
Reunión:
Congreso; 2014 IEEE Biennial Congress of Argentina (ARGENCON); 2014
Institución organizadora:
IEEE Argentina
Resumen:
Las técnicas de clasificación multi-etiqueta fueron desarrolladas para problemas donde los objetos pueden estar asociados a distintas etiquetas disjuntas, por ejemplo las áreas de un artículo científico. Sin embargo, estas técnicas pueden ser computacionalmente costosas, lo que dificulta su aplicabilidad en dominios reales. Este artículo presenta un enfoque para acelerar el algoritmo de clasificación multi-etiqueta llamado Binary Relevance. En este algoritmo, la complejidad de crear un modelo de clasificación crece linealmente con el número de etiquetas que pueden ser asignadas a una instancia a clasificar. Este artículo propone entonces un enfoque para utilizar pequeños clusters de computadoras para gestionar el cómputo de la fase de entrenamiento del clasificador. El enfoque fue probado con 7 conjuntos de datos de entrenamiento con 81 etiquetas asociadas y más de un cuarto de millón de instancias para entrenar el clasificador. Los resultados mostraron que se aceleró de manera lineal el tiempo de entrenamiento a medida que se agregaban nodos computacionales al cluster.