CIEM   05476
CENTRO DE INVESTIGACION Y ESTUDIOS DE MATEMATICA
Unidad Ejecutora - UE
congresos y reuniones científicas
Título:
Clasificación y agrupamiento de datos mediante estimación de densidades
Autor/es:
AGNELLI J.P., CADEIRAS M., TABAK E.G., TURNER C.V. AND VANDEN-EIJNDEN E.
Lugar:
Universidad Nacional de Mar del Plata
Reunión:
Congreso; Reunión Anual de la Unión Matemática Argentina; 2009
Institución organizadora:
UMA- Universidad Nacional de Mar del Plata
Resumen:
Una nueva metodología destinada a los procesos de clasificación y agrupamiento de datos es presentada. En particular, aquí se aplica para la clasificación de distintos tipos de tumores usando como base de datos expresiones genéticas. La metodolgía está basada en tres pilares fundamentales: 1) la eliminación de una distinción estricta entre datos de entrenamiento y datos de prueba, mediante una asignación de estos últimos a las distintas clases, en un espíritu del algoritmo E-M; 2) un procedimento para la estimación de densidades que mapea la distribución original en una distribución gausiana isotrópica; y 3) una medida de la capacidad de agrupamiento de un conjunto de variables, la cual deriva en un procedimiento para la elección de variables. Esta metodología resulta particularmente útil en situaciones donde hay relativamente muy pocas observaciones de un fenómeno que es despcripto por medio de una gran de cantidad de variables, y del cual no se tiene un conocimiento a priori que permita asociar un subconjunto de estas variables para realizar la clasificación requerida.