INVESTIGADORES
BENITEZ-VIEYRA Santiago Miguel
congresos y reuniones científicas
Título:
Agrupamientos basados en mixturas finitas gaussianas: impacto de la dimensionalidad y el tamaño de muestra en datos simulados de morfometría geométrica
Autor/es:
VRDOLJAK, J.; ARES, F.; BENITEZ-VIEYRA, S.
Lugar:
Buenos Aires
Reunión:
Congreso; XXVIII Reunión Científica del Grupo Argentino de Bioestadística; 2024
Resumen:
Lastécnicas de agrupamientos basados en modelos de mixturas finitasgaussianas son de las técnicas para estudiar regularidades máspopular para datos continuos mientras que la morfometría geométricaes una herramienta útil para cuantificar formas de manera continua ymuy precisa. Estudiar regularidades en un contexto de altadimensionalidad como el que presenta la morfometría geométrica esun impedimento para los métodos de agrupamiento basados en modelos,por lo que suele reducirse el conjunto de datos a unas pocasdimensiones. El objetivo del presente trabajo es poner a prueba eldesempeño de los agrupamientos basados en modelos de mixturasfinitas gaussianas frente a distintas dimensiones originales ytamaños de muestra con datos simulados de morfometría geométrica.Para ello, simulamos datos con distinta cantidad de dimensiones (20,50, 100, 200, 400, 800) y tamaño de muestra (10, 50, 100, 200, 400,1000) alrededor de dos medias poblacionales. A cada conjunto de datosse le redujo la dimensionalidad mediante Análisis de ComponentesPrincipales, reteniendo no menos de tres dimensiones, no más de diezni más del 90% de la variación total. En cada simulación se estimóel desempeño a partir de la cantidad de agrupamientos (k) que mejorajustaron a los datos y el índice de Rand (ajustado) a partir de laclasificación obtenida para k=2. Se obtuvo un muy bajo desempeñocon diez muestras indistintamentede la cantidad de dimensiones. Asimismo, los valores extremos dedimensiones (20, 400 y 800) mostraron un desempeño moderado a bajo.Finalmente, recomendamos utilizar una cantidad moderada deinformación (entre 50 y 200 dimensiones) previo a la reducción dedimensionalidad, en conjunto con un tamaño de muestra no menor a 50,para la obtención de resultados que representen la información delos datos de morfometría geométrica mediante agrupamientos basadosen modelos de mixturas finitas gaussianas.p { line-height: 115%; text-align: left; orphans: 2; widows: 2; margin-bottom: 0.25cm; direction: ltr; background: transparent }p.cjk { so-language: en-US }a:link { color: #0000ff; text-decoration: underline }p { line-height: 115%; text-align: left; orphans: 2; widows: 2; margin-bottom: 0.25cm; direction: ltr; background: transparent }p.cjk { so-language: en-US }a:link { color: #0000ff; text-decoration: underline }

