BECAS
VRDOLJAK Juan Esteban
congresos y reuniones científicas
Título:
UNA COMPARACIÓN DE DISTINTOS MÉTODOS DE REDUCCIÓN DE DIMENSIONALIDAD EN MORFOMETRÍA GEOMÉTRICA
Autor/es:
JUAN ESTEBAN VRDOLJAK
Lugar:
Salta
Reunión:
Congreso; XXVII Reunión Científica Del Grupo Argentino de Bioestadística; 2023
Institución organizadora:
Universidad Nacional de Salta
Resumen:
Lamorfometría geométrica es una técnica multivariada para cuantificar formas. Suelenutilizarse métodos de reducción de dimensionalidad (RD), tanto no-supervisados,Análisis de Componentes Principales (PCA), como supervisados, AnálisisCanónicos (CVA), para exponer resultados o generar una nueva materia prima paraposteriores análisis. Las nuevas técnicas no-supervisadas de RD, como lasincrustaciones de vecinos estocásticas distribuidos en t (t-SNE) o laaproximación y proyección uniforme de variedades (UMAP), podrían contribuir ahallar patrones no informados. El objetivo del presente trabajo es compararestas técnicas en 4 conjuntos de datos anidados. Para esto, se cuantificó laconformación del ala de drosofilas mediante diez landmarks, obteniendo 20 dimensiones. Se analizaron cuatrofactores: Línea isogénica (anidado en especie, tres niveles), Especie (dosniveles), Sexo y Cactus de cría (dos niveles). Los conjuntos de datosanalizados fueron: 1- Línea isogénica; 2- se agrega Especie; 3- se agrega Sexoy sus interacciones; 4 se agrega Cactus de cría y sus interacciones. Paracuantificar el desempeño de cada método de RD, se utilizó un análisis deagrupamiento basado en modelos de mixturas gaussianas, se cuantificó el tamañodel efecto de cada una de estas variables y sus interacciones y se comparó laclasificación del análisis de agrupamiento con los factores con mayor tamañodel efecto mediante el índice de Rand ajustado. El CVA obtuvo el mayordesempeño en todos los conjuntos de datos. Analizando los métodos no-supervisados,UMAP obtuvo el mayor desempeño en los conjuntos de datos 1, 2 y 3, mientras t-SNEen el 4. La exploración de los datos que realizan estos nuevos métodos no-supervisadosde RD demostró ser un recurso importante cuando no tenemos información de lasvariables que pueden influir en la conformación de los organismos estudiados.Finalmente, se recomienda utilizar distintas metodologías de RD para una mejorexploración de los datos morfométricos.