INVESTIGADORES
PRATTA Guillermo Raul
congresos y reuniones científicas
Título:
Análisis Factorial Múltiple Dual Mixto: propuesta metodológica y validación mediante una aplicación agronómica
Autor/es:
DEL MÉDICO, A.P.; VITELLESCHI, M.S.; GUILLERMO RAUL PRATTA; LAVALLE, A.
Lugar:
Montevideo (virtual)
Reunión:
Congreso; XIV Congreso Latinoamericano de Sociedades de Estadística, encuentro virtual; 2021
Institución organizadora:
Sociedades Latinoamericanas de Estadística
Resumen:
En contextos multivariados en los que se cuenta con variables cuantitativas y una partición delconjunto de individuos es posible aplicar la técnica de Análisis Factorial Múltiple Dual (AFMD)para estudiar analizar las estructuras de correlación entre de las variables inducidas por losgrupos de individuos. Sin embargo, esta metodología ha sido desarrollada para el caso en quelos conjuntos de individuos son evaluados por variables cuantitativas.Se propone una extensión de esta técnica que permita abordar el tratamiento de datos mixtoscuando existe una partición de los individuos: el Análisis Factorial Múltiple Dual Mixto(AFMDMix). El AFMDMix posibilita estudiar comparativamente y en forma simultánea, lasestructuras de asociación entre variables categóricas y las de correlación entre variablescualitativas, inducidas por los grupos de individuos.Con el objetivo de obtener una representación de los grupos de individuos a los que se lesmidieron variables cuantitativas y cualitativas se propone una extensión del AFMD paraabordar el tratamiento de datos mixtos cuando existe una partición del grupo de individuos:Análisis Factorial Múltiple Dual Mixto (AFMDMix).El arreglo de datos comprende varios grupos de individuos descriptos por un mismo conjuntode variables cuantitativas y categóricas. Se realiza un preprocesamiento de datos por grupo deindividuos. Las variables cuantitativas se estandarizan por grupo y luego se concatenan porvariable (matriz Z1). Para las variables categóricas se obtienen las tablas disyuntivas completasde cada grupo, las cuales posteriormente se ponderan y centran para luego concatenarlas através de las columnas (matriz Z2). Se construye la matriz Z que resulta de la yuxtaposición deZ1 y Z2 a través de los individuos.La estructura inicial de los datos corresponde a una o más matrices de individuos por variablescuantitativas y a una o más matrices de individuos por variables cualitativas. Se estandarizan yconcatenan a través de las variables las matrices de datos cuantitativos (Z1). Por otro lado, seobtienen las tablas disyuntivas completas a partir de las matrices de datos cualitativos, lascuales posteriormente se ponderan y centran para luego concatenarlas a través de lascolumnas (Z2). Se construye la matriz Z que resulta de la yuxtaposición de Z1 y Z2 a través delos individuos.Se realiza un ACP no normado sobre la matriz Z que permite obtener la configuración deindividuos y las variables y modalidades consenso. Luego, mediante proyecciones adecuadas,se obtienen las variables y modalidades parciales. De esta manera es posible analizar si laestructura de correlación o asociación entre variables, según corresponda, cambia de un grupode individuos a otro.Para validar la propuesta metodológica, se aplicó el AFMDMix sobre conjuntos de poblacionesde germoplasma nativo de quínoa (Chenopodium quinoa Willd.) del Noroeste Argentino, yaque estudios previos han informado que son altamente diversos en sus fenotipo según elambiente de origen. Por tal motivo, se tomaron dos muestras de germoplasma con diferentesorígenes -uno proveniente de Valles Secos y el otro de Valles de Altura- que habían sidoevaluados en base a variables morfológicas y agronómicas, 10 de ellas cuantitativas y cuatrocualitativas. El primer grupo estaba compuesto por cinco accesiones de quínoa mientras que elsegundo, por siete. Las dos primeras dimensiones del análisis efectuado explicaron el 66,10%de la variabilidad total de los datos. De la representación se las variables cuantitativas seobservó que, excepto para longitud de la hoja y del glomérulo, la estructura de correlación fuesimilar en ambos grupos, Valles Secos y Valles de Altura. En cambio, de la representación delas categorías de las variables categóricas cualitativas se observó que, excepto para la variableforma de la panoja (glomerulada o amarantiforme), la estructura de asociación difirió entre losdos grupos de variedades de quínoa estudiados. En este trabajo se logró, a través de unapropuesta original, abordar el tratamiento de datos mixtos cuando existe una partición delgrupo de individuos. Con este abordaje novedoso se pudieron comparar las estructuras de lasvariables cuantitativas y categóricas cualitativas inducidas por los grupos de accesiones dequínoa nativa del Noroeste Argentino provenientes de Valles Secos y Valles de Altura. Paracontinuar con la validación de la técnica desarrollada se prevé resultaría de interés, en futurostrabajos, comparar estos resultados con los obtenidos por los métodos aplicados hasta elmomento, como así también aplicar la técnica en otras especies analizando los resultadosobtenidos en distintos escenarios.