INVESTIGADORES
KUDRASZOW Nadia Laura
congresos y reuniones científicas
Título:
Datos atípicos y mal condicionamiento en el Analisis de Correlación Canónica Generalizado
Autor/es:
FASANO, MARÍA VICTORIA; ALEJANDRA VALERIA VAHNOVAN; FERRARIO, JULIETA; KUDRASZOW NADIA L.
Reunión:
Congreso; Reunión Anual de la Unión Matemática Argentina virtUMA 2021 Reunión de Comunicaciones Científicas; 2021
Institución organizadora:
Unión Matemática Argentina
Resumen:
El análisis de correlación canónica generalizado (ACCG) se utiliza para medir la asociación entre más de dos grupos de características observadas en los individuos de una población. [1] probó que la solución poblacional puede obtenerse mediante un algoritmo iterativo convergente basado en covarianzas y la inversa de la matriz de covarianzas de cada grupo. El método clásico de estimación reemplaza dichas covarianzas por sus versiones muestrales. Sin embargo, es bien sabido, que estas estimaciones son muy sensibles a la presencia de datos atípicos. Otro problema surge cuando alguna matriz de covarianzas muestral resulta mal condicionada, ya sea por colinealidad dentro del grupo, o debido a que la dimensión de la matriz es mayor que el tamañoo de la muestra. Como consecuencia, en [1] propusieron un estimador alternativo basado en regularización y covarianzas muestrales (ACCGR). Se presentará otro enfoque basado en estimaciones de matrices de precisión, como ser el método GLasso de [2], el cual puede ser robustificado tomando una matriz de covariazas robusta como estimador inicial como en [3]. Los algoritmos robustos son usados para desarrollar un método de detección de datos influyentes para el ACCG. Mediante un estudio de simulación para muestras finitas Gaussianas con matrices de covarianzas mal condicionadas, se mostrará el buen desempeño del método basado en estimaciones de matrices de precisión comparado con el ACCGR. El comportamiento de los algoritmos robustos versus los clásicos se estudiará para muestras finitas Gaussianas y contaminadas, en escenarios donde las matrices de covarianzas sean bien o malcondicionadas. Finalmente, se ilustrarán en un conjunto de datos reales las ventajas de los algoritmos robustos sobre los clásicos en presencia de datos atípicos.Referencias[1] Tenenhaus, A. and Tenenhaus, M. (2011). Regularized Generalized Canonical Correlation Analysis, Psychometrika, 76, 257-284.[2] Friedman H., Hastie T. y Tibshirani R. (2008), Sparse inverse covariance estimation with the graphical lasso. Biostatistics, 9, 432-441.[3] Ollerer, V. and Croux, C. (2015). Robust high-dimensional precision matrix estimation. In Modern Nonparametric, Robust and Multivariate Methods, Springer, 325–350.