INVESTIGADORES
GARCIA ARANCIBIA Rodrigo
congresos y reuniones científicas
Título:
Reducción Suficiente de dimensiones para datos ordinales
Autor/es:
LILIANA FORZANI; RODRIGO GARCÍA ARANCIBIA; PAMELA LLOP; DIEGO TOMASSI
Lugar:
San Luis
Reunión:
Congreso; LXIII Reunión Anual de la Unión Matemática Argentina; 2014
Institución organizadora:
Unión Matemática Argentina - Universidad Nacional de San Luis
Resumen:
La mayora de los metodos actuales de reduccion su ciente de dimensiones suponenque los predictores son variables aleatorias continuas[4]. En muchos problemasde interes, sin embargo, las variables intervinientes no son continuas sino ordinales.Un ejemplo son los sistemas de recomendacion como los usados por Amazon,Netix, o Tripadvisor, que usan como predictores las puntuaciones dadas por distintosusuarios. Problemas de este tipo tambien son comunes en las ciencias sociales,cuando los datos se adquieren a traves de encuestas. Las estrategias de reducciondimensional usadas comunmente con este tipo de predictores son variantes de latecnica clasica de analisis de componentes principales, adaptadas para variables ordinales[5]. Bajo estos metodos subyace la suposicion de que una variable ordinal esuna discretizacion de una variable latente con distribucion normal. En este trabajose recoge esta idea, extendiendo al contexto de datos ordinales los metodos de reduccion su ciente de dimensiones basados en suposiciones de normalidad [2, 1]. Adiferencia de las variantes discretas del analisis de componentes principales, la metodologa propuesta tiene como objetivo explcito la preservacion de la dependenciafuncional entre los predictores y la respuesta en problemas supervisados con variablesordinales. Se presenta un estimador de maxima verosimilitud para la reduccionsin perdida de informacion en este tipo de problemas, su implementacion a travesde un algoritmo tipo EM [3] y una version regularizada para permitir seleccionsimultanea de variables. Experiencias numericas con datos simulados y con basesde datos reales ilustran el desempe~no de la metodologa propuesta, comparada conel de tecnicas de uso actual para datos ordinales.