INCITAP   20787
INSTITUTO DE CIENCIAS DE LA TIERRA Y AMBIENTALES DE LA PAMPA
Unidad Ejecutora - UE
congresos y reuniones científicas
Título:
Diferencias y similitudes entre el estadístico Hg y las distintas versiones del estadístico Cg para medir la bondad de la regresión logística
Autor/es:
SCHLAPS, ÉRICA; WAGNER, LAURA; MARTÍN, MARÍA CRISTINA; DIESER, MARÍA PAULA; SOLARO, CLAUDINA; BOLAÑOS, VANINA CELESTE; CAVERO, LORENA VERÓNICA; IRRIBARRA, MARÍA DE LOS ÁNGELES; TITIONIK, DIAMELA
Lugar:
Ciudad Autónoma de Buenos Aires
Reunión:
Congreso; 1° Congreso Argentino de Estadística (CAE I). XLIII Coloquio Argentino de Estadística. XX Reunión Científica del GAB; 2015
Institución organizadora:
OCIEDAD ARGENTINA DE ESTADÍSTICA -GRUPO ARGENTINO DE BIOMETRÍA
Resumen:
A efectos de comprobar cuan bien ajustan los valores predichos por un modelo de Regresión Logística a los valores observados, se debe medir la bondad de ajuste del modelo estimado. Existen en la literatura un considerable número de pruebas estadísticas con este fin. En las últimas dos décadas del siglo pasado, Hosmer y Lemeshow, entre otros autores, propusieron, desarrollaron y evaluaron una serie de pruebas estadísticas basadas en la agrupación de las observaciones según las probabilidades estimadas por el modelo, que se clasifican en orden ascendente y posteriormente se agrupan en ?deciles de riesgo" basados en el cálculo de ?cuantiles muestrales?. Los dos estadísticos más usados fueron denominados ?Cg" y ?Hg", siendo la diferencia fundamental entre uno y otro la forma de agrupar las probabilidades estimadas. El test propuesto usando Hg se basa en la formación de los grupos de acuerdo a unos puntos de corte, fijos y preestablecidos. Sin embargo, estámás extendido el uso del Cg pues está incluido en la mayoría de los programas estadísticos, pero su cálculo depende de la definición utilizada para determinar los cuantiles muestrales, dicho en otras palabras, el gran inconveniente de este estadístico es su dependencia en la elección de los puntos de corte. En este trabajo, utilizando la salida de software R, para diferentes conjuntos de datos reales en los que la Regresión Logística ajusta un modelo con distinto grado de aceptación, según el tipo de variables explicativas (cualitativas, cuantitativas o mixtas), se comparan Hg y los valores de Cg para nueve (9) posibles criterios de puntos de corte buscando poner de manifiesto las diferencias o similitudes entre ellos.