CONICET | Buscador de Institutos y Recursos Humanos

La regresión es una de las tecnicas mas usadas para comparar predicciones realizadas con modelos y datos reales. Típicamente, esta alternativa se basa en analizar la dispersión del conjunto de datos y en la comparación de la pendiente del modelo de regresión con la recta 1:1. En la literatura observamos un número similar de artículos en los que la variable regresora es el valor predicho o el observado. Al parecer no existe un consenso al respecto. Nuestro objetivo fue analizar las diferencias entre ambos tipos de análisis y determinar su validez. Consideramos un modelo lineal simple. Realizamos simulaciones repetidas a partir de un vector A de valores del 1 al 30 y un vector B = A + ei (error aleatorio, media igual a 0, distribuciones normal y uniforme). En cada caso se estimaron los parámetros de la regresión b = b1 a + b2. Para cada valor de a se estimó un valor (b´) con el modelo, generando un vector de valores estimados B´. Luego evaluamos el modelo generando rectas de regresión entre B y B´, intercambiando la variables regresora e independiente. Como el modelo original fue generado a partir de B se espera que las pendientes de los modelos de evaluación sean iguales a 1. En las simulaciones observamos que la pendiente del modelo que considera a los valores predichos como variable explicatoria fue siempre igual a 1, mientras que en los otros fue siempre menor a uno. Es posible demostrar analíticamente el mismo resultado. La explicación principal está basada en el hecho que las rectas de regresión minimizan los desvíos en el sentido del eje de las ordenadas. En cambio, el valor de r2 de los dos análisis es el mismo, ya que incluye las co-varianzas en el sentido de ambos ejes. La evaluación de un modelo a nivel de las predicciones, debe entonces utilizar los valores observados como variable respuesta y los valores predichos como variable explicatoria.

enviar mensaje