15.1 Uso de modelos de regresión para la previsión
¿Cuál es la diferencia entre la estimación de modelos para la evaluación de efectos causales y la previsión? Considere nuevamente el ejemplo simple de estimar el efecto casual de la proporción alumno-maestro en los puntajes de las pruebas presentado en el Capítulo 5.
library(AER)
data(CASchools)
$STR <- CASchools$students/CASchools$teachers
CASchools$score <- (CASchools$read + CASchools$math)/2
CASchools
<- lm(score ~ STR, data = CASchools)
mod
mod#>
#> Call:
#> lm(formula = score ~ STR, data = CASchools)
#>
#> Coefficients:
#> (Intercept) STR
#> 698.93 -2.28
Como se enfatizó en el Capítulo 7, la estimación del coeficiente de la razón alumno-maestro no tiene una interpretación causal debido al sesgo de la variable omitida. Sin embargo, en términos de decidir a qué escuela enviar a su hijo, podría ser atractivo para un padre usar mod para pronosticar los puntajes de las pruebas en los distritos escolares donde no existen datos públicos disponibles sobre los puntajes.
Como ejemplo, suponga que la clase promedio en un distrito tiene \(25\) estudiantes. Este no es un pronóstico perfecto, pero la siguiente serie puede ser útil para que los padres decidan.
predict(mod, newdata = data.frame("STR" = 25))
#> 1
#> 641.9377
En un contexto de series de tiempo, el padre podría usar datos sobre los puntajes de las pruebas del año presente y pasado para pronosticar los puntajes de las pruebas del próximo año, una aplicación típica para un modelo autorregresivo.