8.1 Pruebas de hipótesis e intervalos de confianza para un coeficiente único

Primero se discute cómo calcular errores estándar, cómo probar hipótesis y cómo construir intervalos de confianza para un coeficiente de regresión único \(\beta_j\) en un modelo de regresión múltiple. La idea básica se resume en el Concepto clave 7.1.

Concepto clave 7.1

Probando la hipótesis \(\beta_j = \beta_{j,0}\)
Contra la alternativa \(\beta_j \neq \beta_{j,0}\)

  1. Calcular el error estándar de \(\hat{\beta_j}\)
  2. Calcular el estadístico \(t\): \[t^{act} = \frac{\hat{\beta}_j - \beta_{j,0}} {SE(\hat{\beta_j})}\]
  3. Calcular el valor de \(p\): \[p\text{-value} = 2 \Phi(-|t^{act}|)\]

donde \(t^{act}\) es el valor del estadístico \(t\) realmente calculada. Rechazar la hipótesis en el nivel de significancia de \(5\%\) si el valor de \(p\) es menor que \(0.05\) o, de manera equivalente, si \(|t^{act}| > 1.96\).

El error estándar y (típicamente) el estadístico \(t\) y el valor \(p\) correspondiente para probar \(\beta_j = 0\) se calculan automáticamente mediante las adecuadas funciones en R; por ejemplo, summary.

La prueba de una sola hipótesis sobre la importancia de un coeficiente en el modelo de regresión múltiple procede como en el modelo de regresión simple.

Puede ver esto fácilmente inspeccionando el resumen de coeficientes del modelo de regresión.

\[ TestScore = \beta_0 + \beta_1 \times size \beta_2 \times english + u \]

ya discutido en el Capítulo 7. Repasando esto:


model <- lm(score ~ size + english, data = CASchools)
coeftest(model, vcov. = vcovHC, type = "HC1")
#> 
#> t test of coefficients:
#> 
#>               Estimate Std. Error  t value Pr(>|t|)    
#> (Intercept) 686.032245   8.728225  78.5993  < 2e-16 ***
#> size         -1.101296   0.432847  -2.5443  0.01131 *  
#> english      -0.649777   0.031032 -20.9391  < 2e-16 ***
#> ---
#> Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Se puede comprobar que estas cantidades se calculan como en el modelo de regresión simple calculando los estadísticos de \(t\) o los valores de \(p\) a mano utilizando la salida anterior y R como calculadora.

Por ejemplo, utilizando la definición del valor \(p\) para una prueba de dos lados como se da en el Concepto clave 7.1, se puede confirmar el valor \(p\) para una prueba sobre la hipótesis de que el coeficiente \(\beta_1\), el coeficiente de size, es aproximadamente cero.

# calcular el valor p de dos colas
2 * (1 - pt(abs(coeftest(model, vcov. = vcovHC, type = "HC1")[2, 3]),
            df = model$df.residual))
#> [1] 0.01130921

Concepto clave 7.2

Intervalos de confianza para un coeficiente único en regresión múltiple

Un intervalo de confianza bilateral de \(95\%\) para el coeficiente \(\beta_j\) es un intervalo que contiene el valor verdadero de \(\beta_j\) con una probabilidad de \(95\%\); es decir, contiene el valor real de \(\beta_j\) en \(95\%\) de todas las muestras repetidas. De manera equivalente, es el conjunto de valores de \(\beta_j\) que no puede ser rechazado por una prueba de hipótesis de dos caras de \(5\%\). Cuando el tamaño de la muestra es grande, el intervalo de confianza de \(95\%\) para \(\beta_j\) es

\[\left[\hat{\beta_j}- 1.96 \times SE(\hat{\beta}_j), \hat{\beta_j} + 1.96 \times SE(\hat{\beta_j})\right].\]