11.5 Los supuestos de regresión de efectos fijos y los errores estándar para la regresión de efectos fijos

Esta sección se centra en el modelo de efectos fijos de la entidad y presenta los supuestos del modelo que deben cumplirse para que MCO produzca estimaciones insesgadas que normalmente se distribuyen en muestras grandes. Estos supuestos son una extensión de los supuestos hechos para el modelo de regresión múltiple (ver Concepto clave 6.4) y se dan en el Concepto clave 10.3. También se discuten brevemente los errores estándar en los modelos de efectos fijos que difieren de los errores estándar en la regresión múltiple, ya que el error de regresión puede exhibir una correlación serial en los modelos de panel.

Concepto clave 10.3

Los supuestos de regresión de efectos fijos

En el modelo de efectos fijos \[ Y_{it} = \beta_1 X_{it} + \alpha_i + u_{it} \ \ , \ \ i=1,\dots,n, \ t=1,\dots,T, \] se asume lo siguiente:

El término de error \(u_{it}\) tiene una media condicional cero; es decir, \(E(u_{it}|X_{i1}, X_{i2},\dots, X_{iT})\).
\((X_{i1}, X_{i2}, \dots, X_{i3}, u_{i1}, \dots, u_{iT})\), \(i=1,\dots,n\) son i.i.d. extraidas de su distribución conjunta.
Los valores atípicos grandes son poco probables; es decir, \((X_{it}, u_{it})\) tienen cuartos momentos finitos distintos de cero.
No existe una multicolinealidad perfecta.

Cuando existen varios regresores, \(X_{it}\) se reemplaza por \(X_{1,it}, X_{2,it}, \dots, X_{k,it}\).

La primera suposición es que el error no está correlacionado con todas las observaciones de la variable \(X\) para la entidad \(i\) a lo largo del tiempo. Si se viola este supuesto, se enfrenta al sesgo de las variables omitidas. El segundo supuesto asegura que las variables sean i.i.d. en entidades \(i=1,\dots,n\). Esto no requiere que las observaciones no estén correlacionadas dentro de una entidad. Los \(X_{it}\) pueden estar autocorrelacionados dentro de las entidades. Ésta es una propiedad común de los datos de series de tiempo. Lo mismo se permite para los errores \(u_{it}\). Consulte el Capítulo 11.5 para obtener una explicación detallada de por qué la autocorrelación es plausible en aplicaciones de panel. El segundo supuesto se justifica si las entidades se seleccionan mediante muestreo aleatorio simple. Los supuestos tercero y cuarto son análogos a los supuestos de regresión múltiple realizados en el Concepto clave 6.4.

Errores estándar para regresión de efectos fijos

Al igual que para la heterocedasticidad, la autocorrelación invalida las fórmulas de error estándar habituales, así como los errores estándar robustos a la heterocedasticidad, ya que estos se derivan bajo el supuesto de que no hay autocorrelación. Cuando existe heterocedasticidad y autocorrelación, es necesario utilizar los llamados errores estándar de heterocedasticidad y autocorrelación consistente (HAC). Los errores estándar agrupados pertenecen a este tipo de errores estándar. Permiten heterocedasticidad y errores autocorrelacionados dentro de una entidad, pero no correlación entre entidades.

Como se muestra en los ejemplos a lo largo de este capítulo, es bastante fácil especificar el uso de errores estándar agrupados en resúmenes de regresión producidos por funciones como coeftest() junto con vcovHC() del paquete sandwich. Convenientemente, vcovHC() reconoce los objetos del modelo de panel (objetos de la clase plm) y calcula los errores estándar agrupados de forma predeterminada.

Las regresiones realizadas en este capítulo son un buen ejemplo de por qué el uso de errores estándar agrupados es crucial en aplicaciones empíricas de modelos de efectos fijos. Por ejemplo, considere el modelo de efectos fijos de entidad y tiempo para fatalidades. Dado que fatal_tefe_lm_mod es un objeto de la clase lm, coeftest() no calcula los errores estándar agrupados, sino que utiliza errores estándar robustos que solo son válidos en ausencia de errores autocorrelacionados.

# comprobar la clase del objeto modelo
class(fatal_tefe_lm_mod)
#> [1] "lm"

# obtener un resumen basado en errores estándar robustos a heterocedasticidad
# (sin ajuste solo por heterocedasticidad)
coeftest(fatal_tefe_lm_mod, vcov = vcovHC, type = "HC1")[1, ]
#>   Estimate Std. Error    t value   Pr(>|t|) 
#> -0.6399800  0.2547149 -2.5125346  0.0125470

# comprobar la clase del objeto modelo (plm)
class(fatal_tefe_mod)
#> [1] "plm"        "panelmodel"

# obtener un resumen basado en los errores estándar de clusterd
# (ajuste por autocorrelación + heterocedasticidad)
coeftest(fatal_tefe_mod, vcov = vcovHC, type = "HC1")
#> 
#> t test of coefficients:
#> 
#>         Estimate Std. Error t value Pr(>|t|)  
#> beertax -0.63998    0.35015 -1.8277  0.06865 .
#> ---
#> Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Los resultados difieren bastante: Al no imponer autocorrelación, se obtiene un error estándar de \(0.25\) que implica una significancia de \(\hat\beta_1\), el coeficiente de \(\text{Impuesto a la cerveza}\) al nivel de \(5\%\). Por el contrario, usar el error estándar agrupado \(0.35\) conduce a la aceptación de la hipótesis \(H_0: \beta_1 = 0\) en el mismo nivel, ver ecuación (11.8).