13.3 Comprobación de la validez del instrumento
Relevancia del instrumento
Los instrumentos que explican poca variación en el regresor endógeno \(X\) se denominan instrumentos débiles. Los instrumentos débiles proporcionan poca información sobre la variación en \(X\) que es aprovechada por la regresión VI para estimar el efecto de interés: La estimación del coeficiente sobre el regresor endógeno se estima de manera inexacta. Además, los instrumentos débiles hacen que la distribución del estimador se desvíe considerablemente de una distribución normal incluso en muestras grandes, de modo que los métodos habituales para obtener inferencias sobre el coeficiente verdadero en \(X\) pueden producir resultados erróneos.
Concepto clave 12.5
Una regla general para comprobar si hay instrumentos débiles
Considere el caso de un solo regresor endógeno \(X\) y \(m\) instrumentos \(Z_1,\dots,Z_m\). Si los coeficientes de todos los instrumentos en la regresión de la primera etapa de la población de una estimación MC2E son cero, los instrumentos no explican ninguna de las variaciones en el \(X\) que claramente viola el supuesto 1 del Concepto clave 12.2. Si bien es poco probable que este último caso se encuentre en la práctica, se debería preguntar “en qué medida” debe cumplirse el supuesto de pertinencia del instrumento.
Si bien esto es difícil de responder para la regresión VI general, en el caso de un regresor endógeno único \(X\) uno puede usar la siguiente regla empírica:
Calcular el estadístico \(F\) que corresponde a la hipótesis de que los coeficientes en \(Z_1,\dots,Z_m\) son todos cero en la regresión de la primera etapa. Si el estadístico \(F\) es menor que \(10\), los instrumentos son débiles de tal manera que la estimación MC2E del coeficiente en \(X\) está sesgada y no se puede hacer una inferencia estadística válida sobre su valor real.
La regla general del Concepto clave 12.5 se implementa fácilmente en R. Ejecute la regresión de la primera etapa usando lm() y luego calcule el estadístico \(F\) robusto a la heterocedasticidad mediante linearHypothesis(). Esto es parte de la aplicación a la demanda de cigarrillos discutida en el Capítulo 13.4.
Si los instrumentos son débiles
Existen dos formas de proceder si los instrumentos son débiles:
Desechar los instrumentos débiles y/o buscar instrumentos más fuertes. Mientras que lo primero es solo una opción si los coeficientes desconocidos permanecen identificados cuando se descartan los instrumentos débiles, lo segundo puede ser muy difícil e incluso puede requerir un rediseño de todo el estudio.
Seguir con los instrumentos débiles pero usando métodos que mejoren el MC2E en este escenario; por ejemplo, estimación de máxima verosimilitud de información limitada.
Cuando se infringe la suposición de exogeneidad del instrumento
Si hay correlación entre un instrumento y el término de error, la regresión VI no es consistente. La prueba de restricciones de sobreidentificación (también llamada prueba \(J\)) es un enfoque para probar la hipótesis de que los instrumentos adicionales son exógenos. Para que la prueba \(J\) sea aplicable es necesario que haya más instrumentos que regresores endógenos. La prueba \(J\) se resume en el Concepto clave 12.5.
Concepto clave 12.6
Estadístico \(J\) / Prueba de sobreidentificación de restricciones
Tome \(\widehat{u}_i^{MC2E} \ , \ i = 1,\dots,n\), los residuos de la estimación MC2E del modelo de regresión general VI (13.5). Ejecute la regresión MCO.
\[\begin{align} \widehat{u}_i^{MC2E} =& \, \delta_0 + \delta_1 Z_{1i} + \dots + \delta_m Z_{mi} + \delta_{m+1} W_{1i} + \dots + \delta_{m+r} W_{ri} + e_i \tag{13.9} \end{align}\]
y probar la hipótesis conjunta \[H_0: \delta_1 = 0, \dots, \delta_{m} = 0\] que establece que todos los instrumentos son exógenos. Esto se puede hacer usando el estadístico \(F\) correspondiente calculando \[J = mF.\] Esta prueba es la prueba de restricciones de sobreidentificación y la estadística se llama estadístico \(J\) con \[J \sim \chi^2_{m-k}\] en muestras grandes bajo la hipótesis nula y el supuesto de homocedasticidad. Los grados de libertad \(m-k\) indican el grado de sobreidentificación, ya que este es el número de instrumentos \(m\) menos el número de regresores endógenos \(k\).
Es importante notar que el estadístico \(J\) discutido en el Concepto clave 12.6 solo está distribuido en \(\chi^2_{m-k}\) cuando el término de error \(e_i\) en la regresión (13.9) es homoscedástico. Una discusión del estadístico \(J\) robusto a la heterocedasticidad está más allá del alcance de este capítulo.
En cuanto al procedimiento que se muestra en el Concepto clave 12.6, la aplicación en la siguiente sección muestra cómo aplicar la prueba \(J\) usando linearHypothesis().