10.5 Ejercicios
1. Estudio de simulación: especificación incorrecta de la forma funcional
Como se indicó en el Capítulo 10.2, la especificación incorrecta de la función de regresión viola el supuesto 1 del Concepto clave 6.3, por lo que el estimador MCO estará sesgado e inconsistente. Se ha ilustrado el sesgo de \(\hat{\beta}_0\) para el ejemplo de la función de regresión poblacional cuadrática
\[Y_i = X_i^2 \]
y el modelo lineal \[Y_i = \beta_0 + \beta_1 X_i + u_i, \, u_i \sim \mathcal{N}(0,1)\] usando 100 observaciones generadas aleatoriamente. Estrictamente hablando, este hallazgo podría ser solo una coincidencia porque se considera solo una estimación obtenida usando un solo conjunto de datos.
En este ejercicio, se debe generar evidencia de simulación para el sesgo de \(\hat{\beta}_0\) en el modelo \[Y_i = \beta_0 + \beta_1 X_i + u_i\] si la función de regresión de la población es \[Y_i = X_i^2.\]
Instrucciones:
Asegúrese de utilizar las definiciones sugeridas en el código esqueleto en script.R para completar las siguientes tareas:
Genere 1000 estimaciones de MCO de \(\beta_0\) en el modelo anterior utilizando un bucle for() donde \(X_i \sim \mathcal{U}[-5,5]\), \(u_i \sim \mathcal{N}(0,1)\) usando muestras de tamaño \(100\). Guardar las estimaciones en beta_hats.
Comparar la media muestral de las estimaciones con el parámetro verdadero utilizando el operador ==.
Sugerencia:
- Puede generar números aleatorios a partir de una distribución uniforme utilizando runif().
2. Estudio de simulación: Sesgo de errores en variables
Considere nuevamente la aplicación del modelo clásico de error de medición presentado en el Capítulo 10.2:
El regresor único \(X_i\) se mide con error de modo que en su lugar se observa \(\overset{\sim}{X}_i\). Por tanto, se estima \(\beta_1\) en
\[\begin{align*} Y_i =& \, \beta_0 + \beta_1 \overset{\sim}{X}_i + \underbrace{\beta_1 (X_i -\overset{\sim}{X}_i) + u_i}_{=v_i} \\ Y_i =& \, \beta_0 + \beta_1 \overset{\sim}{X}_i + v_i \end{align*}\]
en lugar de
\[Y_i = \beta_0 + \beta_1 X_i + u_i,\]
con el error medio cero \(w_i\) no correlacionado con \(X_i\) y \(u_i\). Entonces \(\beta_1\) es estimado de manera inconsistente por MCO:
\[\begin{equation} \widehat{\beta}_1 \xrightarrow{p}{\frac{\sigma_{X}^2}{\sigma_{X}^2 + \sigma_{w}^2}} \beta_1 \end{equation}\]
Deje
\[(X, Y) \sim \mathcal{N}\left[\begin{pmatrix}50\\ 100\end{pmatrix},\begin{pmatrix}10 & 5 \\ 5 & 10 \end{pmatrix}\right].\]
Recuerde de (10.2) que \(E(Y_i\vert X_i) = 75 + 0.5 X_i\) en este caso. Además, suponga que \(\overset{\sim}{X_i} = X_i + w_i\) con \(w_i \overset{i.i.d}{\sim} \mathcal{N}(0,10)\).
Como se mencionó en el ejercicio 1, el capítulo 10.2 analiza las consecuencias del error de medición para el estimador de MCO de \(\beta_1\) en este entorno basado en una única muestra y, por lo tanto, una sola estimación. Estrictamente hablando, la conclusión obtenida podría ser incorrecta porque el sesgo observado puede deberse a una variación aleatoria. Una simulación de Monto Carlo es más apropiada aquí.
Instrucciones:
Muestre que \(\beta_1\) se estima con un sesgo utilizando un estudio de simulación. Asegúrese de utilizar las definiciones sugeridas en el código esqueleto en script.R para completar las siguientes tareas:
Generar 1000 estimaciones de \(\beta_1\) en el modelo de regresión simple \[Y_i = \beta_0 + \beta_1 X_i + u_i.\] Usar rmvnorm() para generar muestras de 100 observaciones aleatorias de la distribución normal bivariada indicada anteriormente.
Guardar las estimaciones en beta_hats.
Calcular la media muestral de las estimaciones.