13.6 Ejercicios

1. Los datos de distancia de la universidad

Existen muchos estudios en economía laboral que tratan el tema de la estimación de las funciones de ingresos del capital humano que establecen cómo los ingresos salariales están determinados por la educación y la experiencia laboral. Un ejemplo destacado es Card (1993), que investiga el rendimiento económico de la educación y utiliza la proximidad a la universidad como variable instrumental.

Los ejercicios de este capítulo tratan con el conjunto de datos CollegeDistance que es similar a los datos utilizados por Card (1993). Proviene de una encuesta de graduados de preparatoria con variables codificadas como salario, educación, matrícula promedio y una serie de medidas socioeconómicas. El conjunto de datos también incluye la distancia desde una universidad mientras los participantes de la encuesta estaban en la escuela preparatoria. CollegeDistance viene con el paquete AER.

Instrucciones:

  • Adjuntar el paquete AER y cargar los datos de CollegeDistance.

  • Obtener una descripción general del conjunto de datos.

  • La variable distance (la distancia a la universidad de 4 años más cercana en 10 millas) servirá como instrumento en ejercicios posteriores. Utilizar un histograma para visualizar la distribución de distance.

Sugerencias:

  • Usar data() para adjuntar el conjunto de datos.

  • La función hist() se puede utilizar para generar histogramas.

2. El problema de la selección

Hacer una regresión de wage en education y las variables de control para estimar la función de ingresos del capital humano es problemático porque la educación no se asigna al azar entre los encuestados: Los individuos toman sus propias decisiones de educación y, por lo tanto, medir las diferencias de las ganancias entre individuos con diferentes niveles de educación dependen de cómo se tomen dichas decisiones. En la literatura, esto se conoce como un problema de selección. Este problema de selección implica que education es endógena por lo que la estimación de MCO estará sesgada y no se puede hacer una inferencia válida respecto al coeficiente verdadero.

En este ejercicio se pide estimar dos regresiones que no arrojan estimaciones confiables del coeficiente de educación debido al problema esbozado anteriormente. A continuación, se compararán los resultados con los obtenidos mediante el enfoque de variables instrumentales aplicado por Card (1993).

Se ha adjuntado el paquete AER. El conjunto de datos CollegeDistance está disponible en el entorno global.

Instrucciones:

  • Hacer una regresión del logaritmo de wage sobre education; es decir, estimar el modelo \[\log(wage_i) = \beta_0 + \beta_1 education_i + u_i\]. Guardar el resultado en wage_mod_1.

  • Aumentar el modelo incluyendo los regresores unemp, hispanic, af-am, female y urban. Guardar el resultado en wage_mod_2

  • Obtener resúmenes de los coeficientes estimados en ambos modelos.

3. Enfoques de regresión de variables instrumentales — I

El problema de selección discutido anteriormente hace que las estimaciones de regresión en el ejercicio 2 sean inverosímiles, por lo que Card (1993) sugiere una regresión de variables instrumentales que utiliza la distancia de la universidad como un instrumento para la educación.

¿Por qué utilizar la distancia universitaria como instrumento? La lógica detrás de esto es que la distancia de una universidad estará correlacionada con la decisión de obtener un título universitario (relevancia), pero es posible que no prediga los salarios aparte del aumento de la educación (exogeneidad), por lo que la proximidad a la universidad podría considerarse un instrumento válido (recuerde la definición de un instrumento válido indicado al comienzo del Capítulo ??).

Se ha adjuntado el paquete AER. El conjunto de datos CollegeDistance está disponible en el entorno global.

Instrucciones:

  • Calcular las correlaciones del instrumento distance con el regresor endógeno education y la variable dependiente wage.

  • ¿Qué proporción de la variación en education se explica por la regresión de la primera etapa que usa distance como regresor? Guardar el resultado en R2.

  • Repetir el ejercicio 2 con la regresión VI; es decir, utilizar distance como instrumento para education en ambas regresiones usando ivreg(). Guardar los resultados en wage_mod_iv1 y wage_mod_iv2. Obtenga resúmenes robustos de coeficientes para ambos modelos.

4. Enfoques de regresión de variables instrumentales — II

Convénzase usted mismo de que ivreg() funciona como se esperaba implementando el algoritmo MC2E presentado en el Concepto clave 12.2 para un solo instrumento, consulte el Capítulo 13.2.

Instrucciones:

  • Completar la función MC2E() de manera que implemente el estimador MC2E.

  • Usar MC2E() para reproducir las estimaciones de coeficientes obtenidas usando ivreg() para ambos modelos del ejercicio 3.

Sugerencias:

  • La finalización de la función se reduce a reemplazar el . . . con argumentos apropiados.

  • Además del conjunto de datos (data), la función espera la variable dependiente (Y), los regresores exógenos (W), los regresores endógenos (X) y un instrumento (Z) como argumentos. Todos estos deben ser de clase character.

  • Incluir W = NULL en el encabezado de la definición de función asegura que el conjunto de variables exógenas esté vacío, por defecto.

5. ¿Se debe confiar en los resultados?

Este no es un ejercicio de código real (no existen pruebas de corrección de envío para verificar su código). En su lugar, utilice el widget a continuación para comparar los resultados obtenidos usando las regresiones MCO del Ejercicio 2 con los de las regresiones VI del Ejercicio 3.

El conjunto de datos CollegeDistance y todos los objetos del modelo de los Ejercicios 2 y 3 están disponibles en el entorno global.

Instrucciones:

Convénzase de lo siguiente:

  1. Es probable que el sesgo del coeficiente estimado de education en el modelo de regresión simple wage_mod_1 sea sustancial porque el regresor es endógeno debido a la omisión de variables del modelo que se correlacionan con education e impactan los ingresos salariales.

  2. Debido al problema de selección descrito en el ejercicio 2, la estimación del coeficiente de interés no es confiable incluso en el modelo de regresión múltiple wage_mod_2 que incluye varias variables de control socioeconómico. El coeficiente de education no es significativo y su estimación es cercana a cero).

  3. Instrumentar la educación por la distancia de la universidad como se hizo en wage_mod_iv1 produce la estimación VI del coeficiente de interés. Sin embargo, el resultado no debe considerarse confiable porque este modelo simple probablemente adolece de sesgo de variables omitidas al igual que el modelo de regresión múltiple wage_mod_2 del Ejercicio 2, ver 1. Nuevamente, el coeficiente en education no es significativo, su estimación es bastante pequeña.

  4. En el modelo de regresión múltiple wage_mod_iv2, donde se incluyeron variables de control demográfico y se instrumenta education por distance ofrece la estimación más confiable del impacto de la educación sobre la renta salarial entre todos los modelos considerados. El coeficiente es muy significativo y la estimación es de aproximadamente \(0.067\). Siguiendo el Concepto clave 8.2, la interpretación es que se espera que un año adicional de escolaridad aumente los ingresos salariales en aproximadamente \(0.067 \cdot 100\% = 6.7\%\).

  5. ¿Es confiable la estimación del coeficiente de educación reportada por wage_mod_iv2? Esta pregunta no es fácil de responder. En cualquier caso, se debe tener en cuenta que utilizar un enfoque de variables instrumentales es problemático cuando el instrumento es débil. Este podría ser el caso aquí: Las familias con una fuerte preferencia por la educación pueden mudarse a vecindarios cercanos a las universidades. Además, los vecindarios cercanos a las universidades pueden tener mercados laborales más fuertes reflejados en ingresos más altos. Tales características invalidarían el instrumento, ya que introducen variables no observadas que influyen en los ingresos pero que no pueden ser capturadas por años de escolaridad, la medida de educación.

Referencias bibliográficas

Card, D. 1993. “Using Geographic Variation in College Proximity to Estimate the Return to Schooling.” National Bureau of Economic Research.