14 Experimentos y cuasiexperimentos


Este capítulo analiza las herramientas estadísticas que se aplican comúnmente en la evaluación de programas, donde el interés radica en medir los efectos causales de programas, políticas u otras intervenciones. Un diseño de investigación óptimo para este propósito es lo que los estadísticos llaman un experimento controlado aleatorio ideal. La idea básica es asignar sujetos aleatoriamente a dos grupos diferentes, uno que recibe el tratamiento (el grupo de tratamiento) y otro que no (el grupo de control) y comparar los resultados de ambos grupos para obtener una estimación del efecto promedio del tratamiento.

Estos datos experimentales son fundamentalmente diferentes de los datos observacionales. Por ejemplo, se podría usar un experimento controlado aleatorio para medir cuánto difiere el desempeño de los estudiantes en una prueba estandarizada entre dos clases en las que una tiene una proporción de estudiantes por maestro “regular” y la otra tiene menos estudiantes. Los datos producidos por tal experimento sería diferente de, por ejemplo, los datos de sección transversal observados sobre el desempeño de los estudiantes utilizados en los Capítulos 5 a 9 donde los tamaños de las clases no se asignan al azar a los estudiantes, sino que son los resultados de una decisión económica donde se equilibraron los objetivos educativos y los aspectos presupuestarios.

Para los economistas, los experimentos controlados aleatorios a menudo son difíciles o incluso irrealizables de implementar. Por ejemplo, debido a razones éticas, morales y legales, es prácticamente imposible para el propietario de una empresa estimar el efecto causal sobre la productividad de los trabajadores de ponerlos bajo estrés psicológico mediante un experimento en el que los trabajadores se asignan aleatoriamente al grupo de tratamiento que se encuentra bajo presión de tiempo o al grupo de control donde el trabajo se realiza en condiciones regulares, en el mejor de los casos sin el conocimiento de estar en un experimento (ver el El efecto Hawthorne).

Sin embargo, a veces las circunstancias externas producen lo que se llama un cuasi-experimento o experimento natural. Esta aleatoriedad “si permite estimar los efectos causales” que son de interés para los economistas que utilizan herramientas muy similares a las válidas para experimentos controlados aleatorios ideales. Estas herramientas se basan en gran medida en la teoría de la regresión múltiple y también en la regresión IV (consulte el Capítulo 13). Se revisarán los aspectos centrales de estos métodos y se demostrará cómo aplicarlos en R utilizando el conjunto de datos STAR (consulte la descripción del conjunto de datos).

Los siguientes paquetes y sus dependencias son necesarias para la reproducción de los fragmentos de código presentados a lo largo de este capítulo:

Asegúrese de que el siguiente fragmento de código se ejecute sin errores.

if (!require('remotes')) install.packages('remotes')
remotes::install_github( "bquast/rddtools" )
library(AER)
library(dplyr)
library(MASS)
library(mvtnorm)
library(rddtools)
library(scales)
library(stargazer)
library(tidyr)

Referencias bibliográficas

Genz, Alan, Frank Bretz, Tetsuhisa Miwa, Xuefei Mi, and Torsten Hothorn. 2020. mvtnorm: Multivariate Normal and t Distributions (version 1.1-1). http://mvtnorm.R-forge.R-project.org.
Hlavac, Marek. 2018. stargazer: Well-Formatted Regression and Summary Statistics Tables (version 5.2.2). https://CRAN.R-project.org/package=stargazer.
Kleiber, Christian, and Achim Zeileis. 2020. AER: Applied Econometrics with R (version 1.2-9). https://CRAN.R-project.org/package=AER.
Ripley, Brian. 2021. MASS: Support Functions and Datasets for Venables and Ripley’s MASS (version 7.3-54). http://www.stats.ox.ac.uk/pub/MASS4/.
Stigler, Matthieu, and Bastiaan Quast. 2021. rddtools: Toolbox for Regression Discontinuity Design (RDD) (version 1.5.0). https://qua.st/rddtools/.
Wickham, Hadley. 2021. tidyr: Tidy Messy Data (version 1.1.3). https://CRAN.R-project.org/package=tidyr.
Wickham, Hadley, Romain François, Lionel Henry, and Kirill Müller. 2021. dplyr: A Grammar of Data Manipulation (version 1.0.6). https://CRAN.R-project.org/package=dplyr.
Wickham, Hadley, and Dana Seidel. 2020. scales: Scale Functions for Visualization (version 1.1.1). https://CRAN.R-project.org/package=scales.