1.5 Una breve historia de R

Como se señaló anteriormente, el sistema de computación estadística y gráficos R (R Development Core Team 2021b, http://www.R-project.org/) es un proyecto de software de código abierto. La historia comienza en Bell Laboratories (de AT&T, ahora Alcatel-Lucent en Nueva Jersey), con el lenguaje S, un sistema de análisis de datos desarrollado por John Chambers, Rick Becker y colaboradores desde finales de la década de 1970. En este caso, Landmarks of the development of S (Hitos del desarrollo de S) son una serie de libros, a los que se hace referencia por color en la comunidad S:

  1. Se comienza con el “libro marrón” (Becker y Chambers 1984), que presenta “Old S.”
  2. La referencia básica para “New S,” o la versión 2 de S, es Becker, Chambers y Wilks (1988). Se conoce como el “libro azul.”
  3. Para la versión 3 de S (programación orientada a objetos de primera generación y modelado estadístico), la referencia es Chambers y Hastie (1992). Se conoce como el “libro blanco.”
  4. Para la versión 4 de S (Chambers 1998). Se conoce como el “libro verde.”

El “libro verde” está fundamentado en las distintas versiones de S, Insightful Corporation (anteriormente MathSoft y aún antes Statistical Sciences) ha proporcionado una versión comercialmente mejorada y respaldada de S, llamado S-PLUS, desde 1987. En esencia, esto incluye la original implementación de S, que fue licenciada exclusivamente por primera vez y finalmente comprada en 2004. El 23 de marzo de 1999, la Association for Computing Machinery (ACM) nombró a John Chambers como el destinatario de su premio 1998 Software System Award por desarrollar el sistema S, señalando que su trabajo:

“Alterará para siempre la forma en que las personas analizan, visualizan y manipulan los datos.”

R en sí mismo fue desarrollado inicialmente por Robert Gentleman y Ross Ihaka en la Universidad de Auckland, Nueva Zelanda. Sus inventores describen una versión temprana en un artículo (Ihaka y Gentleman 1996). Diseñaron el idioma para combinar las fortalezas de dos idiomas existentes, S y Scheme (Steel y Sussman 1975). En palabras de Ihaka y Gentleman (1996):

“[El] lenguaje resultante es muy similar en apariencia a S, pero la implementación subyacente y la semántica se derivan de Scheme.”

El resultado fue bautizado como R:

“En parte para reconocer la influencia de S y en parte para celebrar [sus] propios esfuerzos.”

El código fuente de R fue lanzado por primera vez bajo la Licencia Pública General (LPG) de GNU (General Public License (GPL) de GNU) en 1995. Desde mediados de 1997, ha existido el Equipo Central de Desarrollo R (R Development Core Team), que actualmente consta de 19 miembros y sus nombres están disponibles al escribir la función contributors() en una sesión normal de R. En 1998 se estableció la Red Completa de Archivos R (Comprehensive R Archive Network o CRAN), que es una familia de sitios espejo en todo el mundo que almacenan versiones idénticas y actualizadas de código y documentación para R.

El primer lanzamiento oficial fue la versión 1.0.0 de R, con fecha de 2000-02-29, que implementa el software S3 según lo documentado por Chambers y Hastie (1992). La versión 2.0.0 de R se lanzó en 2004. La versión 2.7.0 del lenguaje R, puede verse como una implementación S4 (Chambers 1998) con numerosos conceptos que van más allá de los diversos estándares de S.

La primera publicación de R en la literatura de econometría parece haber sido por Cribari-Neto y Zarkos (1999), una revisión de software en el Journal of Applied Econometrics titulado “R: Yet Another Econometric Programming Environment” (“R: Otro entorno más de programación econométrica”). El artículo describe la versión 0.63.1 de R, en ese entonces todavía era una versión beta. Tres años más tarde, en una revisión de software adicional en la misma revista, Racine y Hyndman (2002) se centraron en el uso de R para enseñar econometría utilizando la versión 1.3.1 de R. Hasta donde se sabe, este curso es la primera introducción general a la Econoalgoritmia en R: Creación e implementación de algoritmos computacionales en economía aplicada haciendo uso de herramientas y métodos propios de la econometría y ciencia de datos.