# adjuntar los paquetes `dplyr` y `readr`
# use `read_csv()` para importar el conjunto de datos y asignar los datos a `Titanic_2`
# obtener una descripción general de los datos y soltar `Name`
# cambiar los nombres de las columnas
# adjuntar el paquete `corrplot`
# comprobar correlaciones usando `corrplot()`
# adjuntar los paquetes `dplyr` y `readr`
library(readr)
library(dplyr)
# use `read_csv()` para importar el conjunto de datos y asignar los datos a `Titanic_2`
Titanic_2 <- read_csv("https://stanford.io/2O9RUCF")
# obtener una descripción general de los datos y soltar `Name`
summary(Titanic_2)
# o
str(Titanic_2)
# o
head(Titanic_2)
Titanic_2 <- Titanic_2[, -3]
# cambiar los nombres de las columnas
colnames(Titanic_2) <- c("Survived", "Class", "Sex", "Age", "Siblings", "Parents", "Fare")
# adjuntar el paquete `corrplot`
library(corrplot)
# comprobar correlaciones usando `corrplot()`
corrplot(cor(select_if(Titanic_2, is.numeric)))
# (la correlación más alta es entre `fare` y `class` de pasajero)
test_object("Titanic_2")
test_or({
test_function("summary", args = "object")
},{
test_function("head", args = "x")
},{
test_function("str", args = "object")
})
test_function("library")
test_function("corrplot", args = "corr")
success_msg("Correcto. Como era de esperar, la correlación más alta (-0.55) se encuentra entre Fare y Class, por lo que la colinealidad no es un problema aquí.")