Capítulo 9. Capstone: R para el análisis de datos
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
En este capítulo, aplicaremos lo que hemos aprendido sobre análisis y visualización de datos en R para explorar y probar relaciones en el conjunto de datos familiar mpg. Aquí aprenderás un par de técnicas nuevas de R, incluyendo cómo realizar una prueba t y una regresión lineal. Empezaremos invocando los paquetes necesarios , leyendo mpg.csv de la subcarpeta mpg de la carpeta datasets del repositorio de libros, y seleccionando las columnas de interés. Hasta ahora no hemos utilizado tidymodels
en este libro, por lo que puede que necesites instalarlo.
library
(
tidyverse
)
library
(
psych
)
library
(
tidymodels
)
# Read in the data, select only the columns we need
mpg
<-
read_csv
(
'datasets/mpg/mpg.csv'
)
%>%
select
(
mpg
,
weight
,
horsepower
,
origin
,
cylinders
)
#> -- Column specification -----------------------------------------------------
#> cols(
#> mpg = col_double(),
#> cylinders = col_double(),
#> displacement = col_double(),
#> horsepower = col_double(),
#> weight = col_double(),
#> acceleration = col_double(),
#> model.year = col_double(),
#> origin = col_character(),
#> car.name = col_character()
#> )
head
(
mpg
)
#> # A tibble: 6 x 5
#> mpg weight horsepower origin cylinders
#> <dbl> <dbl> <dbl> <chr> <dbl>
#> 1 18 3504 130 USA 8
#> 2 15 3693 165 USA 8
#> 3 18 3436 150 USA 8
#> 4 16 3433 150 USA 8
#> 5 17 3449 140 USA ...
Get Avanzar en la Analítica now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.