Kapitel 9. Schlussstein: R für Datenanalyse

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

In diesem Kapitel wenden wir das, was wir über Datenanalyse und -visualisierung in R gelernt haben, an, um Beziehungen im bekannten mpg-Datensatz zu untersuchen und zu testen. Du lernst hier einige neue R-Techniken kennen, darunter die Durchführung eines t-Tests und einer linearen Regression. Wir beginnen damit, die notwendigen Pakete aufzurufen, die Datei mpg.csv aus dem Unterordner mpg des Ordners datasets des Book Repository einzulesen und die gewünschten Spalten auszuwählen. Bisher haben wir tidymodels in diesem Buch noch nicht verwendet, daher musst du es eventuell noch installieren.

library(tidyverse)
library(psych)
library(tidymodels)

# Read in the data, select only the columns we need
mpg <- read_csv('datasets/mpg/mpg.csv') %>%
  select(mpg, weight, horsepower, origin, cylinders)

#> -- Column specification -----------------------------------------------------
#> cols(
#>  mpg = col_double(),
#>  cylinders = col_double(),
#>  displacement = col_double(),
#>  horsepower = col_double(),
#>  weight = col_double(),
#>  acceleration = col_double(),
#>  model.year = col_double(),
#>  origin = col_character(),
#>  car.name = col_character()
#> )

head(mpg)
#> # A tibble: 6 x 5
#>     mpg weight horsepower origin cylinders
#>   <dbl>  <dbl>      <dbl> <chr>      <dbl>
#> 1    18   3504        130 USA            8
#> 2    15   3693        165 USA            8
#> 3 18 3436 150 ...

Get Vorstoß in die Analytik now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.