Kapitel 7. Ein Modell-Workflow

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

In Kapitel 6 haben wir das Paketparsnip besprochen, das zur Definition und Anpassung des Modells verwendet werden kann. In diesem Kapitel wird ein neues Konzept eingeführt: der Modell-Workflow. Der Zweck dieses Konzepts (und des dazugehörigen tidymodels workflow() Objekts) ist es, die wichtigsten Teile des Modellierungsprozesses zu kapseln (wie in Kapitel 1 beschrieben). Der Workflow ist in zweierlei Hinsicht wichtig. Erstens fördert die Verwendung eines Workflow-Konzepts eine gute Methodik, da es einen einzigen Einstiegspunkt für die Schätzungskomponenten einer Datenanalyse darstellt. Zweitens ermöglicht er dem Nutzer, Projekte besser zu organisieren. Auf diese beiden Punkte wird in den folgenden Abschnitten eingegangen.

Wo fängt das Modell an und wo hört es auf?

Wenn wir bisher den Begriff "Modell" verwendet haben, meinten wir eine strukturelle Gleichung, die einige Prädiktoren mit einem oder mehreren Ergebnissen in Beziehung setzt. Betrachten wir noch einmal die lineare Regression als Beispiel. Die Ergebnisdaten werden als $y_i$ bezeichnet, wobei es i = 1 ... n Stichproben in der Trainingsmenge. Angenommen, es gibt p Prädiktoren x i1 , ... , x ip die in dem Modell verwendet werden. Die lineare Regression ergibt die folgende Modellgleichung:

y ^ i = β ^ 0 + β ^ 1 x i1 + ... + β ^ p x ip

Get Aufgeräumtes Modellieren mit R now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.