Kapitel 5. Datenvorverarbeitung
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Die Daten, die wir zum Trainieren unserer Machine-Learning-Modelle verwenden, werden oft in Formaten bereitgestellt, die unsere Machine-Learning-Modelle nicht verarbeiten können. In unserem Beispielprojekt ist ein Merkmal, das wir zum Trainieren unseres Modells verwenden wollen, nur als Ja- und Nein-Tag verfügbar. Jedes maschinelle Lernmodell benötigt eine numerische Darstellung dieser Werte (z. B. 1 und 0). In diesem Kapitel erklären wir dir, wie du Merkmale in konsistente numerische Darstellungen umwandelst, damit dein Machine Learning Modell mit den numerischen Darstellungen der Merkmale trainiert werden kann.
Ein wichtiger Aspekt, den wir in diesem Kapitel behandeln, ist die konsequente Vorverarbeitung. Wie in Abbildung 5-1 dargestellt, findet die Vorverarbeitung nach der Datenvalidierung statt, die wir in Kapitel 4 besprochen haben. TensorFlow Transform (TFT), die TFX-Komponente für die Datenvorverarbeitung, ermöglicht es uns, unsere Vorverarbeitungsschritte als TensorFlow-Graphen zu erstellen. In den folgenden Abschnitten werden wir erörtern, warum und wann dies ein guter Workflow ist und wie wir die Vorverarbeitungsschritte exportieren. In Kapitel 6 werden wir die vorverarbeiteten Datensätze und den erhaltenen Transformationsgraphen verwenden, um unser maschinelles Lernmodell zu trainieren bzw. zu exportieren. ...
Get Aufbau von Pipelines für maschinelles Lernen now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.