Kapitel 12. Pipelines Teil 2: Kubeflow Pipelines

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

In Kapitel 11 haben wir die Orchestrierung unserer Pipelines mit Apache Beam und Apache Airflow besprochen. Diese beiden Orchestrierungstools haben einige große Vorteile: Apache Beam ist einfach einzurichten, und Apache Airflow wird häufig für andere ETL-Aufgaben eingesetzt.

In diesem Kapitel wollen wir die Orchestrierung unserer Pipelines mit Kubeflow Pipelines besprechen. Mit Kubeflow Pipelines können wir Aufgaben des maschinellen Lernens in Kubernetes-Clustern ausführen, was eine hoch skalierbare Pipeline-Lösung ermöglicht. Wie in Kapitel 11 beschrieben und in Abbildung 12-1 dargestellt, kümmert sich unser Orchestrierungswerkzeug um die Koordination zwischen den Pipeline-Komponenten.

Pipeline Orchestrators
Abbildung 12-1. Pipeline-Orchestratoren

Die Einrichtung von Kubeflow Pipelines ist komplexer als die Installation von Apache Airflow oder Apache Beam. Aber wie wir später in diesem Kapitel besprechen werden, bietet es großartige Funktionen, darunter den Pipeline Lineage Browser, die TensorBoard-Integration und die Möglichkeit, TFDV- und TFMA-Visualisierungen anzuzeigen. Außerdem nutzt es die Vorteile von Kubernetes, wie z. B. die automatische Skalierung von Computation Pods, persistentes Volumen, Ressourcenanfragen ...

Get Aufbau von Pipelines für maschinelles Lernen now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.