Kapitel 24. Erweiterte Analytik und maschinelles Lernen - Überblick

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Unter haben wir bisher eher allgemeine Datenfluss-APIs behandelt. In diesem Teil des Buches werden wir tiefer in einige der spezifischeren erweiterten Analyse-APIs eintauchen, die in Spark verfügbar sind. Neben umfangreichen SQL-Analysen und Streaming bietet Spark auch Unterstützung für Statistik, maschinelles Lernen und Graph-Analysen. Diese umfassen eine Reihe von Arbeitslasten, die wir als fortgeschrittene Analysen bezeichnen werden. Dieser Teil des Buches befasst sich mit den fortgeschrittenen Analysewerkzeugen in Spark, darunter:

  • Vorverarbeitung deiner Daten (Datenbereinigung und Feature Engineering)

  • Überwachtes Lernen

  • Empfehlung Lernen

  • Unüberwachte Motoren

  • Grafik-Analysen

  • Deep Learning

Dieses Kapitel bietet einen grundlegenden Überblick über erweiterte Analysen, einige Anwendungsbeispiele und einen grundlegenden Workflow für erweiterte Analysen. Dann stellen wir dir die oben genannten Analysetools vor und zeigen dir, wie du sie anwenden kannst.

Warnung

Dieses Buch ist nicht dazu gedacht, dir alles beizubringen, was du über maschinelles Lernen wissen musst, und zwar von Grund auf. Wir werden nicht auf strenge mathematische Definitionen und Formulierungen eingehen - nicht, weil es nicht wichtig wäre, sondern weil es einfach zu viele Informationen sind, um sie aufzunehmen. ...

Get Spark: Der endgültige Leitfaden now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.