Kapitel 19. Clustering

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

19.0 Einleitung

Im Großteil dieses Buches haben wir uns mit überwachtem maschinellem Lernen befasst - also mit Fällen, in denen uns sowohl die Merkmale als auch das Ziel zur Verfügung stehen. Das ist leider nicht immer der Fall. Häufig stoßen wir auf Situationen, in denen wir nur die Merkmale kennen. Stell dir zum Beispiel vor, wir haben Aufzeichnungen über die Verkäufe eines Lebensmittelgeschäfts und wollen die Verkäufe danach aufschlüsseln, ob der Käufer Mitglied in einem Rabattclub ist. Das wäre mit überwachtem Lernen unmöglich, weil wir kein Ziel haben, um unsere Modelle zu trainieren und zu bewerten. Es gibt jedoch eine andere Möglichkeit: unbeaufsichtigtes Lernen . Wenn das Verhalten von Discountclub-Mitgliedern und Nicht-Mitgliedern im Supermarkt tatsächlich unterschiedlich ist, dann ist der durchschnittliche Unterschied im Verhalten zwischen zwei Mitgliedern kleiner als der durchschnittliche Unterschied im Verhalten zwischen einem Mitglied und einem Nicht-Mitglied. Anders ausgedrückt: Es wird zwei Gruppen von Beobachtungen geben.

Das Ziel von Clustering-Algorithmen ist es, diese latenten Gruppierungen von Beobachtungen zu identifizieren, die es uns ermöglichen, die Klasse der Beobachtungen auch ohne einen Zielvektor vorherzusagen, wenn dies gut gelingt. Es gibt viele Clustering-Algorithmen, und sie haben eine große ...

Get Maschinelles Lernen mit Python Kochbuch, 2. now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.