3Anwendungsklassen

All great discoveries are made by mistake.

Young’s Law

Data Mining wird mit unterschiedlichen Zielen betrieben. Eine typische Situation ist, dass man eine große Datenmenge gegeben hat und zunächst gar nicht weiß, wonach man sucht. Ein erster Schritt ist dann, Gruppen von ähnlichen Objekten zu bilden. Dies ist Clustering (Abschnitt 3.1). Hat man solche Cluster gefunden, so werden diese mit Namen versehen: man bildet Klassen. Liegen die Daten bereits klassifiziert vor – beispielsweise Kundendaten mit einer Einordnung in schlechte, gute oder sehr gute Kunden – so sucht man nach Techniken, die für neue Kunden eine Vorhersage liefern, ob es sich um schlechte, gute oder sehr gute Kunden handeln wird. Mit diesem Problem befassen sich ...

Get Data Mining, 2nd Edition now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.