Kapitel 15. K-Nächste Nachbarn
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
15.0 Einleitung
Der KNN-Klassifikator (k-nearest neighbors) ist einer der einfachsten, aber am häufigsten verwendeten Klassifikatoren im überwachten maschinellen Lernen. KNN wird oft als fauler Lerner bezeichnet; er trainiert technisch gesehen kein Modell, um Vorhersagen zu treffen. Stattdessen wird vorausgesagt, dass eine Beobachtung derselben Klasse angehört wie der größte Anteil der k nächstgelegenen Beobachtungen.
Wenn zum Beispiel eine Beobachtung mit einer unbekannten Klasse von einer Beobachtung der Klasse 1 umgeben ist, dann wird die Beobachtung als Klasse 1 klassifiziert. In diesem Kapitel werden wir uns ansehen, wie man mit scikit-learn einen KNN-Klassifikator erstellt und verwendet.
15.1 Suche nach den nächsten Nachbarn einer Beobachtung
Problem
Du musst die k nächstgelegenen Beobachtungen (Nachbarn) einer Beobachtung von finden.
Lösung
Verwende scikit-learn's NearestNeighbors
:
# Load libraries
from
sklearn
import
datasets
from
sklearn.neighbors
import
NearestNeighbors
from
sklearn.preprocessing
import
StandardScaler
# Load data
iris
=
datasets
.
load_iris
()
features
=
iris
.
data
# Create standardizer
standardizer
=
StandardScaler
()
# Standardize features
features_standardized
=
standardizer
.
fit_transform
(
features
)
# Two nearest neighbors
nearest_neighbors
=
NearestNeighbors
(
n_neighbors
=
2
)
.
fit
(
features_standardized ...
Get Maschinelles Lernen mit Python Kochbuch, 2. now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.