Capítulo 15. Vecinos más próximos K
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
15.0 Introducción
El clasificador k-próximos vecinos (KNN) es uno de los clasificadores más sencillos pero más utilizados en el aprendizaje automático supervisado. KNN se considera a menudo un aprendiz perezoso; técnicamente no entrena un modelo para hacer predicciones. En su lugar, se predice que una observación es de la misma clase que la de la mayor proporción de las k observaciones más cercanas.
Por ejemplo, si una observación de clase desconocida está rodeada por una observación de clase 1, entonces la observación se clasifica como clase 1. En este capítulo exploraremos cómo utilizar scikit-learn para crear y utilizar un clasificador KNN.
15.1 Encontrar los vecinos más próximos de una observación
Problema
Necesitas encontrar las k observaciones más cercanas (vecinas) de una observación de .
Solución
Utiliza NearestNeighbors
de scikit-learn:
# Load libraries
from
sklearn
import
datasets
from
sklearn.neighbors
import
NearestNeighbors
from
sklearn.preprocessing
import
StandardScaler
# Load data
iris
=
datasets
.
load_iris
()
features
=
iris
.
data
# Create standardizer
standardizer
=
StandardScaler
()
# Standardize features
features_standardized
=
standardizer
.
fit_transform
(
features
)
# Two nearest neighbors
nearest_neighbors
=
NearestNeighbors
(
n_neighbors
=
2
)
.
fit
(
features_standardized
)
# Create an observation
new_observation ...
Get Recetario de Aprendizaje Automático con Python, 2ª Edición now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.