Capítulo 15. Vecinos más próximos K

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

15.0 Introducción

El clasificador k-próximos vecinos (KNN) es uno de los clasificadores más sencillos pero más utilizados en el aprendizaje automático supervisado. KNN se considera a menudo un aprendiz perezoso; técnicamente no entrena un modelo para hacer predicciones. En su lugar, se predice que una observación es de la misma clase que la de la mayor proporción de las k observaciones más cercanas.

Por ejemplo, si una observación de clase desconocida está rodeada por una observación de clase 1, entonces la observación se clasifica como clase 1. En este capítulo exploraremos cómo utilizar scikit-learn para crear y utilizar un clasificador KNN.

15.1 Encontrar los vecinos más próximos de una observación

Problema

Necesitas encontrar las k observaciones más cercanas (vecinas) de una observación de .

Solución

Utiliza NearestNeighbors de scikit-learn:

# Load libraries
from sklearn import datasets
from sklearn.neighbors import NearestNeighbors
from sklearn.preprocessing import StandardScaler

# Load data
iris = datasets.load_iris()
features = iris.data

# Create standardizer
standardizer = StandardScaler()

# Standardize features
features_standardized = standardizer.fit_transform(features)

# Two nearest neighbors
nearest_neighbors = NearestNeighbors(n_neighbors=2).fit(features_standardized)

# Create an observation
new_observation ...

Get Recetario de Aprendizaje Automático con Python, 2ª Edición now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.