Capítulo 14. Árboles y bosques

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

14.0 Introducción

Los algoritmos de aprendizaje basados en árboles son una familia amplia y popular de métodos relacionados, no paramétricos y supervisados, tanto para la clasificación como para la regresión. La base de los aprendices basados en árboles es el árbol de decisión, en el que se encadenan una serie de reglas de decisión (por ejemplo, "Si la puntuación crediticia de una persona es superior a 720..."). El resultado se parece vagamente a un árbol invertido, con la primera regla de decisión en la parte superior y las reglas de decisión posteriores extendiéndose por debajo. En un árbol de decisión, cada regla de decisión se produce en un nodo de decisión, y la regla crea ramas que conducen a nuevos nodos. Una rama sin una regla de decisión al final se denomina hoja.

Una de las razones de la popularidad de los modelos basados en árboles es su interpretabilidad. De hecho, los árboles de decisión pueden dibujarse literalmente en su forma completa (ver Receta 14.3) para crear un modelo muy intuitivo. A partir de este sistema básico de árboles surge una gran variedad de extensiones, desde los bosques aleatorios hasta el apilamiento. En este capítulo veremos cómo entrenar, manejar, ajustar, visualizar y evaluar una serie de modelos basados en árboles.

14.1 Entrenar un clasificador de árbol de decisión

Problema

Necesitas entrenar ...

Get Recetario de Aprendizaje Automático con Python, 2ª Edición now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.