KAPITEL 4

Numerische Daten verarbeiten

4.0Einführung

Quantitative Daten gehen auf Messungen zurück – ob es sich um Klassengrößen, monatliche Umsätze oder Schulnoten handelt. Naturgemäß drückt man diese Quantitäten numerisch aus (z.B. 29 Schüler, 529.392 Euro Umsatz usw.). In diesem Kapitel behandeln wir zahlreiche Strategien, um rohe numerische Daten in Merkmale zu überführen, die auf Algorithmen für maschinelles Lernen zugeschnitten sind.

4.1Ein Merkmal neu skalieren

Problem

Die Werte eines numerischen Merkmals sollen zwischen zwei Werten skaliert werden.

Lösung

Mit der MinMaxScaler-Implementierung der Bibliothek scikit-learn lässt sich ein Merkmalsarray skalieren:

# Bibliotheken laden

import numpy as np

from sklearn import preprocessing

Get Machine Learning Kochbuch now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.