Kapitel 5. Feature Engineering

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Im Jahr 2014 hieß es in dem Papier "Practical Lessons from Predicting Clicks on Ads at Facebook", dass die richtigen Merkmale das Wichtigste bei der Entwicklung von ML-Modellen sind. Seitdem haben viele der Unternehmen, mit denen ich zusammengearbeitet habe, immer wieder festgestellt, dass die richtigen Merkmale, sobald sie ein brauchbares Modell haben, im Vergleich zu cleveren algorithmischen Techniken wie dem Hyperparameter-Tuning den größten Leistungsschub bringen. Modernste Modellarchitekturen können immer noch schlecht abschneiden, wenn sie nicht die richtigen Merkmale verwenden.

Aufgrund ihrer Bedeutung besteht ein großer Teil vieler ML-Engineering- und Data-Science-Aufträge darin, neue nützliche Funktionen zu entwickeln. In diesem Kapitel gehen wir auf gängige Techniken und wichtige Überlegungen zum Feature Engineering ein. In einem eigenen Abschnitt gehen wir auf ein subtiles, aber verhängnisvolles Problem ein, das viele ML-Systeme in der Produktion zum Scheitern gebracht hat: Datenlecks und wie man sie erkennt und vermeidet.

Am Ende des Kapitels werden wir besprechen, wie man gute Merkmale entwickelt und dabei sowohl die Bedeutung als auch die Verallgemeinerung von Merkmalen berücksichtigt. Wenn man von Feature Engineering spricht, denken manche Leute vielleicht an Feature Stores. Da Feature Stores näher an ...

Get Maschinelle Lernsysteme entwerfen now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.