Kapitel 3. Grundlagen der Datentechnik

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Der Aufstieg von ML in den letzten Jahren ist eng mit dem Aufstieg von Big Data verbunden. Große Datensysteme, auch ohne ML, sind komplex. Wenn du nicht jahrelang mit ihnen gearbeitet hast, kannst du dich leicht in Akronymen verlieren. Es gibt viele Herausforderungen und mögliche Lösungen, die diese Systeme mit sich bringen. Industriestandards, wenn es denn welche gibt, entwickeln sich schnell weiter, wenn neue Tools auf den Markt kommen und sich die Bedürfnisse der Branche erweitern, wodurch eine dynamische und sich ständig verändernde Umgebung entsteht. Wenn du dir den Datenstapel verschiedener Technologieunternehmen ansiehst, könnte es so aussehen, als würde jedes sein eigenes Ding machen.

In diesem Kapitel befassen wir uns mit den Grundlagen des Data Engineering, die dir hoffentlich einen festen Stand geben, wenn du die Landschaft für deine eigenen Bedürfnisse erkundest. Wir beginnen mit den verschiedenen Datenquellen, mit denen du in einem typischen ML-Projekt arbeiten kannst. Danach werden wir die Formate besprechen, in denen die Daten gespeichert werden können. Das Speichern von Daten ist nur dann interessant, wenn du vorhast, diese Daten später wieder abzurufen. Um gespeicherte Daten abrufen zu können, musst du nicht nur wissen, wie sie formatiert sind, sondern auch, wie sie strukturiert sind. Datenmodelle ...

Get Maschinelle Lernsysteme entwerfen now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.