Anhang. Arten von Datenqualitätsproblemen
Dieser Anhang enthält zusätzliche Informationen über die Arten von Datenqualitätsproblemen, die in der realen Welt häufig vorkommen. Diese Liste ist hilfreich, wenn du die Lösung zur Überwachung der Datenqualität auswählst, die du bauen oder kaufen willst. Letztendlich solltest du eine Strategie haben, wie du diese Arten von Problemen für jeden wichtigen Datensatz in deinem Unternehmen identifizierst und behebst.
Für jedes dieser Datenqualitätsprobleme geben wir ein Beispiel, eine Zusammenfassung der häufigsten Ursachen, eine Einschätzung, wie sich diese Probleme typischerweise auf die Analytik (Nutzung von Daten und Menschen zur Entscheidungsfindung) und das maschinelle Lernen (Nutzung von Daten und Algorithmen zur Automatisierung von Prozessen) auswirken, und unsere Empfehlungen, wie man eine Datenquelle am besten auf diese Probleme hin überwacht.
Wie Abbildung A-1 zeigt, haben wir die Probleme in diesem Anhang in vier große Kategorien eingeteilt, die angeben, auf welcher Ebene die Probleme die Daten betreffen.
Tabellenausgaben
Probleme, die die gesamte Tabelle betreffen und sich nicht auf einzelne Zeilen oder Werte beziehen:
- Verspätete Ankunft
-
Wenn Daten verspätet eintreffen und einem konsumierenden System nicht zur Verfügung stehen, wenn es ...
Get Die Überwachung der Datenqualität automatisieren now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.