Kapitel 4. Concept-First Design für Datenprodukte

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Unter lernst du in diesem Kapitel eine neue und einfache Definition eines Datenprodukts kennen, die in vier Facetten beschrieben wird. Außerdem lernst du die Methode des Concept-First-Designs zur Erstellung von Datenprodukten kennen und verstehst ihre Beziehung zu Schemata.

Concept-first Design ist eine effektive Strategie, die nahtlos die Kommunikationskluft zwischen nicht-technischen Geschäftsteams und technischen Teams überbrückt. Dabei werden allgemein verständliche Werkzeuge wie Diagramme und Tabellen verwendet, um Ideen und Herausforderungen darzustellen.

Die Schönheit des Concept-First-Designs liegt in seiner Einfachheit. Man übersetzt die Geschäftssprache oder -logik in ein hierarchisches Format, ähnlich wie JSON und JSON Schema funktionieren - das sind digitale Sprachen, die Maschinen verstehen. Durch die Verwendung von Concept-First Design wird der Aufwand für die Umsetzung von Geschäftslogik in Code reduziert. Dadurch werden die Fehler und Ineffizienzen minimiert, die oft entstehen, wenn Entwickler und Datenverwalter bei der Konzeptmodellierung Annahmen treffen.

Stell dir ein Datenprodukt als eine Schachtel vor, die ein einziges Werkzeug enthält, komplett mit allem, was ein Nutzer braucht, um eine Aufgabe zu erfüllen. Stell dir vor, du kaufst einem Freund ein elektronisches Geschenk. Wenn dem Geschenk eine Batterie oder eine Anleitung fehlt, muss dein Freund nach den fehlenden Teilen suchen - eine frustrierende Erfahrung. Genau so musst du über Datenprodukte denken. Ein Datenprodukt sollte ein umfassendes Paket sein, das den Nutzern alles bietet, was sie brauchen, um die Daten effektiv zu nutzen. Das Ziel ist es, zu vermeiden, dass die Nutzer zusätzliche Komponenten suchen oder Elemente "reparieren" müssen, um die Daten nutzbar zu machen.

Der Konzeptansatz ist der Schlüssel zur Erstellung dieser umfassenden Datenprodukte. Dabei werden die Konzepte, die du aus den Gesprächen mit den Stakeholdern abgeleitet hast, in ein Pseudocode-Format übertragen. Dieses Format fungiert als Staffelstab, mit dem du die Konzepte an Datenexperten weitergeben kannst, die sie entsprechend den geschäftlichen Anforderungen deines Datenprodukts umsetzen. Concept-first design liefert eine übersichtliche Darstellung der Konzepte (entweder visuell oder in Textform), während ein Schema diese Konzepte mit Bedeutung und hierarchischen Strukturen formalisiert.

Tipp

Überleg mal: Wenn du fünf Stakeholder befragst und sie bittest, ein Problem und die damit verbundenen Konzepte zu beschreiben, wirst du wahrscheinlich fünf verschiedene Perspektiven erhalten. Wenn du sie jedoch bittest, ihre Definitionen in einer Pseudocode-Datenstruktur zu formalisieren, wirst du konkretere Übereinstimmungen und Abweichungen feststellen und die Lücken im gemeinsamen Verständnis der Problemkonzepte und Ziele aufdecken.

Der Begriff " datengesteuert" bezieht sich auf einen Ansatz, bei dem die Daten im Mittelpunkt des Entscheidungsprozesses stehen. Die Idee ist, dass alle Erkenntnisse, Strategien und Entscheidungen auf der Analyse und Interpretation von Daten beruhen und nicht nur auf Intuition oder persönlicher Erfahrung. Bei einem datengesteuerten Ansatz werden Daten als wichtiges Gut betrachtet, und die Systeme und Verfahren werden um sie herum entwickelt, um ihre Genauigkeit, Konsistenz und Verfügbarkeit zu gewährleisten.

Um datengesteuert zu werden, ist es wichtig, die Menschen mit den Konzepten vertraut zu machen, die die Daten darstellen sollen. Hier kommt das Concept-First Design ins Spiel. Beim Concept-first Design geht es darum, die Konzepte und ihre Beziehungen zu definieren, bevor sie in ein Datenmodell umgewandelt werden. Es beginnt damit, die Geschäftsanforderungen zu verstehen, die Schlüsselkonzepte zu definieren und sicherzustellen, dass alle Beteiligten ein gemeinsames Verständnis davon haben, was diese Konzepte darstellen, für wen und warum.

Diese Konzepte bilden die Grundlage für das Datenmodell und tragen dazu bei, dass es das reale Szenario, das es darstellen soll, genau widerspiegelt. Um ein konzeptorientiertes Design umzusetzen, müssen die Beteiligten diese Konzepte definieren, sie formal in Schemata strukturieren, dem verwendeten Vokabular eine Bedeutung zuweisen, etwaige Lücken identifizieren und gemeinsam daran arbeiten, das Verständnis aller Beteiligten anzugleichen. Auf diese Weise entsteht ein gemeinsames Verständnis, das den Bedürfnissen der Interessengruppen gerecht wird. Sobald dieses gemeinsame Verständnis erreicht ist, ist das Datenprodukt gut konzipiert und bereit für die Umsetzung.

Der Wandel zu einer datenzentrierten Organisation beginnt mit einem konzeptorientierten Designansatz, der eine Kultur fördert, in der Entscheidungen auf der Grundlage von Daten getroffen werden, was zu mehr Effizienz, besseren Erkenntnissen und fundierteren Entscheidungen führt. Dieses Kapitel ist dein Betriebshandbuch. Als Data Champion bist du das entscheidende Bindeglied zwischen den Stakeholdern des Unternehmens, den Daten und den Programmierteams. In Kapitel 5 werden wir uns mit den Details der Umsetzung befassen. Konzentrieren wir uns aber erst einmal auf deine Rolle bei der Erstellung eines überzeugenden und effektiven Datenprodukts.

Verpackungen und Produkte: Ein Beispiel mit Kaffee

Wie wir bereits festgestellt haben, sollten Daten als Produkt betrachtet werden. Um das zu verdeutlichen, verwenden wir ein reales Produkt, nämlich Kaffee, als Beispiel, wenn wir über Daten sprechen. Stell dir vor, du wärst ein handwerklich arbeitender Kaffeeproduzent. Dein Handwerk besteht darin, dass du die Kaffeesorten genau kennst und weißt, wie du die rohen Bohnen in ein köstliches Gebräu verwandelst. Du reist nach Kolumbien, einem der wichtigsten Kaffeeanbaugebiete der Welt, um die besten Bohnen zu besorgen und mit den Bauern vor Ort zusammenzuarbeiten, um optimale Ernte- und Verarbeitungsmethoden zu gewährleisten.

Du entscheidest dich für die Kleinserienröstung, um den Prozess genauestens zu kontrollieren und die Röstbedingungen so abzustimmen, dass das perfekte Geschmacksprofil erreicht wird. Im Gegensatz zu kommerziellen Großröstern sorgt dein persönlicher Ansatz für einen ausgeprägteren und feineren Geschmack. Jede Charge, selbst wenn sie von derselben Quelle stammt, erfordert einzigartige Anpassungen, die von Faktoren wie dem Alter der Bohnen und den Röstbedingungen abhängen.

Nach dem Rösten verpackst du deine Bohnen, um sie vor Sauerstoff und Licht zu schützen, und versiehst sie mit einem Etikett, auf dem der Markenname, die Kaffeesorte, der Röstgrad und andere relevante Informationen stehen. Du hoffst, dass du mit deiner verlockenden Mischung und der attraktiven Verpackung die Aufmerksamkeit potenzieller Käufer/innen auf dich ziehst.

In einem örtlichen Café entdeckt eine Frau - tagsüber Geschäftsführerin, nachts Mutter - deine Kaffeebohnen. Fasziniert von der handwerklichen Verpackung und in Erwartung eines langen Tages, an dem sie sich mit komplexen Finanzproblemen auseinandersetzen muss, beschließt sie, dass dein Kaffee ein guter Start in den Arbeitstag ist. Also kauft sie dein Produkt.

Sie würde den Kaffee nicht kaufen, wenn er nicht ordnungsgemäß gekennzeichnet wäre. Der Laden würde ihn auch nicht verkaufen, wenn er nicht den FDA-Vorschriften entspricht, zu denen eine klare Herkunftskennzeichnung gehört. Bevor der Kaffee also genossen werden kann, interagiert der Kunde mit der Verpackung.

Die Tüte gibt Auskunft über die Herkunft des Kaffees (Kolumbien), den Hersteller (dich, den handwerklichen Kaffeeproduzenten) und den Zweck des Produkts (die Lieferung von handwerklichem Bio-Kaffee mittlerer Röstung direkt von den Bauern). Außerdem enthält sie Nährwertangaben und eine Zutatenliste, eine standardisierte Struktur, die die Zusammensetzung des Produkts erklärt. Anhand des Barcodes auf der Tüte kann der Laden das gekaufte Produkt identifizieren und so jede Unklarheit über die Transaktion beseitigen. Erst nach diesen Interaktionen mit der Verpackung und dem Laden kann der Kunde das Produkt in der Tüte verwenden - deine köstlichen Kaffeebohnen.

In dieser Analogie symbolisieren die Kaffeebohnen die Daten. Der Unterschied zwischen Rohdaten und einem Datenprodukt liegt in den zusätzlichen Kontextelementen - wer, was, was, warum, wie und wo. Genauso wie eine Tüte Kaffeebohnen bestimmte Anforderungen erfüllen muss, bevor sie ins Regal gestellt und von einem Kunden gekauft werden darf, muss ein hochwertiges Datenprodukt ähnliche Standards erfüllen, damit ein Unternehmen es sicher verbreiten und nutzen kann. Lücken zwischen Daten und Datenprodukten führen oft zu Verschwendung und Ineffizienz im Datenmanagement von Unternehmen.

Die vier Facetten eines Datenprodukts

Ein Datenprodukt kapselt sowohl die Daten als auch ihre Verpackung in einem einzigen, in sich geschlossenen Objekt. Als Datenproduktmanager ist es deine Aufgabe, den Wert des Datenprodukts zu maximieren, der sich am Nutzen und an der Qualität der Nutzererfahrung für die Person, die mit den Daten arbeitet, sowie an seinem finanziellen Wert bemisst. Ein gut durchdachtes Datenprodukt hat klare Maßstäbe und Kennzahlen, ähnlich wie kommerzielle, kundenorientierte Produkte wie Abonnementdienste oder physische Waren.

Wenn ein Unternehmen seine Daten bereits zu Geld macht, indem es sie an andere Unternehmen verkauft, behandelt es seine Daten von Natur aus als Produkt. Die Betrachtung von Daten als Produkt ist jedoch noch wichtiger, wenn es um interne Kunden geht, nämlich die Beschäftigten des Unternehmens. Dieselben Grundsätze und bewährten Methoden, die für die Erstellung wertvoller, benutzerfreundlicher und geschäftsorientierter Datenprodukte für externe Kunden angewandt werden, sollten auch für Datenprodukte für den internen Gebrauch verwendet werden. Unabhängig davon, ob das Datenprodukt nach außen oder nach innen gerichtet ist, ist es immer noch ein Produkt des Unternehmens und sollte mit der gleichen Sorgfalt, Präzision und Qualität behandelt werden. Die Behandlung von Daten als Produkt ist nicht nur für externe Transaktionen wichtig, sondern auch für den internen Umgang mit Daten und die Entscheidungsfindung.

Das Nutzererlebnis mit einem Datenprodukt beginnt in dem Moment, in dem ein Nutzer darauf stößt. Wenn ein Nutzer eine CSV-Datei öffnet und Mühe hat, die Spaltennamen zu verstehen, ist das ein schlechtes Nutzererlebnis. Wir können das Nutzererlebnis mit Daten ähnlich messen wie ein Produktmanager die Benutzerfreundlichkeit eines Webformulars, einschließlich der benötigten Zeit, der Anzahl der Klicks und aller Probleme, die zu Abbrüchen oder verlorenen Chancen führen.

Als Datenproduktmanager/in ist es deine Aufgabe, fantastische Datenprodukte zu entwickeln. Qualitativ hochwertige, benutzerfreundliche und auf das Geschäft ausgerichtete Datenprodukte sparen Zeit, schaffen Vertrauen und sind für die Unternehmensziele optimiert. Sie sind zweifelsohne ein wertvolles Gut für dein Unternehmen.

Wenn dein Datenprodukt jedoch nicht ein in sich geschlossenes Objekt ist, ist es unvollständig und von minderer Qualität. Abbildung 4-1 zeigt die vier Facetten eines gut gestalteten Datenprodukts, das wie ein physisches Produkt die Dimensionen umfasst, die nötig sind, um Mehrdeutigkeiten zu minimieren und Wissenslücken und blinde Flecken in unseren Daten zu reduzieren.

Abbildung 4-1. Die vier Facetten eines Datenprodukts sollen die im Vorwort beschriebene Datenhygiene sicherstellen, damit jeder, der Daten nutzt, alles, was er braucht, um effizient und effektiv mit den Daten zu arbeiten, in einem in sich geschlossenen Objekt findet.

Ein gut gestaltetes Datenprodukt zeichnet sich, ähnlich wie unser handwerklich hergestellter Kaffee, durch die folgenden Merkmale aus. Stell dir diese als die vier Facetten eines Edelsteins vor:

Daten

Das ist das Was: die eigentlichen Informationen, die im Datenprodukt enthalten sind.

Struktur

Diese Facette befasst sich mit dem Wie. Wie sollen die Informationen bei der Übermittlung formatiert werden?

Bedeutung

Diese Facette befasst sich mit der Frage. Welche Definition eines Wortes ist angesichts der Sprache und der vermittelten Konzepte gemeint?

Kontext

Das beantwortet die Fragen nach dem Warum, Wo und Wer. Warum wurde das Produkt entwickelt und welches Problem löst es? Wo ist es zu finden (API, Datenbank, Tabelle, Abstammung)? Wer ist für die Verwaltung, die Service Level Agreements (SLAs) und die rollenbasierte Zugriffskontrolle (RBAC) verantwortlich und wer hat es erstellt?

Diese vier Facetten helfen dabei, aus bloßen Daten ein aussagekräftiges Datenprodukt zu machen. So wie die Kaffeebohnen allein ohne die sorgfältig gestaltete Verpackung nicht dasselbe Erlebnis bieten, sind auch Daten allein ohne die richtige Struktur, Bedeutung und den Kontext nicht so wirkungsvoll.

Aus der Sicht eines Datenprodukts ist ein Datenprodukt unvollständig und von schlechter Qualität, wenn es zwar Daten, aber nicht die anderen Facetten in einem enthaltenen Objekt enthält. Abbildung 4-2 veranschaulicht dies anhand des Vergleichs mit einem Kaffeebohnenprodukt.

Abbildung 4-2. Ein Datenprodukt hat vier Hauptaspekte: Daten, Struktur, Bedeutung und Kontext. Damit sind die wichtigsten Elemente, die ein Datennutzer braucht, um effektiv mit Daten arbeiten zu können, in einem einzigen Objekt (Produkt) zusammengefasst.

Ein Datenprodukt-Ansatz macht auch die Suche nach Daten und die Suche in Daten effizienter, weil du standardisierst, wie die Informationen über die Daten organisiert sind, was eine enorme Zeitersparnis bedeuten kann.

Tipp

Weitere Informationen über den Unterschied zwischen der Suche in Daten und der Suche nach Daten findest du in The Enterprise Data Catalog, von Ole Olesen-Bagneux (O'Reilly, 2023):

  • Die Suche nach Daten. Es ist wichtig, dass die Beschäftigten Daten einfach und schnell finden können.

  • Suchen in Daten. Genauso wichtig ist es, dass die Mitarbeiter/innen verstehen können, was Begriffe in den Daten bedeuten, z. B. Spaltennamen. Beseitige Mehrdeutigkeiten.

Eine einheitliche Datenstrategie bedeutet, Verschwendung und Ineffizienz zu reduzieren. Wenn die Daten, die Struktur, die Bedeutung und der Kontext in verschiedenen Systemen und an verschiedenen Orten gespeichert sind - oder ganz fehlen -, führt dies zu einer unglaublichen Komplexität und einem Chaos in deinem Datenmanagement.

Bringe den Datensatz, die Metadaten, das semantische Management, die Governance und so weiter in eine einzige, vollständige Einheit: das Datenprodukt. Auf diese Weise entsteht ein weitaus besseres Datenerlebnis, das letztendlich aus betrieblicher Sicht effektiver und effizienter ist, weil deine Datennutzer keine Zeit mit der Suche oder der manuellen Kombination mehrerer Systeme verschwenden müssen. Und das ist es, was ein gutes Datenproduktdesign für dein Unternehmen leisten wird.

Erste Schritte mit Concept-First Design

Einer der Autoren dieses Buches, Ron, hat mehrere Erfahrungen mit Unternehmen gemacht, die für ihn als Berater bahnbrechend waren. Zur Veranschaulichung dieser Erfahrungen sollen die folgenden Beispiele aus der Praxis dienen (sie wurden zusammengeführt und verändert, um die Identität der Unternehmen geheim zu halten).

Stell dir vor, du arbeitest mit einem Unternehmen A zusammen, das mit einem einzigen Flaggschiffprodukt jährlich eine Milliarde Dollar Umsatz macht und das in seiner Kategorie seit jeher zuverlässig den gesamten Weltmarkt beherrscht. Sein schärfster Konkurrent, Unternehmen B, hat gerade eine KI-Version seines ähnlichen Produkts auf den Markt gebracht und setzt die Führungskräfte von Unternehmen A unter enormen Druck, dem Vorstand zu zeigen, dass das Unternehmen innovativ bleibt und eine Antwort auf die neue Bedrohung hat. Wenn nicht bald eine KI-Lösung angeboten wird, besteht die reale Möglichkeit, dass die Kunden zu Unternehmen B wechseln, was schwerwiegende negative Folgen für Unternehmen A haben könnte.

Um auf diese Bedrohung zu reagieren, wird ein Team von erstklassigen Datenwissenschaftlern und Ingenieuren für maschinelles Lernen eingestellt. Sie erhalten fantastische Gehälter - Geld spielt keine Rolle, und es werden keine Kosten gescheut, um ein Team einzustellen, das von den Führungskräften als "das beste der Welt" bezeichnet werden kann.

Doch nach mehreren Jahren ist das Team immer noch nicht in der Lage, eine KI-Version des Produkts zu entwickeln. Die Fristen werden immer wieder verschoben, und die Teams geben sich gegenseitig die Schuld. Also tun die Führungskräfte, was die meisten Führungskräfte tun: Sie engagieren teure Berater, um das Problem für sie zu lösen, weil sie glauben, dass ihre Teams es intern nicht schaffen. Die teure Beratungsfirma verlangt zweistellige Millionenbeträge, um ganze Teams von teuren Experten und die leistungsfähigsten Cloud-Computing-Dienste einzubinden.

Fast hundert Leute werden entweder eingestellt oder von anderen Teams abgezogen, so dass die erneuten Bemühungen erfolgreich sind und die Entwicklung des KI-Produkts beginnt! Aber ein Jahr später ist das KI-Produkt immer noch furchtbar, die Nutzer hassen es, die KI funktioniert nicht gut, und jetzt müssen die Führungskräfte ihrem Vorstand sagen, dass sie Jahre und viele Millionen Dollar verschwendet haben, ohne etwas vorzuweisen zu haben.

Das ist der Punkt in der Geschichte, an dem Ron hinzugezogen wurde, um zu sehen, was er herausfinden konnte. Das Ergebnis war, dass die KI-Engine in weniger als einem Jahr mit einem Bruchteil des Teams, der Zeit und der Kosten der vorherigen Bemühungen gebaut wurde. Die Technik, die bei vielen Problemen in vielen Branchen und über viele Jahre hinweg angewandt und verfeinert wurde, wurde schließlich als Concept-First-Design bezeichnet .

Die Betonung liegt beim Konzeptdesign auf dem Wort "zuerst". Es unterstreicht, wie wichtig es ist, keine überstürzten Entwicklungs-, Design- oder Geschäftsentscheidungen zu treffen, bevor nicht alle Konzepte sorgfältig entworfen und mit allen Beteiligten abgestimmt sind. Für eher technisch orientierte Teams könnte man diesen Prozess auch als Schema-First-Design bezeichnen , obwohl Concept-First-Design für Nicht-Techniker ein viel zugänglicherer Begriff ist.

Eine Blaupause für die Vereinheitlichung

Um Führungskräften zu helfen, die transformative Kraft der Vereinheitlichung innerhalb einer Organisation zu verstehen, unterteilen wir die Reise in drei entscheidende Phasen: bewerten, ausrichten und beschleunigen. Jede Phase dient als Baustein, und zusammen bieten sie einen strukturierten Weg, um den Wandel effektiv voranzutreiben, wie in Abbildung 4-3 dargestellt:

Abbildung 4-3. Die drei Phasen der Vereinheitlichung lassen sich anhand dieses Flussdiagramms zusammenfassen, um die Aktivitäten der Vereinheitlichung in einer übersichtlichen Zusammenfassung zu erklären. Unabhängig davon, ob du ein interner oder externer Datenbeauftragter bist, kann eine klare Beschreibung, wie die Transformation aussehen wird, helfen, Unterstützung zu gewinnen.
  1. Bewerten. Der erste Schritt ist eine gründliche Bewertung des aktuellen Zustands deiner Organisation. Triff dich mit den wichtigsten Stakeholdern, um zuzuhören, Erkenntnisse zu sammeln und verschiedene Standpunkte zu bewerten. Die Beurteilungsphase beginnt mit einem ersten Konzept, um die Perspektiven der Interessengruppen in organisierte, hierarchische Konzepte zu übersetzen. Dies hilft nicht nur bei der Datenerhebung, sondern auch bei der Festlegung einer gemeinsamen Methode zur Erfassung der Perspektiven und der Sprache der verschiedenen Abteilungen. Mit Hilfe einer gut gestalteten Tabelle oder eines Whiteboards können alle Beteiligten in dieser Phase die bestehenden Übereinstimmungen oder Unstimmigkeiten besser verstehen.

  2. Angleichen. Mit einer umfassenden Bewertung ausgestattet, besteht der nächste Schritt darin, die unterschiedlichen Perspektiven in Einklang zu bringen. In Kapitel 6 wird der Konzeptkompass vorgestellt, ein Instrument, mit dem die Unterschiede zwischen den Perspektiven der Interessengruppen genau beleuchtet werden können. Dies erfordert jedoch auch ein Werkzeug, um alle Fäden in den organisatorischen Netzwerken zu verknüpfen, die diese Konzepte verwenden. Datenchampions nutzen das CLEAN Data Governance Framework, das in Kapitel 7 behandelt wird, um einen methodischen und strukturierten Ansatz zu verfolgen. In dieser Phase wird sichergestellt, dass alle Beteiligten auf derselben Seite stehen und die Organisation bereit für gezielte Maßnahmen ist.

  3. Beschleunigen. Sobald die Konzepte definiert, aufeinander abgestimmt und mit einer angemessenen Datenhygiene verbunden sind, können sie im Kontext von Erfolgsmessungen und Metriken beschrieben werden, die den Fortschritt messen. Die wichtigsten Werkzeuge für die Accelerate-Phase sind kommentierte Prozesslandkarten, die in Kapitel 9 behandelt werden, sowie Erfolgsspektren und UX-Designstrategien in Kapitel 10. Mit den Werkzeugen der Accelerate-Phase können sich Teams aus verschiedenen Bereichen - Business, Daten, Code, Design und mehr - an einer klaren Ausführungsplanung und Messkriterien orientieren.

Die Erstellung einwandfreier Datenprodukte erfordert die konsequente Einhaltung des Prinzips der Datenhygiene, wie in "Was du nicht siehst, kann dich töten, und das Gleiche gilt für Daten" beschrieben . Das systematische Durchlaufen der Phasen "Bewerten", "Abgleichen" und "Beschleunigen" dient dazu, subtile Bedrohungen wie Unklarheiten und Wissensunterschiede zu beseitigen und so die Grundlage für eine bessere Zusammenarbeit, präzise Entscheidungsfindung und optimierte Produktivität zu schaffen. Wenn wir uns an die Datenhygiene halten und gleichzeitig die übergreifenden Prinzipien der Abstimmung von Prozessen und organisatorischen Netzwerken beibehalten, ebnen wir den Weg für bahnbrechende Innovationen, Data-Science-Initiativen und betriebliche Rationalisierungen.

In Anlehnung an die Erkenntnisse von Dr. Semmelweis über die Unverzichtbarkeit der Handhygiene im Gesundheitswesen (siehe "Was du nicht siehst, kann dich töten, und das Gleiche gilt für Daten") wird der Wert der Datenhygiene deutlich. Ähnlich wie das Händewaschen in der Medizin ist eine tadellose Datenhygiene die Grundlage dafür, dass Unternehmen nicht nur geschützt sind, sondern auch gedeihen. Eine Vernachlässigung der Datenhygiene kann katastrophale Folgen haben.

Bewerten, ausrichten und beschleunigen ist nicht nur ein Mantra, sondern unsere Landkarte.

Kartierung des konzeptionellen Terrains: Bewertung von Konzepten

Die Bewertungsphase ist eine strukturierte Erkundung des kollektiven Denkens deines Teams. Sie besteht aus einer Reihe von Einzelgesprächen mit den wichtigsten Interessenvertretern und Mitwirkenden aus allen Bereichen. Dazu gehören Entwickler, Designer, Produktmanager, Datenwissenschaftler und viele mehr. In dieser Phase geht es darum, die Befragten zu bitten, ihre Sichtweise auf ihre Arbeit zu schildern:

  1. Beschreibe die wichtigen Probleme, die es zu lösen gilt. Bitte die Teilnehmer/innen, zu beschreiben, an welchen Problemen sie arbeiten, welche Ziele sie verfolgen, welche Maßnahmen sie ergreifen und wie der Erfolg an den Ergebnissen gemessen wird. Die Beschreibungen können als Visualisierung auf einem Whiteboard oder in einem Dokument wie PowerPoint, Excel oder Google Docs erfolgen.

  2. Kläre die wichtigen Konzepte, die sie enthalten. Wenn du die Landkarte mit den wichtigsten Problemen, Zielen, Maßnahmen und Erfolgskennzahlen in der Hand hast, kannst du diese mit deinem Gesprächspartner erkunden. Erfasse einfach die Begriffe und ihre Bedeutung in einfacher Sprache und wenn es Berechnungen gibt (z. B. Gewinn oder Kundenbindung), bitte sie darum, genau anzugeben, wie sie gemessen werden. Das geht am besten in einer Tabelle, ein Beispiel dafür findest du in Abbildung 4-4.

  3. Ordne die Begriffe in hierarchische Beziehungen ein. Sobald du einige Bedeutungen hast, kannst du die Teilnehmer bitten, die Konzepte in eine hierarchische Struktur von Eltern-Kind- oder Kind-Geschwister-Beziehungen aufzuschlüsseln. Das ist das gleiche Format, das auch ein Schema verwendet. Das geht auch am besten in dem in Abbildung 4-4 gezeigten Tabellenformat.

Abbildung 4-4. Verwendung einer Tabellenkalkulation für das Konzeptdesign. Für jedes Konzept werden drei Spalten verwendet: Ebene #, Typ (Objekt, Zahl, Text, Liste usw.) und Definition. Diese werden verwendet, um den Konzepten eine Bedeutung zu geben. Wenn du ein Unterkonzept (auch bekannt als Unterkonzept) hinzufügen möchtest, fügst du diese Unterkonzepte in der Spalte der nächsten Ebene ein. Zum Beispiel wird für das Konzept Produkt (Ebene 1) das Unterkonzept Titel auf Ebene 2 hinzugefügt. Durch diese Überlagerung von Konzeptebenen entsteht eine hierarchische Struktur, die auch als Schema bezeichnet werden kann.

Deine Bewertung wird folgendermaßen aussehen. Stelle alle Perspektiven der Beteiligten und Mitwirkenden zusammen und zeige auf, wie übereinstimmend oder nicht übereinstimmend sie sind. Jetzt hast du eine quantitative Möglichkeit, den Führungskräften und dem Team Feedback zu geben und zu zeigen, dass zum Beispiel von fünf Personen nur zwei genau wissen, was bestimmte Konzepte bedeuten und wie sie aufgebaut sind. Wie kann ein Team effektiv zusammenarbeiten, wenn es sich nicht über die Konzepte einig ist, die Daten und Code erfassen sollen? Normalerweise geht das nicht. Und wenn du einen Designer, einen Dateningenieur, einen Vermarkter, einen Geschäftsführer und einen Softwareentwickler bittest, sich über die Bedeutung und Struktur von Konzepten Gedanken zu machen, wird jeder von ihnen seine eigene Sichtweise haben.

Tipp

Der grundlegende Schritt beim Concept-First-Design besteht darin , das Verständnis für die Konstellation der Konzepte immer an die erste Stelle zu setzen, bevor Entscheidungen über Investitionen (Business), Analysen (Daten) und die Erstellung (Code) getroffen werden.

Abbildung 4-4 zeigt ein Tabellenblatt, das als Schema dient. Es stellt die Hierarchie der Konzepte in einem Produkt visuell dar und veranschaulicht die Gliederungsebenen und die erwarteten Entitäten auf jeder Ebene. Dieser Ansatz macht Schemadesign für alle zugänglich, nicht nur für Entwickler. Er bietet eine einzigartige und leicht zugängliche Möglichkeit, Konzeptstrukturen zu erstellen, ähnlich wie sie in JSON erstellt werden.

Die Organisation der Begriffe in diesem CSV-Format weicht von einem traditionellen Schema ab. Ein traditionelles Schema konzentriert sich in erster Linie auf die hierarchische Struktur der Konzepte, während dieses CSV-basierte Schema sowohl die Struktur als auch die Bedeutung integriert. Es handelt sich also nicht nur um eine Tabellenkalkulation, sondern um eine umfassende Darstellung, die neben der Begriffshierarchie auch semantische Informationen enthält. Dieser integrierte Ansatz trägt dazu bei, Mehrdeutigkeiten zu vermeiden und zu verringern und damit die Effizienz der Datenverwaltung und Systementwicklung zu steigern.

Erleichterung der Bewertung der konzeptionellen Übereinstimmung zwischen technischen und nichttechnischen Teams

Abbildung 4-5 zeigt ein reales Beispiel oder eine Instanz eines Kaffeeprodukts, das anhand des Schemas in Abbildung 4-4 erstellt wurde. Abbildung 4-4 zeigt die erwartete Struktur eines Produktobjekts, und Abbildung 4-5 demonstriert, wie diese Struktur mit spezifischen Daten über ein tatsächliches Produkt gefüllt werden kann.

Die wahre Stärke konzeptioneller Schemata, wie in Abbildung 4-5 gezeigt, liegt in ihrer Zugänglichkeit und der Einfachheit, mit der sie Geschäftslogik ausdrücken. Mithilfe einer einfachen Tabellenkalkulation kann die Geschäftslogik nahtlos und direkt in JSON-Objekte übersetzt werden. Dieser Ansatz steigert die Effizienz erheblich und beseitigt einen wichtigen Schmerzpunkt - die oft komplexe und fehleranfällige Aufgabe, die Sprache der Geschäftsinteressenten in funktionale technische Anforderungen zu übersetzen.

Entwickler/innen stehen häufig vor der Herausforderung, geschäftliche Anforderungen in funktionalen Code zu übersetzen. Unternehmensleiter formulieren ihre Bedürfnisse oft aus ihrer Perspektive, die auf der Geschäftsstrategie, den Kundenanforderungen oder Markttrends beruht. Diese Anforderungen werden jedoch nicht immer so kommuniziert, dass Entwickler sie leicht in einen technischen Entwurf umsetzen können. Dieses Kommunikationsdefizit liegt nicht an mangelnden Bemühungen auf beiden Seiten, sondern vielmehr daran, dass Wirtschaft und Entwicklung zwei unterschiedliche Bereiche mit eigenem Fachjargon, eigenen Perspektiven und Prioritäten sind.

Die Herausforderung liegt in der Tatsache, dass Entwickler keine Gedankenleser sind. Sie können die komplizierten Nuancen einer Geschäftsanforderung nicht erahnen, wenn sie nicht explizit formuliert sind. Wenn die Erwartungen nicht erfüllt werden, führt das oft zu Frustration und Schuldzuweisungen, wobei die Entwickler die Hauptlast tragen, weil sie das "Offensichtliche" nicht verstehen. Diese Situation führt zu verschwendeter Zeit, Ressourcen und angespannten Beziehungen zwischen den Teams. Außerdem führt dies zu ständigen Überarbeitungen, Projektverzögerungen und minderwertigen Endprodukten.

Abbildung 4-5. Ein konzeptionelles Schema. Das Konzeptschema aus Abbildung 4-4 kann eins zu eins auf eine JSON-Darstellung abgebildet werden. Dieses Mapping erleichtert es technischen und nicht-technischen Teams zu verstehen, wo sie bei der Modellierung und Kommunikation von Konzepten, die team- und technologieübergreifend verwendet werden, und bei der Integration in funktionale Geschäftsprozesse übereinstimmen oder nicht übereinstimmen.

Konzeptuelle Schemata können helfen, diese Kommunikationslücke zu schließen. Sie bieten eine gemeinsame Sprache für Unternehmensleiter und Entwickler, um Anforderungen zu formulieren und zu verstehen. Indem sie Konzepte in einer strukturierten, hierarchischen Weise organisieren, die sowohl Bedeutung als auch Struktur enthält, bieten konzeptionelle Schemata eine klare Roadmap für Entwickler. Sie ermöglichen es den Entwicklern, die Vorstellungen der Unternehmensleitung in einem Format zu sehen, das direkt in Code übersetzt werden kann. Dieser Ansatz reduziert Unklarheiten, sorgt für einen Abgleich der Erwartungen und rationalisiert den Prozess der Umwandlung von Geschäftslogik in funktionale Anforderungen, was zu erfolgreicheren Projekten und einer besseren Zusammenarbeit zwischen den Teams führt.

JSON und JSON-Schemata sind sowohl menschen- als auch maschinenlesbare Sprachen und damit entscheidende Elemente des Concept-First-Designs. In der Bewertungsphase der Vereinheitlichung ist es wichtig, sowohl technische als auch nicht-technische Teams in die Bewertung einzubeziehen. Ziel ist es, die Gesamtausrichtung der Organisation in Bezug auf die Daten vertikal und horizontal über verschiedene Bereiche hinweg zu bewerten.

Tipp

Wenn dir die technischen Aspekte abschreckend erscheinen, mach dir keine Sorgen. Du musst den Code nicht persönlich unter die Lupe nehmen. Arbeite stattdessen eng mit einem Entwickler oder einer Entwicklerin zusammen, der/die die Datenstrukturen im Code untersuchen kann und einen Einblick in die Abstimmung zwischen technischen und nicht-technischen Teams gibt.

Wenn das technische Team mehr Daten benötigt, als das Geschäftsteam in seiner Darstellung definiert hat, ist das völlig in Ordnung. Es mag einen legitimen technischen Bedarf an zusätzlichen Informationen geben. Nichtsdestotrotz ist es wichtig, dass sich die Geschäfts-, Daten- und Code-Teams auf die grundlegenden Konzeptdarstellungen einigen und diese mit dem ersten Schritt unserer Bewertung abstimmen: die kritischen Probleme, die es zu lösen gilt, und ihren Kontext zu definieren, einschließlich der Ziele, Maßnahmen und Erfolgsmetriken.

In der Bewertungsphase geht es nicht nur darum, die konzeptionellen Unterschiede zwischen den Teammitgliedern oder zwischen den Code-Darstellungen der Konzepte zu messen. Es geht auch darum, die Diskrepanzen zwischen den Konzepten und den definierten Problemen, Zielen, Maßnahmen und Erfolgsmetriken zu messen.

Bei dem oben beschriebenen Beratungsabenteuer entdeckte Ron, dass ein einziges Wort - nur ein einziges -, das in den Erfolgsmetriken verwendet wurde, von den Teams unterschiedlich interpretiert wurde. Für das Business-Team bedeutete das Wort " adaptiv", dass der Erfolg an die Fähigkeit ihres aktuellen Produkts gebunden war, das Nutzererlebnis an ihr aktuelles Geschäftsmodell anzupassen, was zufällig mit den KPIs verbunden war, die ihren Erfolg, ihre Boni und so weiter maßen. Im Gegensatz dazu bewertete das Data-Science-Team den Erfolg der Anpassungsfähigkeit danach, wie genau seine Vorhersagemodelle das Nutzererlebnis anpassen konnten - nicht optimiert für die KPIs des Geschäftsteams, sondern für das, was für das Nutzererlebnis am besten war.

Du kannst Concept-First Design buchstäblich auf alles anwenden, was sich konzeptionell erfassen lässt, auch auf Erfolgskennzahlen. Sobald du deine Einschätzungen gemacht und die Lücken in der Abstimmung aufgezeigt hast, kannst du damit beginnen, die Teams auf ein gemeinsames Concept-First-Design-Schema auszurichten, das wir später in diesem Buch untersuchen werden. In Kapitel 5 wird erläutert, wie sich ein Datenproduktmanager oder ein Datenchampion mit den technischen Aspekten der Implementierung und Verwendung von Schemata mit JSON Schema vertraut machen sollte, damit die technischen Teams damit beginnen können, Schemata für technische Zwecke zu entwerfen.

Glatt ist langsam, langsam ist schnell

Der Satz "Langsam gehen, um geschmeidig zu gehen, geschmeidig gehen, um schnell zu gehen" betont, wie wichtig es ist, sich Zeit zu nehmen, um zu lernen, wie man etwas richtig macht, bevor man sich auf die Geschwindigkeit konzentriert. Dieser Ansatz gilt sowohl für das Erlernen eines Musikinstruments als auch für das Erlernen der Ausrichtung von Innovationsbemühungen.

Die erste Bewertung von Konzepten, wie in Abbildung 4-4 dargestellt, ist eine einfache Möglichkeit, den Interessenvertretern grundlegende Fragen zu stellen, ihre Probleme kennenzulernen und herauszufinden, wo sie sich von anderen Interessenvertretern unterscheiden. Diese Bewertung ist von entscheidender Bedeutung, auch wenn es sich so anfühlt, als würde sie dein Team deutlich verlangsamen. Einige der Fragen, die es wert sind, gestellt zu werden, mögen albern, offensichtlich oder sogar beleidigend erscheinen. In der Beratung stellen wir jedoch immer wieder fest, dass diese offensichtlichen Fragen noch nie gestellt wurden, und das Ergebnis sind oft sehr kostspielige Fehler in Bezug auf Daten.

Tipp

Die Vereinheitlichung ist eine fortlaufende Praxis. Wenn sich Unstimmigkeiten einschleichen, ist es wichtig, den Prozess erneut zu beginnen und auf deine Konzeptschemata zurückzublicken, um herauszufinden, wo es zu Missverständnissen gekommen sein könnte.

Hier sind einige der Vorteile, die du von der Vereinheitlichung hast:

  • In Umgebungen, in denen die Abstimmung Priorität hat und gedeiht, arbeiten Teams viel reibungsloser zusammen und können Erkenntnisse, Wissen und Ressourcen austauschen. Diese Zusammenarbeit führt zu einer Kultur des kontinuierlichen Lernens und der Verbesserung, die es deiner Organisation ermöglicht, sich schnell anzupassen und auf Herausforderungen zu reagieren.

  • Die Fähigkeit, sich anzupassen und auf Veränderungen zu reagieren, ist für den Erfolg eines jeden Unternehmens entscheidend. Anpassung bedeutet, dass die Teams besser verstehen, wie sie agil und anpassungsfähig arbeiten können, da sie besser in der Lage sind, die Auswirkungen neuer Erkenntnisse, Trends und sich ändernder Anforderungen zu verstehen.

  • Ein unglückliches Ergebnis der Engpässe bei der zentralen Datenverwaltung ist, dass einige Teams so verzweifelt nach Lösungen suchen, dass sie das zentrale Datenverwaltungsteam umgehen und ihre eigenen Datenlösungen entwickeln oder in Auftrag geben, um voranzukommen. Wenn es jedoch misslingt, das Datenteam in Entscheidungen über die Datenarchitektur oder -speicherung einzubeziehen, kann dies zu Problemen mit der Datenqualität, Sicherheitslücken und technischen Schulden führen. Wenn alle Beteiligten an einem Strang ziehen, können Teams, die mit Engpässen konfrontiert sind, mit weitaus geringerem Risiko vorankommen, weil sie genau wissen, welche Konzepte sie angleichen müssen und wie sie das tun sollen.

Zusammenfassung

In diesem Kapitel wurde die Bedeutung der internen Datenprodukte von Unternehmen erörtert und mit kommerziellen, kundenorientierten Produkten verglichen. Es betont die Notwendigkeit einer guten Nutzererfahrung bei Datenprodukten und unterstreicht die Rolle des Datenproduktmanagers bei der Schaffung exzellenter Datenprodukt-Erfahrungen.

Die vier Facetten eines Datenprodukts sind Daten, Struktur, Bedeutung und Kontext. In diesem Kapitel wurden diese Facetten anhand einer Kaffeebohnen-Analogie veranschaulicht, die besagt, dass ein Datenprodukt ohne eine dieser Facetten unvollständig und von minderer Qualität ist.

Wir haben gesehen, wie ein Datenproduktansatz die Datensuche effizienter macht, indem er standardisiert, wie die Informationen über die Daten organisiert werden. Der Unterschied zwischen der Suche in Daten und der Suche nach Daten wurde diskutiert.

Wir haben gelernt, dass Agilität im Zusammenhang mit Vereinheitlichung für die Reduzierung von Verschwendung und Ineffizienz steht, indem Datensatz, Metadaten, semantisches Management und Governance in eine einzige, vollständige Einheit gebracht werden: ein Datenprodukt. Dieser Ansatz verbessert das Datenerlebnis durch die Straffung datenbezogener Prozesse und erweist sich als effektiver und effizienter im Vergleich zu traditionellen Methoden, um eine datengesteuerte Organisation zu werden.

Wir haben die drei Schritte zur Vereinheitlichung beschrieben: bewerten, ausrichten, beschleunigen. Die Beurteilungsphase beinhaltet eine strukturierte Erkundung des kollektiven Bewusstseins des Teams, um die Lücken und die Schwere der Fehlanpassungen zwischen den Teams zu verstehen. In der Ausrichtungsphase geht es darum, Kommunikationsillusionen auszuräumen und eine effektive Ausrichtung auf allen Ebenen der Organisation zu erreichen. In der Accelerate-Phase geht es darum, schnelles Feedback zu erhalten und Lösungen auf agile Weise umzusetzen und zu testen.

Schließlich haben wir uns mit den Risiken einer Beschleunigung ohne zufriedenstellende Vereinheitlichung befasst - dies könnte dazu führen, dass das Falsche schneller gebaut wird. Bei der Vereinheitlichung wird der Genauigkeit Vorrang vor der Geschwindigkeit eingeräumt und die Bemühungen des Datenteams werden kontinuierlich auf die Gesamtziele des Unternehmens abgestimmt.

Das Wechseln zwischen hohen und niedrigen Abstraktionsebenen bei deinem Streben nach Vereinheitlichung ist die Strategie, die du im Laufe dieses Buches lernen wirst. In Kapitel 5 wirst du, der Daten-Champion, von der hohen strategischen Ebene der Vereinheitlichung von Konzepten auf eine niedrigere Ebene der Vereinheitlichung von Konzepten auf Code-Ebene mit Hilfe von JSON Schema wechseln.

Get Vereinheitlichung von Geschäft, Daten und Code now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.