Kapitel 8. Skalierung in der Google Cloud

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Unter werden wir in diesem Kapitel herausfinden, wie wir unseren Entity-Auflösungsprozess so skalieren können, dass wir große Datensätze in angemessener Zeit abgleichen können. Wir nutzen einen Cluster virtueller Maschinen, die parallel auf der Google Cloud Platform (GCP) laufen, um die Arbeitslast aufzuteilen und die Zeit für die Auflösung unserer Entitäten zu reduzieren.

Wir gehen durch die Registrierung eines neuen Kontos auf der Cloud-Plattform und die Konfiguration der benötigten Speicher- und Rechenservices. Sobald unsere Infrastruktur bereit ist, wiederholen wir unser Beispiel für den Unternehmensabgleich aus Kapitel 6, wobei wir die Schritte des Modelltrainings und der Entitätsauflösung auf einen verwalteten Cluster von Rechenressourcen verteilen.

Zum Schluss überprüfen wir, ob unsere Leistung gleichbleibend ist und räumen vollständig auf, indem wir den Cluster löschen und die ausgeliehenen virtuellen Maschinen zurückgeben, um sicherzustellen, dass uns keine weiteren Kosten entstehen.

Get Praktische Auflösung von Entitäten now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.