3章膨大な量のデータの管理:読み出し専用データストアアーキテクチャ

この章では、RDSアーキテクチャについて説明します。RDSアーキテクチャは、読み出しを集中的に行うためのアーキテクチャです。この章では、CQRS(Command and Query Responsibility Segregation、コマンドクエリ責務分離)のパターンを検証します。そして、アーキテクチャ全体にさらに原則を追加します。また、読み出し専用データストア(RDS)について、RDSとは何か、RDSをどのように設計するのか、一般的にどのような機能が必要か、説明します。そしてメタデータの役割についても解説します。本章を読めば、RDSがどのようにして膨大な量のデータを、データコンシューマに提供することができるのかを学ぶことができます。

3.1 RDSアーキテクチャの紹介

データウェアハウスがコモディティ化してから数年の間に、多くの変化がありました。分散システムの普及、データの大規模化と多様化、新しいデータベース設計の登場、クラウドの出現により計算機とストレージが分離しスケーラビリティと弾力性が向上したことなどが挙げられます。これらのトレンドを、1章で取り上げた課題や、2章で学んだ分離の原則と組み合わせると、大量のデータを流通・共有する方法を変更するのが重要であることが、すぐに理解できるでしょう。

RDSアーキテクチャは、最初のデータ分散・統合アーキテクチャであり、新しいScaled Architectureの基礎となるものです。非常に興味深いものです。RDSアーキテクチャは、集中的な読み出しに適しています。また、さまざまなワークロード用のデータに、管理された状態で安全にアクセスできるようにします。このアーキテクチャは、機械学習やサードパーティーとのデータ共有など、さまざまなユースケースを実現するために、さまざまなテクノロジーを組み合わせて設計することができます。 ...

Get 大規模データ管理 ―エンタープライズアーキテクチャのベストプラクティス now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.