2章クラウド上のビッグデータアーキテクチャ

ビッグデータは情報の増加をもたらすかもしれないが、誤情報の増加ももたらし得る。

—— ナシーム・タレブ(Naseem Taleb)

1章では、この章の基礎として役立つクラウドデータレイクについての2つの知識を学びました。

  • データレイクというアプローチの出発点は、ソース、サイズ、形式の違いにかかわらず、あらゆるタイプのデータを格納、処理できるようにして、価値密度(S/N比、シグナル雑音比)がまちまちな多様なソースからのデータをもとに高価値のインサイトを引き出せるようにすることにある。
  • クラウド上にデータレイクを構築するためのアーキテクチャは、IaaS、PaaS、SaaSソリューションのさまざまなコンポーネントを組み合わせた非集約的なものになる。

ここで大切なのは、クラウドデータレイクソリューションの構築では、それぞれ独自の長所を持つさまざまなアーキテクチャが使えることです。この記事(https://oreil.ly/VUHSK)は、最近のデータアーキテクチャのさまざまなコンポーネントの概要を包括的に取り上げています。この章では、広く使われているアーキテクチャパターンの一部を深く掘り下げ、クロダースコーポレーションという架空の企業でそれぞれのアーキテクチャを採用したときにどのような長所が得られるかを見ていきます。

2.1 クロダースコーポレーションがクラウドに移行しようとしている理由

クロダースコーポレーションは、太平洋岸北西地域(アラスカ州からカナダのユーコン準州、ブリティッシュコロンビア州をはさんでワシントン州、オレゴン州、アイダホ州など)で雨具などの製品を販売している優良企業です。事業の急成長にともなう以下の理由からクラウドへの移行を検討しています。 ...

Get クラウドデータレイク ―無限の可能性があるデータを無駄なく活かすアーキテクチャ設計ガイド now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.