第1章. アナリティクス・エンジニアリング
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
アナリティクスの歴史的発展には、この分野を今日の姿に形作った重要なマイルストーンとテクノロジーが含まれている。アナリティクスの歴史は、1980年代のデータウェアハウジングの登場から始まり、ビジネスデータを整理・分析するための基礎的な枠組みを作成した。1980年代から1990年代にかけて出版活動を続けたコンピュータ科学者、ビル・インモンは、データウェアハウジングの最初の強固な理論的基礎を提供したと広く評価されている。
データウェアハウジングとビジネスインテリジェンス(BI)のもう一人の主要な貢献者であるラルフ・キンボール(Ralph Kimball)が1996年に影響力のある著作『データウェアハウス・ツールキット(The Data Warehouse Toolkit)』を出版したとき、その後の開発の波()が起こった。Kimball氏の研究は次元モデリングの基礎を築き、アナリティクスの進化におけるもう一つの重要なマイルストーンとなった。20世紀後半にわたるインモンとキンボールの貢献は、データウェアハウスとアナリティクスの状況を形成する上で極めて重要な役割を果たした。
2000年代初頭、GoogleやAmazonのようなハイテク大手の出現により、大量のデータを処理するための、より高度なソリューションの必要性が作成され、Google File SystemとApache Hadoopのリリースにつながった。これがビッグデータ・エンジニアリングの時代となり、専門家がHadoopフレームワークを使って大量のデータを処理するようになった。
Amazon Web Services(AWS)のようなパブリッククラウドプロバイダの台頭は、ソフトウェアやデータアプリケーションの開発とデプロイの方法に革命をもたらした。AWS()が提供する先駆的な製品の1つが、2012年に発表されたAmazon Redshiftだ。これは、オンライン分析処理(OLAP)と伝統的なデータベース技術の興味深い融合を表していた。初期のRedshiftでは、最適なパフォーマンスを維持するために、データベース管理者はバキュームやスケーリングのようなタスクを管理する必要があった。
時が経つにつれ、クラウド・ネイティブ・テクノロジーは進化を続け、Redshift自体も大幅な機能強化を受けてきた。Redshiftの中核となる強みはそのままに、Google BigQueryやSnowflakeのようなクラウドネイティブプラットフォームとともに、Redshiftの新しいバージョンはこれらの管理作業の多くを効率化し、あらゆる規模の企業に高度なデータ処理機能を提供している。この進化は、クラウドデータ処理のエコシステムにおける継続的なイノベーションを浮き彫りにしている。
Apache Airflow、データビルドツール(dbt)、Lookerなどのツールで構成される最新のデータスタックは、データワークフローをさらに変革した。これらの進歩により、「ビッグデータエンジニア」という用語は時代遅れとなり、データエンジニアはより広範で包括的な役割を担うようになった。この変化は、Apache SupersetとAirflowの創始者であり、FacebookとAirbnbの最初のデータエンジニアの一人であるMaxime Beaucheminの影響力のある記事( ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access