Skip to Content
データおよび機械学習プラットフォームのアーキテクト
book

データおよび機械学習プラットフォームのアーキテクト

by Marco Tranquillin, Valliappa Lakshmanan, Firat Tekiner
March 2025
Beginner to intermediate
362 pages
5h 20m
Japanese
O'Reilly Media, Inc.
Content preview from データおよび機械学習プラットフォームのアーキテクト

第3章 データチームの設計 データチームのためにデザインする

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com

、データプラットフォームを設計する際、考慮すべき技術的側面がいくつかある:パフォーマンス、コスト、オーバーヘッド、オペレーショナル・エクセレンス、新しい分析手法やML手法の統合など。しかし、企業文化に取り組まなければ、これらの技術的側面は水泡に帰してしまう。新技術には、従業員のメンタルモデルや仕事のやり方を変える意欲が必要だ。もう1つ留意すべき重要な点は、既存の従業員が現在持っていて、今後習得する必要があるスキルだ。場合によっては、新しいスキルを学び、働き方を変えた社員は、データプラットフォームが導入される前とは異なる役割を担うことになる。

この章では、メンタルモデル、ワークフロー、テクニカルスキル、役割の変化を、組織がどのように計画し、オーケストレーションできるかを探る。どの組織もユニークであるため、データプラットフォームの構築には、各部門や従業員ごとにきめ細かな計画を策定する必要がある。この章では、そのようなきめ細かな計画が、様々なタイプの組織にとってどのようなものであるかを説明する。

データ処理組織を分類する

組織は、その才能に応じて異なる戦略を採用することで成功することができる。普遍的な「ベスト」アプローチは存在しない。強力なディフェンスを持つスポーツチームは、自分たちの強みを発揮してディフェンスに集中すべきであり、オフェンスに長けた選手のいるチームのオフェンスをコピーしようとしてはならない。同様に、もしあなたの組織に強力なデータアナリストのチームがあるのなら、データエンジニアだらけの組織に変えようとするのではなく、その人材に焦点を当てるべきである。

従業員のスキルとユースケースの複雑さに基づいて、組織に最適な戦略を決定する。小規模だが能力の高い(そして高価な)データエンジニア集団が必要だろうか?それとも、すでに存在する大規模なデータアナリストの労働力を活用し、行動可能なデータの充実と変換を行うべきか?これらのワーカーにはどの程度の専門知識が必要だろうか?より価値の高い仕事を遂行するために現在の労働力を訓練することは現実的だろうか?あるいは、ジェネレーティブAIやノーコード・ツールに投資し、そのような基盤技術をより多くの従業員が利用できるようにするべきか?

最適なテクノロジー・アプローチもまた、組織内で異なるだろう。そのため、きめ細かな計画では、各ビジネスユニットに最適なテクノロジーアプローチを詳述する。技術面では、標準的なETL (ETLツールのプログラミングスキルが必要)をベースとしたアプローチと、ELT(より一般化したSQLスキルが必要)をベースとした最新のアプローチとの選択も行う。

図3-1にスケッチしたように、従来のペルソナ・バリューチェーン( )を考えてみよう。組織内のすべてのデータ・ユーザは、少人数で特殊化されたテクニカル・スキルを持っていることがわかる。もし組織がデータ分析チームの範囲を拡大したいのであれば、データエンジニアリ ングチームとデータサイエンスチームの規模を拡大し、データ分析者をサポートするのに十分な技術スキルを持 つ人材を確保する必要がある。

図3-1. データ処理:従来のペルソナ・バリューチェーン

パブリッククラウドが提供する新しいパラダイムは、データ処理、データ分析、アルゴリズム開発の方法に新たな可能性をもたらした。クラウド技術によって、新しい働き方が可能になった。アナリストは、これまでデータエンジニアが管理していたバッチ処理( ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

クラウドアプリケーションアーキテクチャパターン

クラウドアプリケーションアーキテクチャパターン

Kyle Brown, Bobby Woolf, Joseph Yoder
ユーザーストーリーマッピング

ユーザーストーリーマッピング

Jeff Patton, 川口 恭伸, 長尾 高弘

Publisher Resources

ISBN: 9798341624719