book

効果的なマシンラーニングチーム

Name: 効果的なマシンラーニングチーム
ISBN: 9798341632370

by David Tan, Ada Leung, David Colls

March 2025

Intermediate to advanced

402 pages

5h 58m

Japanese

O'Reilly Media, Inc.

Audio summary available

Read now

Unlock full access

序文
この本は誰のためにあるのか？本書の構成パートI：製品と配送パートII：エンジニアリングパート III: チーム追加考察本書で使用されている慣例コード例を使うオライリー・オンライン・ラーニング問い合わせ先謝辞デビッド・タンよりエイダ・レオンよりデビッド・コルスより
1.MLソリューション提供の課題とベターパス
ML：約束と失望MLへの楽観的な見方が続いているMLプロジェクトはなぜ失敗するのかより良い方法はあるか？システム思考とリーンはどのように役立つか問題を "MLOps "することはできない全体を見る：効果的なML配信のためのシステム思考のレンズ効果的なML配信に必要な5つの規律結論
I.製品と配送
2.MLチームのプロダクトとデリバリ・プラクティス
MLプロダクト・ディスカバリー商品機会を発見する製品機会を定義するためのキャンバスソリューションを迅速に設計、提供、テストするテクニックインセプションチームを成功に導くためのセットアップインセプション：インセプションとは何か？インセプションの計画と運営方法ユーザストーリー：MVPの構成要素商品の配送配達活動の順序製品と納期を測定する結論
II.エンジニアリング
3.効果的な依存関係管理：原則とツール
もし我々のコードがいつでもどこでも機能するとしたらどうだろう？より良い方法チェックアウト＆ゴー効果的な依存マネジメントの原則依存関係管理ツールDockerとbatectのクラッシュコースコンテナとは何か？batectでDockerの可動部分を減らす結論
4.効果的な依存マネジメントの実践
文脈の中でML開発ワークフロー何をコンテナ化するかを見極めるハンズオン・エクササイズコンテナによる再現可能な開発環境安全な依存関係管理不要な依存関係を取り除くセキュリティ脆弱性のチェックを自動化する結論
5.自動テスト：物事を壊さずに速く進める
自動テスト：迅速かつ信頼性の高い反復作業の基盤なぜから始める：テスト自動化の利点自動テストがそれほど重要なら、なぜ我々はそれをしないのか？MLシステムの包括的テスト戦略の構成要素何を：テストのためのコンポーネントを特定する良いテストの特徴と避けるべき落とし穴どのようにテストの構造ソフトウェアテスト単体テストトレーニング・スモークテストAPIテストデプロイ後のテスト結論
6.自動テスト：MLモデルのテスト
モデルテストモデルテストの必要性MLモデルのテストの課題MLモデルの適応度関数モデルメトリックテスト（グローバルおよび層別）振る舞いテスト大規模言語モデルをテストする：その理由と方法モデルテストに不可欠な補完的練習法エラー分析と可視化データ収集のループを閉じることで生産から学ぶ開閉式試験デザイン探索的テストモデルを改善する手段失敗のコストを最小限に抑える設計生産現場でのモニタリングすべてをひとつにまとめる次のステップ学んだことを活かすインクリメントで改善する価値を実証する結論
7.シンプルなテクニックでコードエディターを強化する
IDEを知る利点（と意外な単純さなぜIDEにこだわるのか？IDEがそんなに重要なら、なぜ私はまだIDEについて学んでいないのだろう？プラン2段階で生産性を高めるステージ1：IDEを設定するステージ2：ショーの主役-キーボード・ショートカット君がやったんだ！結論

8.リファクタリングと技術的負債管理
技術的負債：歯車の中の砂テスト、デザイン、リファクタリングを通じて健全な負債レベルに到達するリファクタリング入門ノートブック（または問題のあるコードベース）をリファクタリングする方法地図：旅の計画ザ・ジャーニー旅に出るこれまでの成果を振り返る現実世界における技術的負債管理技術的負債管理テクニック債務にポジティブなレンズを：システムの正常性格付け結論良いことを簡単にする
9.MLOpsとMLの継続的デリバリ(CD4ML)
MLOps：強みと欠けているパズルピースMLOps 101匂い見落としのヒントマシンラーニングの継続的デリバリCD4MLの利点継続的デリバリの原則に関するクラッシュコースCD4MLの構成要素：本番に備えたMLシステムの作成CD4MLはどのようにMLガバナンスと責任あるAIをサポートしているか？結論
III.チーム
10.効果的なMLチームの構成要素
MLチームが直面する共通の課題効果的なチーム内部構成要素としての信頼コミュニケーション多様な会員目的を持って、進歩を共有する効果的なチームを作るための社内戦術エンジニアリングの効果でフローを改善するフィードバックループ認知的負荷フロー状態結論
11.効果的なML組織
ML組織が直面する共通の課題チーム・オブ・チームとしての効果的な組織バリュー・ドリブン・ポートフォリオ・マネジメントの役割チーム・トポロジー・モデルMLチームのチームトポロジー効果的なチームを作るための組織戦術インテンショナル・リーダーシップ効果的なチームのための仕組みとシステムを作成する利害関係者を巻き込み、組織のリソースを調整する心理的安全性を培う継続的改善のチャンピオン失敗を学習の機会として受け入れる私たちが望んでいた文化を築くチームが職場で遊ぶことを奨励する結論エピローグダナの旅
インデックス
著者について

Content preview from 効果的なマシンラーニングチーム

第4章. 効果的な依存マネジメントの実践

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている：translation-feedback@oreilly.com

前の章では、効果的な依存関係管理の原則（4つの原則を思い出せるだろうか）と、それをサポートするツールについて説明した。この章では、それらを楽しみながら実践してみよう。

この章では、次のことを学ぶ：

チェックアウト＆ゴー」の実際とは？
Docker、batect、Poetryを使用して、MLのデリバリーライフサイクルの各ステップにおいて、一貫性があり、再現性があり、本番に近い実行環境を作成する方法。
依存関係のセキュリティ脆弱性を自動的に検出し、依存関係のアップデートを自動化する方法

この章のテクニックは、MLコードのための再現可能で、一貫性があり、分離された、本番のような実行環境を作成するために、実際のプロジェクトで使っているものである。これらのテクニックは、効果的かつ安全に依存関係を管理し、依存性地獄を避けるのに役立つ。

始めよう！

文脈の中でML開発ワークフロー

このセクションでは、"check out and go "を実際に見ることができる。コード・エクササイズでは、ローン不履行の可能性を予測するモデルをトレーニングし、提供することを目標に、以下のステップを実行する：

goスクリプトを実行して、ホストマシンに前提条件の依存関係をインストールする。
Docker化されたローカル開発環境を作成する。
プロジェクトのバーチャル環境を理解するようにコード・エディターを設定し、コーディング・アシスタントを使えるようにする。
ML開発ライフサイクルにおける一般的なタスクを実行する（モデルのトレーニング、テストを実行する、APIを開始するなど）。
クラウド上でモデルをトレーニングし、デプロイする。

この章を最大限に活用するために、フォークしてクローンし、ハンズオン・エクササイズ（ローンの貸し倒れの可能性を予測する分類器の訓練とテスト）に沿ってコードを書いてみよう。リポジトリをフォークすることをお勧めする。フォークしたリポジトリの GitHub Actions CI パイプラインで Docker と batect が作業しているのを、変更をコミットしてプッシュするときに見ることができるからだ。

コードを説明する前に、典型的なMLワークフローで何をコンテナ化しているかを明確に描いておこう。

何をコンテナ化するかを見極める

プロジェクトをDocker化する最初の、そして最も重要なステップは、何をコンテナ化しているのかを明確にすることだ。これは一部のML実践者を混乱させ、混同された共有状態を引き起こす可能性がある。例えば、MLモデルの開発とMLモデルの提供という2つの異なるタスクの間でイメージを共有すると、本番コンテナ（例えばモデルのWeb API）の中に不必要な開発依存関係（例えばJupyterやPylint）が発見されるかもしれない。これはコンテナのビルドと起動時間を不必要に長くし、APIの攻撃対象領域を拡大する。

ソフトウェア開発において、コンテナ化する最も一般的なものは、ウェブアプリケーションやウェブAPIである。これは、コマンド（例えば、python manage.py runserver ）を実行した後に開始される、単に寿命の長いプロセスである。MLでは、API経由でモデルの予測（推論）を提供するために、コンテナ化されたWebアプリケーションを使うこともできる。しかし、我々は通常、単なるウェブ・アプリケーション以上のものを実行していることを発見する。例えば、MLソリューションを作成する際に実行する一般的なMLタスクやプロセスを以下に示す： ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341632370

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design