book

効果的なマシンラーニングチーム

Name: 効果的なマシンラーニングチーム
ISBN: 9798341632370

by David Tan, Ada Leung, David Colls

March 2025

Intermediate to advanced

402 pages

5h 58m

Japanese

O'Reilly Media, Inc.

Audio summary available

Read now

Unlock full access

序文
この本は誰のためにあるのか？本書の構成パートI：製品と配送パートII：エンジニアリングパート III: チーム追加考察本書で使用されている慣例コード例を使うオライリー・オンライン・ラーニング問い合わせ先謝辞デビッド・タンよりエイダ・レオンよりデビッド・コルスより
1.MLソリューション提供の課題とベターパス
ML：約束と失望MLへの楽観的な見方が続いているMLプロジェクトはなぜ失敗するのかより良い方法はあるか？システム思考とリーンはどのように役立つか問題を "MLOps "することはできない全体を見る：効果的なML配信のためのシステム思考のレンズ効果的なML配信に必要な5つの規律結論
I.製品と配送
2.MLチームのプロダクトとデリバリ・プラクティス
MLプロダクト・ディスカバリー商品機会を発見する製品機会を定義するためのキャンバスソリューションを迅速に設計、提供、テストするテクニックインセプションチームを成功に導くためのセットアップインセプション：インセプションとは何か？インセプションの計画と運営方法ユーザストーリー：MVPの構成要素商品の配送配達活動の順序製品と納期を測定する結論
II.エンジニアリング
3.効果的な依存関係管理：原則とツール
もし我々のコードがいつでもどこでも機能するとしたらどうだろう？より良い方法チェックアウト＆ゴー効果的な依存マネジメントの原則依存関係管理ツールDockerとbatectのクラッシュコースコンテナとは何か？batectでDockerの可動部分を減らす結論
4.効果的な依存マネジメントの実践
文脈の中でML開発ワークフロー何をコンテナ化するかを見極めるハンズオン・エクササイズコンテナによる再現可能な開発環境安全な依存関係管理不要な依存関係を取り除くセキュリティ脆弱性のチェックを自動化する結論
5.自動テスト：物事を壊さずに速く進める
自動テスト：迅速かつ信頼性の高い反復作業の基盤なぜから始める：テスト自動化の利点自動テストがそれほど重要なら、なぜ我々はそれをしないのか？MLシステムの包括的テスト戦略の構成要素何を：テストのためのコンポーネントを特定する良いテストの特徴と避けるべき落とし穴どのようにテストの構造ソフトウェアテスト単体テストトレーニング・スモークテストAPIテストデプロイ後のテスト結論
6.自動テスト：MLモデルのテスト
モデルテストモデルテストの必要性MLモデルのテストの課題MLモデルの適応度関数モデルメトリックテスト（グローバルおよび層別）振る舞いテスト大規模言語モデルをテストする：その理由と方法モデルテストに不可欠な補完的練習法エラー分析と可視化データ収集のループを閉じることで生産から学ぶ開閉式試験デザイン探索的テストモデルを改善する手段失敗のコストを最小限に抑える設計生産現場でのモニタリングすべてをひとつにまとめる次のステップ学んだことを活かすインクリメントで改善する価値を実証する結論
7.シンプルなテクニックでコードエディターを強化する
IDEを知る利点（と意外な単純さなぜIDEにこだわるのか？IDEがそんなに重要なら、なぜ私はまだIDEについて学んでいないのだろう？プラン2段階で生産性を高めるステージ1：IDEを設定するステージ2：ショーの主役-キーボード・ショートカット君がやったんだ！結論

8.リファクタリングと技術的負債管理
技術的負債：歯車の中の砂テスト、デザイン、リファクタリングを通じて健全な負債レベルに到達するリファクタリング入門ノートブック（または問題のあるコードベース）をリファクタリングする方法地図：旅の計画ザ・ジャーニー旅に出るこれまでの成果を振り返る現実世界における技術的負債管理技術的負債管理テクニック債務にポジティブなレンズを：システムの正常性格付け結論良いことを簡単にする
9.MLOpsとMLの継続的デリバリ(CD4ML)
MLOps：強みと欠けているパズルピースMLOps 101匂い見落としのヒントマシンラーニングの継続的デリバリCD4MLの利点継続的デリバリの原則に関するクラッシュコースCD4MLの構成要素：本番に備えたMLシステムの作成CD4MLはどのようにMLガバナンスと責任あるAIをサポートしているか？結論
III.チーム
10.効果的なMLチームの構成要素
MLチームが直面する共通の課題効果的なチーム内部構成要素としての信頼コミュニケーション多様な会員目的を持って、進歩を共有する効果的なチームを作るための社内戦術エンジニアリングの効果でフローを改善するフィードバックループ認知的負荷フロー状態結論
11.効果的なML組織
ML組織が直面する共通の課題チーム・オブ・チームとしての効果的な組織バリュー・ドリブン・ポートフォリオ・マネジメントの役割チーム・トポロジー・モデルMLチームのチームトポロジー効果的なチームを作るための組織戦術インテンショナル・リーダーシップ効果的なチームのための仕組みとシステムを作成する利害関係者を巻き込み、組織のリソースを調整する心理的安全性を培う継続的改善のチャンピオン失敗を学習の機会として受け入れる私たちが望んでいた文化を築くチームが職場で遊ぶことを奨励する結論エピローグダナの旅
インデックス
著者について

Content preview from 効果的なマシンラーニングチーム

第6章自動テスト自動テスト：MLモデルのテスト

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている：translation-feedback@oreilly.com

前の章では、MLソリューションに自動テストを導入しないことの代償と、品質、フロー、認知的負荷、満足度といった点で、テストがチームにもたらす利点について見てきた。我々は、包括的なテスト戦略の構成要素を概説し、テストの最初のカテゴリーであるソフトウェアテストの詳細に飛び込んだ。

この章では、次のテストカテゴリーを探求する：MLモデルテスト（略してモデルテスト）だ。大規模言語モデル（LLM）は一世を風靡したので、LLMとLLMアプリケーションをテストするテクニックも取り上げる。

さらに、可視化とエラー分析、データ収集ループの閉鎖、オープン・クローズドなテスト設計など、MLモデルテストを補完するプラクティスについても探求する。また、MLシステムにこれらのテストを実装するのに役立つ具体的な次のステップで締めくくる前に、データテストについても簡単に説明する。

この章では、スケールの大きなオフライン・テストに焦点を当て、オンライン・テストのテクニック（A/Bテスト、バンディット、インターリーブ実験など）については、Chip Huyenの名著『Designing Machine Learning Systems』（O'Reilly）で十分にカバーされているので、ここでは取り上げない。

モデルテスト

ML実務者は、手動のモデル評価手順を知らないわけではなく、そのようなテストの手探り的な性質は、モデル開発の初期段階では有用であるが、この手動の作業は、過度に時間がかかり、退屈になりやすい。モデルが「十分良い」か「以前より良い」かを判断する尺度とヒューリスティックを特定するにつれて、モデルテストを使用して、これらの手作業によるヒューリスティックとチェックを自動化することができる。そうすることで、時間とエネルギーを他のもっと興味深い問題を解決するために使うことができる。

この章では、トレーニングしたモデル（この章でテストする対象）をテストする理由、内容、方法について詳しく説明する。本章でテストする対象である：

MLモデルの自動テストが必要な理由
MLモデルのテストの課題
適応度関数の概念は、これらの課題を克服する上でどのように役立つのだろうか？
一般的な2種類のモデルテストの実装方法：メトリックテストと振る舞いテスト
LLMとLLM申請書のテスト方法

それじゃあ、飛び込もうか！

モデルテストの必要性

、MLのデリバリーサイクルを靴の箱を生産する工場に見立ててみよう。データサイエンティストは、靴を作成し、靴の品質をテストする。通常は、部分的に自動化され、アドホックに行われる。後者のグループ（MLエンジニア）は、自動化によって生産ラインのスピードを上げようとするが、前者（データサイエンティスト）は、モデルの品質チェックが手作業である限り、知らず知らずのうちにボトルネックになってしまう。

時間が経つにつれて、新しくさまざまな製品要件に対応し、さまざまなテクニックを実験しようとすると、MLOpsパイプラインで作成された新しいシューズ（モデル）を含むすべての箱の品質テストを行うために、生産ラインを減速させるか、生産スピードに追いつくために各箱の中身の品質チェックを見送らなければならなくなる。

特に "デリバリプレッシャー "にさらされているとき、チームが品質よりもスピードを選ぶのはよくあることだ。すべてのボックス（例えば、すべてのコードコミット）をチェックする代わりに、10〜15のボックス（例えば、すべてのプルリクエスト）をチェックするようになる。チームは、プルリクエストの完全な品質チェックやリグレッションテストをスキップして、ボックス内の製品の側面を散発的にチェックするだけになることさえある。当然の帰結として、不具合を発見するのが遅すぎ、不具合が導入された何箱も後になり、生産ラインを止めて多くの疑わしい箱を検査し、不具合の根本原因を突き止めて解決しなければならなくなることがある。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341632370

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design