book

高リスク分野のための機械学習 ―責任あるAI構築のための実践アプローチ

Name: 高リスク分野のための機械学習 ―責任あるAI構築のための実践アプローチ
ISBN: 9784814401277

by Patrick Hall, James Curtis, Parul Pandey, 高江洲勲, 伊東道明, 園田道夫, 北條孝佳, 石川太一

September 2025

Intermediate to advanced

476 pages

7h 51m

Japanese

O'Reilly Japan, Inc.

Read now

Unlock full access

　表紙
　大扉
　原書大扉
　クレジット
　訳者まえがき
　賞賛の声
　まえがき
　序文
第Ⅰ部　AIリスクマネジメントの理論と実践的応用
　1章　現代の機械学習におけるリスク管理
　　1.1　法的規制の概要　　　1.1.1　EUのAI規則　　　1.1.2　米国連邦法および規制　　　1.1.3　州と自治体の法律　　　1.1.4　基本的な製造物責任法　　　1.1.5　連邦取引委員会の執行　　1.2　権威あるベストプラクティス　　　NIST AI RMFクロスウォーク　　1.3　AIインシデント　　1.4　機械学習リスク管理のための文化的能力　　　1.4.1　組織の説明責任　　　1.4.2　効果的なチャレンジの文化　　　1.4.3　多様で経験豊富なチーム　　　1.4.4　自分たちのシャンパンを飲む　　　1.4.5　素早く行動して破壊せよ　　1.5　機械学習リスク管理のための組織プロセス　　　1.5.1　故障モードの予測　　　1.5.2　モデル・リスク管理プロセス　　　1.5.3　モデル・リスク管理を超えて　　1.6　事例：ZillowのiBuyingの興隆と衰退　　　1.6.1　フォールアウト　　　1.6.2　教訓　　1.7　参考文献

　2章　解釈可能性と説明可能性
　　　NIST AI RMFクロスウォーク　　2.1　解釈可能性と説明可能性のための重要な考え方　　2.2　説明可能なモデル　　　2.2.1　加法モデル　　　2.2.2　決定木　　　2.2.3　説明可能な機械学習モデルのエコシステム　　2.3　事後的（Post Hoc）説明　　　2.3.1　特徴量寄与度と特徴量の重要度　　　2.3.2　代理モデル　　　2.3.3　モデルの性能をプロット　　　2.3.4　クラスタ・プロファイリング　　2.4　事後的説明の実務上の頑固な困難性　　2.5　解釈可能なモデルと事後的説明の組み合わせ　　2.6　事例：アルゴリズムによる成績評価の失敗例　　2.7　参考文献
　3章　機械学習システムの安全性と性能の検証
　　　NIST AI RMFクロスウォーク　　3.1　学習　　　3.1.1　再現性　　　3.1.2　データ品質　　　3.1.3　実世界での結果を得るためのモデル仕様　　3.2　モデル・デバッギング　　　3.2.1　ソフトウェア・テスト　　　3.2.2　伝統的なモデル評価　　　3.2.3　一般的な機械学習のバグ　　　信頼性、ロバスト性、レジリエンスに関する用語の整理　　　3.2.4　残差分析　　　3.2.5　感度分析　　　3.2.6　ベンチマーク・モデル　　　3.2.7　修復：バグ修正　　3.3　デプロイメント　　　3.3.1　ドメイン安全性　　　安全な機械学習システムの特徴　　　3.3.2　モデル監視　　3.4　事例：自動運転による死者　　　3.4.1　フォールアウト　　　3.4.2　準備されていないシステム　　　3.4.3　教訓　　3.5　参考文献
　4章　機械学習におけるバイアスの管理
　　　NIST AI RMFクロスウォーク　　4.1　ISOおよびNISTによるバイアスの定義　　　4.1.1　システミック・バイアス　　　4.1.2　統計的バイアス　　　4.1.3　人間のバイアスとデータサイエンス文化　　4.2　米国におけるMLバイアスの法的概念　　4.3　MLシステムからバイアスを経験しやすい人々　　4.4　人々が経験する害　　4.5　バイアス・テスト　　　4.5.1　データのテスト　　　4.5.2　伝統的アプローチ：等価な結果のテスト　　　4.5.3　新しいマインドセット：等価な性能品質のテスト　　　4.5.4　将来の展望：広範なMLエコシステムのためのテスト　　　4.5.5　テスト計画概要　　4.6　バイアスの緩和　　　4.6.1　技術的なバイアス緩和要因　　　4.6.2　科学的方法と実験デザイン　　　4.6.3　技術的なバイアス緩和アプローチ　　　4.6.4　人間要因によるバイアス緩和　　4.7　事例：バイアス・バグバウンティ　　4.8　参考文献
　5章　機械学習のセキュリティ
　　　NIST AI RMFクロスウォーク　　5.1　セキュリティの基礎　　　5.1.1　敵対的な思考　　　5.1.2　CIA 3要素　　　5.1.3　データ・サイエンティストのベストプラクティス　　5.2　機械学習システムに対する攻撃手法　　　5.2.1　完全性を侵害する攻撃：機械学習モデルの出力を操作　　　5.2.2　機密性を侵害する攻撃：情報の窃取　　5.3　一般的な機械学習セキュリティの懸念事項　　5.4　対策　　　5.4.1　セキュリティのためのモデル・デバッグ　　　5.4.2　セキュリティ確保のためのモデル監視　　　5.4.3　プライバシー強化技術（Privacy-Enhancing Technologies：PETs）　　　データサイエンティストはプライバシーについて他に何を知るべきか？　　　5.4.4　ロバストML　　　5.4.5　一般的な対策　　5.5　事例：実際に発生した回避攻撃　　　5.5.1　回避攻撃　　　5.5.2　教訓　　5.6　参考文献
第Ⅱ部　AIリスクマネジメントの実践
　6章　説明可能なブースティング・マシンおよびXGBoostの説明
　　6.1　概念の復習：機械学習の透明性　　　6.1.1　加法性と相互作用　　　6.1.2　制約を用いた因果性へのステップ　　　6.1.3　部分的依存と個別条件期待（ICE）　　　6.1.4　Shapley値　　　6.1.5　モデルの文書化　　6.2　説明可能なモデルのGAMファミリー　　　6.2.1　Elastic Net——ペナルティ付きGLMのアルファおよびラムダ探索　　　6.2.2　一般化加法モデル（GAM）　　　6.2.3　GA2Mと説明可能なブースティング・マシン　　6.3　制約と事後説明を伴うXGBoost　　　6.3.1　制約ありと制約なしのXGBoost　　　6.3.2　部分的依存プロットとICEを用いたモデル挙動の説明　　　6.3.3　モデル説明手法としての代替決定木モデル　　　6.3.4　Shapley値を用いた説明　　　6.3.5　Shapley値の課題　　　6.3.6　より情報に基づいたモデル選択　　6.4　参考文献
　7章　PyTorchを用いた画像分類器の説明
　　7.1　胸部X線画像分類の説明　　7.2　概念の再確認：説明可能なモデルと事後説明手法　　　7.2.1　説明可能なモデルの概要　　　7.2.2　Occlusion法　　　7.2.3　勾配ベースの手法　　　7.2.4　モデル・デバッグのための説明可能なAI　　7.3　説明可能なモデル　　　7.3.1　ProtoPNetとその派生モデル　　　7.3.2　その他の説明可能な深層学習モデル　　7.4　PyTorchを使用した画像分類器の学習と解説　　　7.4.1　学習データ　　　7.4.2　データセットのクラス不均衡問題への対処　　　7.4.3　データ拡張と画像トリミング　　　7.4.4　モデルの学習　　　7.4.5　評価と指標　　　7.4.6　Captumを使用した事後説明の生成　　　7.4.7　モデルの説明を評価する　　　7.4.8　事後説明のロバスト性　　7.5　結論　　7.6　参考文献
　8章　XGBoostモデルの選択とデバッグ
　　8.1　概念の復習：機械学習のデバッグ　　　8.1.1　モデルの選択　　　8.1.2　感度分析　　　8.1.3　残差分析　　　8.1.4　改善　　8.2　より良いXGBoostモデルの選択　　8.3　XGBoostの感度分析　　　教師あり学習を超えた実用的な感度分析　　　8.3.1　XGBoostのストレス・テスト　　　8.3.2　ストレス・テストの方法論　　　8.3.3　景気後退シミュレーションのためのデータ変更　　　8.3.4　敵対的サンプル探索　　8.4　XGBoostの残差分析　　　教師あり学習を超えた実践的なエラー分析　　　8.4.1　残差の分析と可視化　　　8.4.2　セグメントエラー分析　　　8.4.3　残差モデリング　　8.5　選択したモデルの修復　　　8.5.1　PAY_0の過度な注目　　　8.5.2　その他のバグ　　8.6　結論　　8.7　参考文献
　9章　PyTorch画像分類器のデバッグ
　　　言語モデルについて　　9.1　コンセプトの再確認：深層学習モデルのデバッグ　　9.2　PyTorch画像分類器のデバッグ　　　9.2.1　データの品質とリーク　　　9.2.2　深層学習のためのソフトウェア・テスト　　　9.2.3　深層学習の感度分析　　　9.2.4　修復　　　9.2.5　感度の修正　　9.3　結論　　9.4　参考文献
　10章　XGBoostによるバイアスのテストと修正
　　10.1　概念の復習：機械学習のバイアス管理　　10.2　モデルの学習　　10.3　バイアスのためのモデル評価　　　10.3.1　グループへのテストアプローチ　　　混同行列を通じて考える　　　10.3.2　個人の公平性　　　10.3.3　プロキシバイアス　　10.4　バイアスの是正　　　10.4.1　前処理　　　10.4.2　中間処理　　　10.4.3　後処理　　　10.4.4　モデル選択　　10.5　結論　　10.6　参考文献
　11章　XGBoostのレッドチーム演習
　　11.1　概念の復習　　　11.1.1　CIAの3要素　　　11.1.2　攻撃　　　11.1.3　対策　　11.2　モデル学習　　11.3　レッドチームによる攻撃　　　11.3.1　モデル抽出攻撃　　　11.3.2　敵対的サンプル攻撃　　　11.3.3　メンバーシップ推論攻撃　　　11.3.4　データ汚染　　　11.3.5　バックドア　　11.4　結論　　11.5　参考文献
第Ⅲ部　結論
　12章　高リスクの機械学習で成功する方法
　　12.1　この部屋には誰がいるのか？　　12.2　科学と工学　　　12.2.1　データ科学的な手法　　　12.2.2　科学的手法　　12.3　発表された結果と主張の評価　　12.4　外部規格の適用　　12.5　常識的なリスク軽減　　12.6　結論　　12.7　参考文献
　著者紹介
　奥付

Content preview from 高リスク分野のための機械学習 ―責任あるAI構築のための実践アプローチ

3章機械学習システムの安全性と性能の検証

長い間、機械学習モデルの品質を判断する基準として、テストデータにおけるエラー率や正解率が用いられてきた。しかし、機械学習モデルがAIシステムに組み込まれ、より広範なアプリケーションに導入されるようになるにつれ、従来の標準的な評価アプローチが不十分であることが明らかとなっている。たとえば、テストデータ全体に対するAUC（Area Under the Curve）などの指標では、モデルに内在するバイアスやアルゴリズムによる差別、透明性の欠如、プライバシー侵害、セキュリティの脆弱性といった重要な問題を捉えることができない。これらの要因により、AIシステムは初回のデプロイ時に失敗することが多い。実用的なアプリケーションとして十分な性能を得るためには、従来の研究用プロトタイプ向けに設計された機械学習評価の枠組みを超える必要がある。さらに、1章で述べた適切な文化的能力およびプロセス制御を、信頼性を高める機械学習技術と組み合わせることによって、安全性と性能を最大化することが可能である。本章では、AIをアプリケーションとして活用する際の安全性、性能、信頼性をテストおよび改善するための各種技術的アプローチについて掘り下げ、機械学習システムの学習、デバッグ、デプロイメントに関する実践的知見を紹介する。また、8章および9章では、モデルのデバッグに関する詳細なコード例を示す。

NIST AI RMFクロスウォーク

該当する箇所	NIST AI RMFのサブカテゴリ
「3.1.1　再現性」	GOVERN 1.2、GOVERN 1.4、MAP 2.3、MEASURE 1、MEASURE 2.1、MEASURE 2.3
「3.1.2　データ品質」	GOVERN 1.2、MAP ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9784814401277Publisher Website

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

高リスク分野のための機械学習 ―責任あるAI構築のための実践アプローチ

by Patrick Hall, James Curtis, Parul Pandey, 高江洲勲, 伊東道明, 園田道夫, 北條孝佳, 石川太一