book

高リスク分野のための機械学習 ―責任あるAI構築のための実践アプローチ

Name: 高リスク分野のための機械学習 ―責任あるAI構築のための実践アプローチ
ISBN: 9784814401277

by Patrick Hall, James Curtis, Parul Pandey, 高江洲勲, 伊東道明, 園田道夫, 北條孝佳, 石川太一

September 2025

Intermediate to advanced

476 pages

7h 51m

Japanese

O'Reilly Japan, Inc.

Read now

Unlock full access

　表紙
　大扉
　原書大扉
　クレジット
　訳者まえがき
　賞賛の声
　まえがき
　序文
第Ⅰ部　AIリスクマネジメントの理論と実践的応用
　1章　現代の機械学習におけるリスク管理
　　1.1　法的規制の概要　　　1.1.1　EUのAI規則　　　1.1.2　米国連邦法および規制　　　1.1.3　州と自治体の法律　　　1.1.4　基本的な製造物責任法　　　1.1.5　連邦取引委員会の執行　　1.2　権威あるベストプラクティス　　　NIST AI RMFクロスウォーク　　1.3　AIインシデント　　1.4　機械学習リスク管理のための文化的能力　　　1.4.1　組織の説明責任　　　1.4.2　効果的なチャレンジの文化　　　1.4.3　多様で経験豊富なチーム　　　1.4.4　自分たちのシャンパンを飲む　　　1.4.5　素早く行動して破壊せよ　　1.5　機械学習リスク管理のための組織プロセス　　　1.5.1　故障モードの予測　　　1.5.2　モデル・リスク管理プロセス　　　1.5.3　モデル・リスク管理を超えて　　1.6　事例：ZillowのiBuyingの興隆と衰退　　　1.6.1　フォールアウト　　　1.6.2　教訓　　1.7　参考文献

　2章　解釈可能性と説明可能性
　　　NIST AI RMFクロスウォーク　　2.1　解釈可能性と説明可能性のための重要な考え方　　2.2　説明可能なモデル　　　2.2.1　加法モデル　　　2.2.2　決定木　　　2.2.3　説明可能な機械学習モデルのエコシステム　　2.3　事後的（Post Hoc）説明　　　2.3.1　特徴量寄与度と特徴量の重要度　　　2.3.2　代理モデル　　　2.3.3　モデルの性能をプロット　　　2.3.4　クラスタ・プロファイリング　　2.4　事後的説明の実務上の頑固な困難性　　2.5　解釈可能なモデルと事後的説明の組み合わせ　　2.6　事例：アルゴリズムによる成績評価の失敗例　　2.7　参考文献
　3章　機械学習システムの安全性と性能の検証
　　　NIST AI RMFクロスウォーク　　3.1　学習　　　3.1.1　再現性　　　3.1.2　データ品質　　　3.1.3　実世界での結果を得るためのモデル仕様　　3.2　モデル・デバッギング　　　3.2.1　ソフトウェア・テスト　　　3.2.2　伝統的なモデル評価　　　3.2.3　一般的な機械学習のバグ　　　信頼性、ロバスト性、レジリエンスに関する用語の整理　　　3.2.4　残差分析　　　3.2.5　感度分析　　　3.2.6　ベンチマーク・モデル　　　3.2.7　修復：バグ修正　　3.3　デプロイメント　　　3.3.1　ドメイン安全性　　　安全な機械学習システムの特徴　　　3.3.2　モデル監視　　3.4　事例：自動運転による死者　　　3.4.1　フォールアウト　　　3.4.2　準備されていないシステム　　　3.4.3　教訓　　3.5　参考文献
　4章　機械学習におけるバイアスの管理
　　　NIST AI RMFクロスウォーク　　4.1　ISOおよびNISTによるバイアスの定義　　　4.1.1　システミック・バイアス　　　4.1.2　統計的バイアス　　　4.1.3　人間のバイアスとデータサイエンス文化　　4.2　米国におけるMLバイアスの法的概念　　4.3　MLシステムからバイアスを経験しやすい人々　　4.4　人々が経験する害　　4.5　バイアス・テスト　　　4.5.1　データのテスト　　　4.5.2　伝統的アプローチ：等価な結果のテスト　　　4.5.3　新しいマインドセット：等価な性能品質のテスト　　　4.5.4　将来の展望：広範なMLエコシステムのためのテスト　　　4.5.5　テスト計画概要　　4.6　バイアスの緩和　　　4.6.1　技術的なバイアス緩和要因　　　4.6.2　科学的方法と実験デザイン　　　4.6.3　技術的なバイアス緩和アプローチ　　　4.6.4　人間要因によるバイアス緩和　　4.7　事例：バイアス・バグバウンティ　　4.8　参考文献
　5章　機械学習のセキュリティ
　　　NIST AI RMFクロスウォーク　　5.1　セキュリティの基礎　　　5.1.1　敵対的な思考　　　5.1.2　CIA 3要素　　　5.1.3　データ・サイエンティストのベストプラクティス　　5.2　機械学習システムに対する攻撃手法　　　5.2.1　完全性を侵害する攻撃：機械学習モデルの出力を操作　　　5.2.2　機密性を侵害する攻撃：情報の窃取　　5.3　一般的な機械学習セキュリティの懸念事項　　5.4　対策　　　5.4.1　セキュリティのためのモデル・デバッグ　　　5.4.2　セキュリティ確保のためのモデル監視　　　5.4.3　プライバシー強化技術（Privacy-Enhancing Technologies：PETs）　　　データサイエンティストはプライバシーについて他に何を知るべきか？　　　5.4.4　ロバストML　　　5.4.5　一般的な対策　　5.5　事例：実際に発生した回避攻撃　　　5.5.1　回避攻撃　　　5.5.2　教訓　　5.6　参考文献
第Ⅱ部　AIリスクマネジメントの実践
　6章　説明可能なブースティング・マシンおよびXGBoostの説明
　　6.1　概念の復習：機械学習の透明性　　　6.1.1　加法性と相互作用　　　6.1.2　制約を用いた因果性へのステップ　　　6.1.3　部分的依存と個別条件期待（ICE）　　　6.1.4　Shapley値　　　6.1.5　モデルの文書化　　6.2　説明可能なモデルのGAMファミリー　　　6.2.1　Elastic Net——ペナルティ付きGLMのアルファおよびラムダ探索　　　6.2.2　一般化加法モデル（GAM）　　　6.2.3　GA2Mと説明可能なブースティング・マシン　　6.3　制約と事後説明を伴うXGBoost　　　6.3.1　制約ありと制約なしのXGBoost　　　6.3.2　部分的依存プロットとICEを用いたモデル挙動の説明　　　6.3.3　モデル説明手法としての代替決定木モデル　　　6.3.4　Shapley値を用いた説明　　　6.3.5　Shapley値の課題　　　6.3.6　より情報に基づいたモデル選択　　6.4　参考文献
　7章　PyTorchを用いた画像分類器の説明
　　7.1　胸部X線画像分類の説明　　7.2　概念の再確認：説明可能なモデルと事後説明手法　　　7.2.1　説明可能なモデルの概要　　　7.2.2　Occlusion法　　　7.2.3　勾配ベースの手法　　　7.2.4　モデル・デバッグのための説明可能なAI　　7.3　説明可能なモデル　　　7.3.1　ProtoPNetとその派生モデル　　　7.3.2　その他の説明可能な深層学習モデル　　7.4　PyTorchを使用した画像分類器の学習と解説　　　7.4.1　学習データ　　　7.4.2　データセットのクラス不均衡問題への対処　　　7.4.3　データ拡張と画像トリミング　　　7.4.4　モデルの学習　　　7.4.5　評価と指標　　　7.4.6　Captumを使用した事後説明の生成　　　7.4.7　モデルの説明を評価する　　　7.4.8　事後説明のロバスト性　　7.5　結論　　7.6　参考文献
　8章　XGBoostモデルの選択とデバッグ
　　8.1　概念の復習：機械学習のデバッグ　　　8.1.1　モデルの選択　　　8.1.2　感度分析　　　8.1.3　残差分析　　　8.1.4　改善　　8.2　より良いXGBoostモデルの選択　　8.3　XGBoostの感度分析　　　教師あり学習を超えた実用的な感度分析　　　8.3.1　XGBoostのストレス・テスト　　　8.3.2　ストレス・テストの方法論　　　8.3.3　景気後退シミュレーションのためのデータ変更　　　8.3.4　敵対的サンプル探索　　8.4　XGBoostの残差分析　　　教師あり学習を超えた実践的なエラー分析　　　8.4.1　残差の分析と可視化　　　8.4.2　セグメントエラー分析　　　8.4.3　残差モデリング　　8.5　選択したモデルの修復　　　8.5.1　PAY_0の過度な注目　　　8.5.2　その他のバグ　　8.6　結論　　8.7　参考文献
　9章　PyTorch画像分類器のデバッグ
　　　言語モデルについて　　9.1　コンセプトの再確認：深層学習モデルのデバッグ　　9.2　PyTorch画像分類器のデバッグ　　　9.2.1　データの品質とリーク　　　9.2.2　深層学習のためのソフトウェア・テスト　　　9.2.3　深層学習の感度分析　　　9.2.4　修復　　　9.2.5　感度の修正　　9.3　結論　　9.4　参考文献
　10章　XGBoostによるバイアスのテストと修正
　　10.1　概念の復習：機械学習のバイアス管理　　10.2　モデルの学習　　10.3　バイアスのためのモデル評価　　　10.3.1　グループへのテストアプローチ　　　混同行列を通じて考える　　　10.3.2　個人の公平性　　　10.3.3　プロキシバイアス　　10.4　バイアスの是正　　　10.4.1　前処理　　　10.4.2　中間処理　　　10.4.3　後処理　　　10.4.4　モデル選択　　10.5　結論　　10.6　参考文献
　11章　XGBoostのレッドチーム演習
　　11.1　概念の復習　　　11.1.1　CIAの3要素　　　11.1.2　攻撃　　　11.1.3　対策　　11.2　モデル学習　　11.3　レッドチームによる攻撃　　　11.3.1　モデル抽出攻撃　　　11.3.2　敵対的サンプル攻撃　　　11.3.3　メンバーシップ推論攻撃　　　11.3.4　データ汚染　　　11.3.5　バックドア　　11.4　結論　　11.5　参考文献
第Ⅲ部　結論
　12章　高リスクの機械学習で成功する方法
　　12.1　この部屋には誰がいるのか？　　12.2　科学と工学　　　12.2.1　データ科学的な手法　　　12.2.2　科学的手法　　12.3　発表された結果と主張の評価　　12.4　外部規格の適用　　12.5　常識的なリスク軽減　　12.6　結論　　12.7　参考文献
　著者紹介
　奥付

Content preview from 高リスク分野のための機械学習 ―責任あるAI構築のための実践アプローチ

10章XGBoostによるバイアスのテストと修正

本章では、構造化データにおけるバイアステストおよびその改善手法について解説する。4章においては、バイアスに関連する問題を多角的に取り上げたが、本章ではバイアスに関する技術的な実装に焦点を当てる。はじめに、クレジットカードデータの派生データを用いて、XGBoostモデルを学習する。その後、人口統計学的な各グループ間における性能差および予測結果の偏りを分析することで、モデルのバイアスを評価する。加えて、個々の観測単位におけるバイアスの懸念を特定する試みも行う。モデル予測において、測定可能なバイアスが存在することを確認した後は、そのバイアスの修正、すなわち改善を試みる。改善のアプローチとしては、学習データ（前処理）、モデル内部（中間処理）、および出力結果（後処理）のいずれか、または複数を対象とした技術を適用する。最後に、性能を維持または向上させつつ、公平性の高いモデルを実現するために、バイアスを考慮したモデル選択を行い、本章を締めくくる。

技術的なテストやバイアスの修正が、機械学習におけるバイアスの問題を完全に解決するわけではないことは、すでに述べた通りである。しかし、これらの取り組みは、バイアス軽減や機械学習のガバナンス・プログラムの実施において、極めて重要な役割を果たすものである。モデルが出力する公平なスコアが、そのままデプロイされたシステムにおける公平な結果につながるとは限らない（その背景には複雑な要因が存在する）。それでもなお、公平性を考慮したスコアを持つことは、持たない場合よりも望ましいといえる。さらに、実務の観点からも、人を対象とするモデルに対してバイアスの観点でテストを行うことは、データサイエンティストが果たすべき基本かつ明白な倫理的責務の1つであると考える。加えて、以前より繰り返し述べてきたように、「未知のリスクは、既知のリスクよりも管理がはるかに困難である」という原則も忘れてはならない。仮にシステムにバイアスのリスクや潜在的な害が存在する可能性を認識できていれば、そのバイアスを軽減する措置を講じることができる。具体的には、バイアスの監視、バグバウンティの実施、ユーザーインタビューの活用といった社会技術的なリスク管理手法を適用することで、バイアスによる影響を抑制することが可能となる。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9784814401277Publisher Website

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

高リスク分野のための機械学習 ―責任あるAI構築のための実践アプローチ

by Patrick Hall, James Curtis, Parul Pandey, 高江洲勲, 伊東道明, 園田道夫, 北條孝佳, 石川太一

10章XGBoostによるバイアスのテストと修正

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.