高リスク分野のための機械学習 ―責任あるAI構築のための実践アプローチ
by Patrick Hall, James Curtis, Parul Pandey, 高江洲 勲, 伊東 道明, 園田 道夫, 北條 孝佳, 石川 太一
10章XGBoostによるバイアスのテストと修正
本章では、構造化データにおけるバイアステストおよびその改善手法について解説する。4章においては、バイアスに関連する問題を多角的に取り上げたが、本章ではバイアスに関する技術的な実装に焦点を当てる。はじめに、クレジットカードデータの派生データを用いて、XGBoostモデルを学習する。その後、人口統計学的な各グループ間における性能差および予測結果の偏りを分析することで、モデルのバイアスを評価する。加えて、個々の観測単位におけるバイアスの懸念を特定する試みも行う。モデル予測において、測定可能なバイアスが存在することを確認した後は、そのバイアスの修正、すなわち改善を試みる。改善のアプローチとしては、学習データ(前処理)、モデル内部(中間処理)、および出力結果(後処理)のいずれか、または複数を対象とした技術を適用する。最後に、性能を維持または向上させつつ、公平性の高いモデルを実現するために、バイアスを考慮したモデル選択を行い、本章を締めくくる。
技術的なテストやバイアスの修正が、機械学習におけるバイアスの問題を完全に解決するわけではないことは、すでに述べた通りである。しかし、これらの取り組みは、バイアス軽減や機械学習のガバナンス・プログラムの実施において、極めて重要な役割を果たすものである。モデルが出力する公平なスコアが、そのままデプロイされたシステムにおける公平な結果につながるとは限らない(その背景には複雑な要因が存在する)。それでもなお、公平性を考慮したスコアを持つことは、持たない場合よりも望ましいといえる。さらに、実務の観点からも、人を対象とするモデルに対してバイアスの観点でテストを行うことは、データサイエンティストが果たすべき基本かつ明白な倫理的責務の1つであると考える。加えて、以前より繰り返し述べてきたように、「未知のリスクは、既知のリスクよりも管理がはるかに困難である」という原則も忘れてはならない。仮にシステムにバイアスのリスクや潜在的な害が存在する可能性を認識できていれば、そのバイアスを軽減する措置を講じることができる。具体的には、バイアスの監視、バグバウンティの実施、ユーザーインタビューの活用といった社会技術的なリスク管理手法を適用することで、バイアスによる影響を抑制することが可能となる。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access