Skip to Content
高リスク分野のための機械学習 ―責任あるAI構築のための実践アプローチ
book

高リスク分野のための機械学習 ―責任あるAI構築のための実践アプローチ

by Patrick Hall, James Curtis, Parul Pandey, 高江洲 勲, 伊東 道明, 園田 道夫, 北條 孝佳, 石川 太一
September 2025
Intermediate to advanced
476 pages
7h 51m
Japanese
O'Reilly Japan, Inc.
Content preview from 高リスク分野のための機械学習 ―責任あるAI構築のための実践アプローチ

10章XGBoostによるバイアスのテストと修正

本章では、構造化データにおけるバイアステストおよびその改善手法について解説する。4章においては、バイアスに関連する問題を多角的に取り上げたが、本章ではバイアスに関する技術的な実装に焦点を当てる。はじめに、クレジットカードデータの派生データを用いて、XGBoostモデルを学習する。その後、人口統計学的な各グループ間における性能差および予測結果の偏りを分析することで、モデルのバイアスを評価する。加えて、個々の観測単位におけるバイアスの懸念を特定する試みも行う。モデル予測において、測定可能なバイアスが存在することを確認した後は、そのバイアスの修正、すなわち改善を試みる。改善のアプローチとしては、学習データ(前処理)、モデル内部(中間処理)、および出力結果(後処理)のいずれか、または複数を対象とした技術を適用する。最後に、性能を維持または向上させつつ、公平性の高いモデルを実現するために、バイアスを考慮したモデル選択を行い、本章を締めくくる。

技術的なテストやバイアスの修正が、機械学習におけるバイアスの問題を完全に解決するわけではないことは、すでに述べた通りである。しかし、これらの取り組みは、バイアス軽減や機械学習のガバナンス・プログラムの実施において、極めて重要な役割を果たすものである。モデルが出力する公平なスコアが、そのままデプロイされたシステムにおける公平な結果につながるとは限らない(その背景には複雑な要因が存在する)。それでもなお、公平性を考慮したスコアを持つことは、持たない場合よりも望ましいといえる。さらに、実務の観点からも、人を対象とするモデルに対してバイアスの観点でテストを行うことは、データサイエンティストが果たすべき基本かつ明白な倫理的責務の1つであると考える。加えて、以前より繰り返し述べてきたように、「未知のリスクは、既知のリスクよりも管理がはるかに困難である」という原則も忘れてはならない。仮にシステムにバイアスのリスクや潜在的な害が存在する可能性を認識できていれば、そのバイアスを軽減する措置を講じることができる。具体的には、バイアスの監視、バグバウンティの実施、ユーザーインタビューの活用といった社会技術的なリスク管理手法を適用することで、バイアスによる影響を抑制することが可能となる。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

仕事ではじめる機械学習 第2版

仕事ではじめる機械学習 第2版

有賀 康顕, 中山 心太, 西林 孝
生成AIのプロンプトエンジニアリング ―信頼できる生成AIの出力を得るための普遍的な入力の原則

生成AIのプロンプトエンジニアリング ―信頼できる生成AIの出力を得るための普遍的な入力の原則

James Phoenix, Mike Taylor, 田村 広平, 大野 真一朗, 砂長谷 健, 土井 健, 大貫 峻平, 石山 将成

Publisher Resources

ISBN: 9784814401277Publisher Website