October 2021
Beginner to intermediate
344 pages
3h 53m
Japanese
前の章では、バイアスにまつわる最悪の事態、すなわち実社会にあまりにも深く根付いているバイアスの場合、反論の材料となるデータの収集さえ不可能な状況もあり得ることを紹介しました。続くこの章ではデータサイエンティスト自身のバイアスが招くアルゴリズミックバイアスを詳しく見ていきます。多くの場合、アルゴリズムにバイアスが忍び込むのを予防するためのデータが必要なのですが、なぜかデータサイエンティスト自身がこの種のデータの収集を怠ってしまうことがあるのです。
「4章 モデルの開発」でデータサイエンティストがアルゴリズム(モデル)を開発する際には、多数の工程をこなし、そのそれぞれで数多くの判断を下していかなければならないことを紹介しました。こうした判断がアルゴリズミックバイアスを誘発してしまうことがありますが、その主因として次の3つがあげられます。
「何か知りたいことがあったら訊け」——これは社会通念のひとつですが、データに関してもこれが当てはまる場合があります。かなり有力と思える仮説を立てられたとしても、さらにデータを詳しく検討して他の選択肢がないか自分から模索しない限り、データは何も教えてくれません。 ...