
4.2 スコアリング関数の開発 91
例え
ば私が、来年のデータサイエンスの講義ではもっと良い成績評価システムを使いたいと考えたとす
る。私は前年の学生の成績データ、つまり宿題とテストの成績を持っているが、学生にふさわしい成績を定
めるための明確な基準はない。私が持っているのは私が学生たちに与えた成績だけであり、成績評価システ
ムの改善には役に立たない。
必要なのは、「本当の」成績という未知の存在の代用尺度である。他の科目の GPA の集計値は、良い代用
尺度の候補になる。一般に、学生の成績はどの教科でも一定している。私の成績評価システムによって成績
上位の学生の GPA が下がり、下位の学生の GPA が上がるなら、私はおそらく何か間違ったことをしている
のだろう。
代用尺度は、スコアリングやランキングシステムの評価では特に効果的である。私も共著者として参加し
た Who’s Bigger?(誰が偉大か:歴史的偉人の本当のランク、未邦訳) [SW13] では、Wikipedia を使って
「重要度」に基づく歴史的人物のランキングを行った。我々は、これらの人物の本当の重要度を測る明確な
基準のあるデータを持っていなかった。しかし、我々は公正性を保つために、自分たちがしていることを評
価するための代用尺度をいくつか用意した。
• コレクターたちが有名人のサインを購入するために使う金額は、一般にその人物の重要度と相関して
いるはずだ。彼らが払う気になる金額が高くなるにつれ、サインの人物は大スターになる。
• 野球選手の成績のすばらしさは、一般にその選手の重要度と相関している ...