
90 4 章 スコアとランキング
図 4 -3 バスケットボール(左)とフットボール(右)のポジションは、大部分が身体の大きさで決まる
図 4
-3 では、ポジションによる BMI の分布を示している。バスケットボールでは、ガードは滑らかで敏
捷な動きを示すのに対し、センターは背が高く威圧的である。そのため、ポジションが身体の大きさによっ
て明確に分かれている。フットボールでは、スキルプレーヤーたち(クォーターバック、キッカー、パン
ターなど)はラインの重量級の選手たちよりもかなり小柄だ。
4.2 スコアリング関数の開発
スコアは、個々のデータポイントを数値に変換する関数のことである。この節では、効果的なスコアリン
グ関数を作成し、評価するための基本アプローチを見ていく。
4.2.1 明確な基準(ゴールドスタンダード)とその代用尺度
歴史的に、紙幣は、金(ゴールド)が基準となっており、1 ドル紙幣は 1 ドル分の金と必ず交換できた。
その当時、紙幣が単に印刷された紙よりも価値があると考えられていたのはそのためである。
データサイエンスで金のような基準になるのは、正しいと信頼しているラベルや答えである。BMI が最
初に考案されたときの基準は、少数の被験者を対象として慎重に測定された体脂肪率だった。もちろん、こ
のような測定には誤差がつきものだが、この値を健康の明確な基準と定義することにより、我々は BMI を
正しい指標として受け入れているのである。金は、我々に信頼されている。
金本位制のような基準があれば、我々は厳密な形で優れたスコアリング関数を作ることができる。線形回 ...