
88 4 章 スコアとランキング
この章では、データ分析のための第一歩として、スコアリング関数およびランキング関数を使う。誰もが
私と同じようにこれらの関数を気に入っているわけではない。スコアリング関数は、作為的な思いつきに見
えることが多く、不適切な人間が使えば、本質的に無意味であるにも関わらず、それらしい数字を作り出し
てしまう。一般にスコアリング関数の有効性は検証不能なので、あとの章で取り上げる統計学的な手法や機
械学習を使った手法よりも非科学的な印象を受けるだろう。
しかし、私は、大規模なデータセットを細かく分割して理解するために役立つ場面では、スコアリング関
数の価値を認めることが大切だと思う。さっそく、データから意味のあるスコアを引き出す方法をいくつか
紹介しよう。
4.1 BMI(ボディマス指数)
食べることは誰もが好きだ。ものにあふれた現代の世界では、たくさん食べる機会が無数にある。その結
果、多くの人が、適正な体重よりも重い。しかし、自分が適正体重より重いかを判断するにはどうすればよ
いだろうか。
BMI(
body mass index、体格指数)は、体重がコントロールできているかどうかがわかるスコア、つまり
統計量である。この数値は、次のように定義される。
BMI =
体重
身長
2
なお単位は、体重はキログラム、身長はメートルである。
本稿
執筆時点で、私の身長は 68 インチ(1.727 メートル)であるが、体重は 150 ポンド(68.0 キログラ
ム)あり、身長に対して少し重すぎると感じている。上の式で ...