
2.4 対数 45
図 2 -12 比
率自体を軸にしてグラフを描くと、大きな比率に対するスペースと比べて小さな比率に対する
スペースが小さくなる(左)。比率の対数を軸としてグラフを描いた方が、データの実態をよく表
現できる(右)
率を 24 時間にわたって記録したものである(個々の赤い点は 1 時間ごとの値を示している)。黒の連続線
は、両方の値が同じで比率が 1 になったところを示している。では、このグラフをよく見てみよう。連続線
の左側が狭い範囲に偏っているので読みにくい。そして、外れ値が目立つ。新しいアルゴリズムが最上行の
7UM917 でうまく機能していないことは間違いない。右に極端に離れた点は紛れもない外れ値だ。
しかし、それ以外に外れ値は見当たらない。では、比率の対数をプロットした図 2 -12(右)を見てみよ
う。黒い線の左右のスペースがほぼ均等だ。そして、最上行の右端の点が実際にはそれほど大きな外れ値で
はないこともわかる。右の外れ値よりも、左端のいくつかの点での改善度の方がはるかに大きい。このグラ
フからは新アルゴリズムの方が全般的によいことがわかるが、それは、比率自体ではなく、比率の対数を
使ってグラフを描いているからだ。
2.4.3 対数と歪んだ分布の正規化
対称的でベル型に分布している変数は、モデルの特徴として適していることが多い。かなりのばらつきを
示しているので、分類に使うことができるが、ばらつきがそれほど激しいわけではないので外れ値がはっき
りとわかる。
しかし、すべての分布が対称的になるわけではない。図 ...