
97
97
4.4 外れ値
CV
が便利なのは、同じデータ集合をフィートとインチで記述した場合は明白だ。
60
イン
チは
5
フィートと同じである。フィートで記述された平均値は
5.5566
で標準偏差は
0.2288
。
同じデータをインチで記述すると、平均値は
66.6790
で標準偏差は
2.7453
。しかし、
CV
は
単位に影響されないので、どちらとも(数値を丸めた誤差を除いて)同じ結果である。
5.5566/0.2288
=
24.2858
(フィートのデータ)
66.6790/2.7453
=
24.2884
(インチのデータ)
4.4
外れ値
外れ値をどう定義するかにおいて、統計学者の間に絶対的な同意は存在しない。しかし、
ほとんど全員が外れ値を特定し外れ値があるデータ集合に対しては、適正な分析手法を使う
のが重要であることに関しては同意している。外れ値は、分析されるデータ集合内で他から
かなり異なる値のデータ点や、観察結果である。これは異なる母集団からのデータや、他の
データポイントの通常パターン以外として記述される。標本や母集団から教育の達成度を調
査するとしよう。ほとんどの対象者は
12
年間から
16
年間、通学していたとする(
12
年間=
高卒。
16
年間=大卒)。しかし、対象者の
1
人の値が
0
(これは公的な教育を全く受けてい
ないことを意味する)で、もう
1
人は
26
(大卒後に教育を受けた年数が多いことを意味する)
だったとする。彼らの値は母集団の標本の他のデータからかなり離れているので、おそらく
この
2
つの値を外れ値として考えるだろう。外れ値の特定と分析は、データ分析の多くの場 ...