October 2025
Intermediate to advanced
328 pages
3h 56m
Japanese
度数分布表とPMFは分布を表す最もよく使われる方法ですが、この章で説明するように、それらには限界があります。その代わりが累積分布関数(CDF)で、これはパーセンタイルを計算するのに便利で、特に分布を比較するのに役立ちます。
また、分布の位置、広がり、歪度を定量化するために、パーセンタイルに基づく統計量を計算します。
標準化されたテストを受けたことがある人は、おそらくその結果を生の得点(raw score)とパーセンタイル順位(percentile rank)という形で受け取ったことでしょう。ここでいうパーセンタイル順位とは、自分以下の点数を取った人の割合のことです。つまり、あなたが「90パーセンタイル」にいるならば、あなたは受験者の90%以上の成績を取ったことになります。
パーセンタイルとパーセンタイル順位を理解するために、ランニングの速度を例に考えてみましょう。数年前、私はマサチューセッツ州で開催された10キロのロードレース「ジェイムズ・ジョイス・ランブル」に出場しました。レース後、自分のタイムが他のランナーと比べてどうだったかを確認するために結果をダウンロードしました。
データのダウンロード方法は、4章のノートブック(chap04.ipynb)で説明しています。relay.pyモジュールには、この結果を読み込み、PandasのDataFrameを返す関数が用意されています。
from relay import read_resultsresults = read_results()results.head()
| Place | Div/Tot | Division | Guntime | Nettime | Min/Mile | MPH ... |
|---|
Read now
Unlock full access