October 2025
Intermediate to advanced
328 pages
3h 56m
Japanese
生存時間解析とは、物事がどれだけ持続するかを記述する手法です。人間の寿命を研究するためによく用いられますが、機械部品や電子部品の「生存」、あるいはより一般的に、あらゆる種類の事象が発生するまでの時間間隔、さらには空間的な間隔にも適用できます。
まず簡単な例として電球の寿命から始め、次に米国における過去50年間の初婚年齢の変化という、より実質的な例を考察します。
生存時間解析の基本概念は生存関数であり、これは特定の期間を超えて生存する集団の割合を示します。最初の例として、電球の寿命に関する生存関数を計算します。
2007年に実施された実験データを使います。研究者たちは50個の新しい電球を設置し、連続点灯させました。彼らは12時間ごとに電球をチェックし、寿命が切れた電球の寿命を記録し、50個すべての電球の寿命が切れるまで実験を続けました。データのダウンロード方法は13章のノートブック(chap13.ipynb)で説明しています。
データは以下のように読み込めます。
df = pd.read_csv("lamps.csv", index_col=0)df.tail()
| i | h | f | K |
|---|---|---|---|
| 28 | 1812 | 1 | 4 |
| 29 | 1836 | 1 | 3 |
| 30 | 1860 | 1 | 2 |
| 31 | 1980 | 1 | 1 |
| 32 | 2568 | 1 | 0 |
h列には、寿命が時間単位で記録されており、f列には、hの各値で寿命を迎えた電球の数が記録されています。寿命の分布を表すために、これらの値をPmfオブジェクトに入れ、正規化します。
from empiricaldist import Pmfpmf_bulblife = Pmf(df["f"].values, index=df["h"])pmf_bulblife.normalize() ...
Read now
Unlock full access