October 2025
Intermediate to advanced
328 pages
3h 56m
Japanese
10章の線形最小二乗法によるフィットは回帰の一例であり、より一般的には「応答変数(従属変数)」と呼ばれるある変数群と、「説明変数(独立変数)」と呼ばれる別の変数群との関係をモデル化する問題を指します。
10章の例では、1つの応答変数と1つの説明変数のみであり、これは単回帰と呼びました。この章では、複数の説明変数と1つの応答変数のみの重回帰に進みます。複数の応答変数がある場合、それは多変量回帰と呼ばれますが、本書では扱いません。
10章では、SciPyのlinregress関数を使って、最小二乗法を計算しました。この関数は単回帰のみに対応しています。重回帰については、StatsModelsパッケージを使います。このパッケージは、さまざまな回帰やその他の分析手法を提供しています。
最初の例として、ペンギンデータを探索し続けます。データを読み込むときには、StatsModelsで使いやすくするために、以下の辞書を使ってスペースを含まない名前を列に付けます。
columns = {"Body Mass (g)": "mass","Flipper Length (mm)": "flipper_length","Culmen Length (mm)": "culmen_length","Culmen Depth (mm)": "culmen_depth",}
これでデータを読み込み、体重が欠損している行を削除し、列の名前を変更することができます。
penguins = (pd.read_csv("penguins_raw.csv").dropna(subset=["Body Mass (g)"]).rename(columns=columns) ...
Read now
Unlock full access