11章線形回帰とANOVA
統計学では、モデリングからが本題です。モデルは変数間の関係を定量化します。モデルがあると、予測ができるのです。
線形単回帰は最も基本的なモデルです。単回帰では2つの変数を、誤差項のある線形関係としてモデル化します。
この式からxとyのデータが与えられます。目的はモデルをフィットさせることで、β0とβ1の最良推定値が得られます(レシピ11.1を参照)。
当然ながらこれは線形重回帰に一般化されます。線形重回帰では、関係の右辺に複数の変数を持ちます(レシピ11.2を参照)。
統計学者はu、v、wを予測変数と呼び、yを応答変数と呼びます。もちろん、このモデルは予測変数と応答変数の間に適正な線形関係がある場合にだけ有効ですが、この要件は思っているほど制約にはなりません。レシピ11.12では、線形回帰という有用な仕組みを使えるように、変数を線形関係に変換する方法について説明しています。
Rには、これらのモデルを誰でも簡単に構築できるという利点があります。モデルはlm
という関数で作成し、この関数はモデルオブジェクトを返します。モデルオブジェクトから係数()と回帰統計量が簡単に得られます。
誰でもこのようにモデルを構築できてしまうことがRの恐ろしい点でもあります。モデルが適切か、統計学的に有意かを調べなくてもモデルは得られます。しかし、モデルをやみくもに信じる前によく調べてください。必要な情報のほとんどは、回帰要約に含まれています( ...
Get Rクックブック 第2版 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.