7章変数間の関係
これまでは、一度に1つの変数だけを見てきました。この章では、変数間の関係について見ていきます。2つの変数が関連しているのは、一方を知ることでもう一方についての情報が得られる場合です。例えば、身長と体重には関係があります。背の高い人は体重も重い傾向があります。もちろんこれは、完全な関係ではありません。背が低くて体重が重い人もいれば、背が高くて体重が軽い人もいます。しかし、誰かの体重を推測しようとする場合、身長を知っていれば、知らない場合よりも正確に推測することができます。
この章では、変数間の関係を可視化する複数の方法と、関係の強さを定量化する方法の1つである相関について説明します。
7.1 散布図
数学が異常に得意な人に出会った場合、その人の言語能力は平均より優れているのか劣っているのか、どちらだと予想しますか。一方では、人はどちらか片方の分野に特化するので、どちらかに秀でている人はもう片方が得意でないかもしれないかもしれません。他方では、一般的に頭のよい人は、両方の分野でも平均以上であると期待するかもしれません。どちらが正しいのか調べてみましょう。
ここでは、1997年の全米青年縦断調査(NLSY97)のデータを使用します。これは「1980年から84年の間に生まれた8,984人のアメリカの若者のサンプルを追跡調査したもの」です。この公開データセットには、大学入試で最もよく使われるSATとACTを含む、標準テストのスコアが含まれています。受験者は数学と言語の分野で別々のスコアを得るため、このデータを使って数学的能力と言語能力の関係を調べることができます。
データのダウンロード方法は、7章のノートブック(chap07.ipynb)で説明しています。read_csv ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access