Skip to Content
Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
book

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池 彰
February 2024
Intermediate to advanced
576 pages
9h 17m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

42章詳細:線形回帰

ナイーブベイズ(「41章 詳細:ナイーブベイズ分類」を参照)が分類の適切な出発点であったように、回帰の適切な出発点は線形回帰です。当てはめが高速である点と、解釈が容易であるため人気があります。線形回帰モデルの最も簡単な形式(すなわち、2次元データに直線を当てはめる)はよく知られていますが、モデルを拡張して、より複雑なデータの振る舞いをモデル化できます。

この章では、まず問題の背後にある数学を学んだ後、より複雑なデータパターンを表すために線形モデルを一般化する方法について説明します。

最初に標準的なモジュールをインポートします。

In [1]: %matplotlib inline
        import matplotlib.pyplot as plt
        plt.style.use('seaborn-whitegrid')
        import numpy as np

42.1 単回帰

最も馴染みの深い線形回帰である、データへの直線の当てはめから始めます。直線の当てはめは、yaxbという形のモデルであり、ここでaは傾き(slope)、bは切片(intercept)を表します。

傾きが2で、切片が-5の直線の周りに点在するデータを考えます(図42-1を参照)。

In [2]: rng = np.random.RandomState(1)
        x = 10 * rng.rand(50)
        y = 2 * x - 5 + rng.randn(50)
        plt.scatter(x, y);

図42-1 線形回帰用のデータ

図42-2に示すように、scikit-learnのLinearRegression推定器を使用して、このデータに当てはめた最適な線を作成できます。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池 彰
推薦システム実践入門 ―仕事で使える導入ガイド

推薦システム実践入門 ―仕事で使える導入ガイド

風間 正弘, 飯塚 洸二郎, 松村 優也
プロダクトマネージャーのしごと 第2版 ―1日目から使える実践ガイド

プロダクトマネージャーのしごと 第2版 ―1日目から使える実践ガイド

Matt LeMay, 永瀬 美穂, 吉羽 龍太郎, 原田 騎郎, 高橋 一貴

Publisher Resources

ISBN: 9784814400638Publisher Website