Skip to Content
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
book

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池 彰
May 2018
Intermediate to advanced
556 pages
13h 21m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
402
5
章 機械学習
基底関数位置
Lasso
回帰
図5-50 過度に複雑なモデルに適用されたLasso(L
2
)正則化(図 5-48と違いに注意)
Lasso
回帰のペナルティでは係数の大部分はゼロになり、基底関数の小さなサブセットによって
挙動はモデル化されます。リッジ正則化と同様に、
a
パラメータはペナルティの強さを調整しま
す。この値は、例えば交差検証(「5.3 ハイパーパラメータとモデルの検証」を参照してください)
を使って決定する必要があります。
5.6.4
 事例:自転車の交通量予測
事例として、シアトルのフリーモント橋を渡る自転車の数を、天候、季節、およびその他の要因
に基づいて予測できるか見てみましょう。このデータは、既に「3.12 時系列」で使いました。
この節では、自転車数のデータを別のデータセットと結合し、天候と季節要因(気温、降水
量、日中時間)がこの橋を通る自転車の数にどの程度影響するかを調べます。幸いにも、
NOAA
タ(
http://www.ncdc.noaa.gov/cdo-web/search?datasetid=GHCND
ID
USW00024233
のデータを使用)を公開しています。
pandas
を使用すれば、この
2
つのデータソース
へのアクセスは簡単です。どのパラメータの変化が自転車の数にどのような影響を与えるかを推定
するために、気象およびその他の情報と自転車数と関連付ける単回帰を行います。
特に、これは
scikit-learn
のツールを統計モデル化フレームワークとして使用する例であり、モデ ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池 彰
初めてのGraphQL ―Webサービスを作って学ぶ新世代API

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎 沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873118413Other