Skip to Content
Pythonによるデータ分析入門 第3版 ―pandas、NumPy、Jupyterを使ったデータ処理
book

Pythonによるデータ分析入門 第3版 ―pandas、NumPy、Jupyterを使ったデータ処理

by Wes McKinney, 瀬戸山 雅人, 小林 儀匡
August 2023
Intermediate to advanced content levelIntermediate to advanced
612 pages
9h 33m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonによるデータ分析入門 第3版 ―pandas、NumPy、Jupyterを使ったデータ処理

12章Pythonにおけるモデリングライブラリ入門

 この本では、Pythonにおけるデータ分析を行うための基盤となるプログラミング技法に着目してきました。データ分析者や科学者はデータラングリング*1に多大な時間を費やすことが多いため、この本の構造は、そのために使う技術を習得する重要さを反映した構造になっています。

*1 訳注:ラングル(wrangle)とは、家畜の世話をする、といった意味があります。データラングリングとは、データを取得した後、分析のために下準備をするような行為をまとめて言う場合によく使われます。

 モデルを開発するために使うライブラリは、何に応用するかによって変わるものです。多くの統計的な問題は、最小二乗法を使った回帰のような単純な手法で解決できますが、より高度な機械学習を要求するような問題も存在します。Pythonは分析手法を実装するための言語として素晴らしい選択肢になりましたので、この本を読み終えた後に手を出すと良さそうな多くのツールが存在します。

 この章では、データラングリングとモデルの最適化や評価との間を行き来するような場合に役立つpandasの機能をいくつか紹介します。その後、人気のある2つのモデリングツールであるstatsmodels(https://www.statsmodels.org)とscikit-learn(https://scikit-learn.org)を簡単に紹介します。これらのプロジェクトはそれぞれ1冊の本を書けるほど巨大なものなので、それらを包括的に説明することはやめておきます。その代わり、それらのプロジェクトのオンラインドキュメントやその他のPythonに関連する統計学や機械学習の本などを案内することにします。

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理

Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理

Wes McKinney, 瀬戸山 雅人, 小林 儀匡, 滝口 開資
行動を変えるデザイン ―心理学と行動経済学をプロダクトデザインに活用する

行動を変えるデザイン ―心理学と行動経済学をプロダクトデザインに活用する

Stephen Wendel, 武山 政直, 相島 雅樹, 反中 望, 松村 草也

Publisher Resources

ISBN: 9784814400195Other