Skip to Content
Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
book

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池 彰
February 2024
Intermediate to advanced
576 pages
9h 17m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

38章scikit-learnの基礎

各種のPythonライブラリが、さまざまな機械学習アルゴリズムの実績ある実装を提供しています。最もよく知られているのは、多数のアルゴリズムを効率的に実装するscikit-learnパッケージ(https://scikit-learn.org/)です。scikit-learnは、効率的で整然と統一されたAPIだけでなく、有益かつ完全なドキュメントを整備している点にも特徴があります。この統一性により、あるモデルでscikit-learnの基本的な使用方法と構文を理解したなら、別のモデルやアルゴリズムへ容易に応用できます。

この章ではscikit-learn APIの概要を説明します。APIの構成要素を確実に把握することで、機械学習のアルゴリズムとアプローチに関する実践的な議論のための基礎が身につきます。

最初にscikit-learnのデータ表現を説明します。続いて推定器(Estimator)APIを説明し、最後にこれらの機能を使用した興味深い事例として、手書き数字の画像認識を紹介します。

38.1 scikit-learnのデータ表現

機械学習とは、データからのモデル作成であるとも言えます。そのため、まずデータをどのように表現するかを考えます。scikit-learnのデータを把握する最も良い方法は、データをとして捉えることです。

基本的な表は2次元の格子状データです。行はデータセット個々の要素を表し、列は各要素それぞれに関連する量を表します。例として、27章で使用したアイリスデータセット(https://oreil.ly/TeWYs)を考えます。これは1936年にRonald Fisherにより分析され有名になりました。seabornライブラリ( ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池 彰
推薦システム実践入門 ―仕事で使える導入ガイド

推薦システム実践入門 ―仕事で使える導入ガイド

風間 正弘, 飯塚 洸二郎, 松村 優也
プロダクトマネージャーのしごと 第2版 ―1日目から使える実践ガイド

プロダクトマネージャーのしごと 第2版 ―1日目から使える実践ガイド

Matt LeMay, 永瀬 美穂, 吉羽 龍太郎, 原田 騎郎, 高橋 一貴

Publisher Resources

ISBN: 9784814400638Publisher Website