Skip to Content
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
book

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池 彰
May 2018
Intermediate to advanced
556 pages
13h 21m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
5.11
 詳細:
k
平均法クラスタリング
463
図5-109 手書き数字 "1" だけの Isomap埋め込み
結果は、数字「
1
」がデータセット内で取ることができる多様なスタイルの知見を提供します。デー
タは、投影された空間の広いカーブに沿っており、数字の向きをトレースしているように見えます。
データの数を増やすと、数字の上に帽子を持つものや、数字の下に線が入った文字が見つかります
が、これらはデータセット内にそれほど多く含まれているわけではありません。この投影によって、
データの問題(すなわち、抽出された画像に含まれる隣り合った別の数字の一部)を持つ外れ値を
特定することができます。
こうした作業自体は、数字の分類作業の役には立たないかもしれませんが、データを理解するの
に役立ちます。また、分類パイプラインを構築する前に、どのようにデータを前処理すれば良いか
を示してくれます。
5.11
 詳細:
k
平均法クラスタリング
ここまでの節では、教師なし機械学習モデルの
1
カテゴリ、次元削減について検討しました。こ
こでは、教師なし機械学習モデルの別のクラス、すなわちクラスタリングアルゴリズムを取り上げ
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池 彰
初めてのGraphQL ―Webサービスを作って学ぶ新世代API

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎 沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873118413Other