Skip to Content
Pythonではじめる教師なし学習 ―機械学習の可能性を広げるラベルなしデータの利用
book

Pythonではじめる教師なし学習 ―機械学習の可能性を広げるラベルなしデータの利用

by Ankur A. Patel, 中田 秀基
April 2020
Intermediate to advanced
344 pages
8h 22m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonではじめる教師なし学習 ―機械学習の可能性を広げるラベルなしデータの利用
120
5
章 クラスタリング
5.3
k
平均法
クラスタリングの目的は、データセットを次の性質を満たすようなグループに分割することだ。すな
わち、あるグループに属する観測点は、他のグループの観測点よりも同じグループの観測点に類似し
ているようなグループ分けだ。
k
法(
k-means
)クラスタリングでは、クラスタ数
k
を指定し、アル
ゴリズムは個々の観測点にただ
1
つだけクラスタを割り当てる。このアルゴリズムは、クラスタ内ばら
つき
within-cluster variation
)も クラスタ慣性
cluster inertia
)を
k
個すべてのク
ラスタのクラスタ内ばらつきの和を可能な限り小さくしようとする。
k
平均法によるクラスタの割り当て結果は実行のたびに少しだけ異なる場合がある。これは、
k
平均
法がクラスタリングを開始する際に、個々の観測点にランダムにクラスタを割り当てるからだ。このよ
うにランダムに初期化を行うのは、クラスタリングを高速にするためだ。ランダムな初期化を行ったら、
各観測点をクラスタの中心点もしくはセントロイド
centroid
)とのユークリッド距離が最小となるクラ
スタに割り当て直す。このランダムな初期化によってランダム性が導入されるので、
k
平均法の実行結
果のクラスタ割り当ては、実行のたびにわずかに変わってしまう。
通常、
k
平均法を用いる場合は、何度か実行して最もよく分離できたものを選択する。分離の度合い
は、
k
個のクラスタのクラスタ内ばらつきの和で ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Python機械学習クックブック

Python機械学習クックブック

Chris Albon, 中田 秀基
Go言語による並行処理

Go言語による並行処理

Katherine Cox-Buday, 山口 能迪
プログラミングC# 第8版

プログラミングC# 第8版

Ian Griffiths, 木下 哲也, 鈴木 幸敏

Publisher Resources

ISBN: 9784873119106Other