Skip to Content
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
book

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池 彰
May 2018
Intermediate to advanced
556 pages
13h 21m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
5.13
 詳細:カーネル密度推定
491
図5-139 GMMの基本モデルからランダムに抽出された「新しい」数字
結果の大部分は、もっともらしく数字のように見えます。
ここで行ったことを振り返ってみましょう。データから新しい数字のサンプルを生成できるよう
に、与えられた手書き数字データの分布をモデル化しました。これは、元のデータには含まれてい
ない別の「手書き数字」であり、元の入力データから一般的な特徴を取り出して混合データモデル
としてモデル化してものです。このような生成モデルは、次の節で説明するようにベイジアン生成
分類器の成分として非常に有用であることが知られています。
5.13
 詳細:カーネル密度推定
前の節では、クラスタリング推定器と密度推定器のハイブリッドあるガウス混合モデル(
GMM
について説明しました。密度推定器は、
D
次元のデータセットから、そのデータが引き出される
D
次元確率分布の推定値を生成するアルゴリズムであることを思い出してください。
GMM
アルゴリ
ズムは、密度をガウス分布の加重和として表すことによってこれを行います。カーネル密度推定
KDE
Kernel Density Estimation
)は、ガウス分布を重ね合わせるというアイデアを突き詰めた考
え方です。ポイントごとに
1
つのガウス分布を重ね合わせることで、本質的にノンパラメトリック
な密度推定を行います。この節では、
KDE
の必要性と使用法について説明します。最初に標準的
なモジュールをインポートします。
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池 彰
初めてのGraphQL ―Webサービスを作って学ぶ新世代API

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎 沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873118413Other