
5.13
詳細:カーネル密度推定
491
図5-139 GMMの基本モデルからランダムに抽出された「新しい」数字
結果の大部分は、もっともらしく数字のように見えます。
ここで行ったことを振り返ってみましょう。データから新しい数字のサンプルを生成できるよう
に、与えられた手書き数字データの分布をモデル化しました。これは、元のデータには含まれてい
ない別の「手書き数字」であり、元の入力データから一般的な特徴を取り出して混合データモデル
としてモデル化してものです。このような生成モデルは、次の節で説明するようにベイジアン生成
分類器の成分として非常に有用であることが知られています。
5.13
詳細:カーネル密度推定
前の節では、クラスタリング推定器と密度推定器のハイブリッドあるガウス混合モデル(
GMM
)
について説明しました。密度推定器は、
D
次元のデータセットから、そのデータが引き出される
D
次元確率分布の推定値を生成するアルゴリズムであることを思い出してください。
GMM
アルゴリ
ズムは、密度をガウス分布の加重和として表すことによってこれを行います。カーネル密度推定
(
KDE
:
Kernel Density Estimation
)は、ガウス分布を重ね合わせるというアイデアを突き詰めた考
え方です。ポイントごとに
1
つのガウス分布を重ね合わせることで、本質的にノンパラメトリック
な密度推定を行います。この節では、
KDE
の必要性と使用法について説明します。最初に標準的
なモジュールをインポートします。