
6.3 グラフの種類 165
よりも暗い色になり、さまざまな階調のグレーによるヒートマップになる。
第 2 の方法は
、個々の点にランダムなノイズを少し加え、もとの位置の周囲の小さな円の中の任意の
位置に配置するというものである。そうすれば、同じ座標を共有する点の数だけ点が描かれ、邪魔な
グリッド線も消える。
• 多変量データは次元削減して 2 次元にするか、2 変量プロットで表現する:我々にとって、4 次元以
上のデータの可視化は困難だ。高次元データは、主成分分析(Principal Component Analysis)や自己
組織化写像(self-organizing map:SOM)と呼ばれる手法で 2 次元に次元削減すれば散布図に描ける
ことが多い。図 11 -16 はその例である。この図は、100 次元のデータを 2 次元に次元削減し、この多
変量データセットをわかりやすく表現している。
この種のプロットには、他の方法では見られない印象的な形を描けるという長所がある。しかし、得
られた 2 次元データには何の意味もないというところが欠点である。2 つの「新しい」次元にはもと
のすべての次元の意味合いが付与されているため、意味のある変数名を付けられないのである。
もとの次元から 2 つの次元の組合せを抽出して散布図を描く方法もある。図 6 -1 で示したように、こ
の方法には、どの次元の組合せに相関が見られるかがわかるという長所がある。
• 3 次元散布図が役に立つのは、示すべき構造が本当にあるときだけである ...