
316 10 章 ネットワーク分析と距離
ない最小の固有値を持つ。この特徴空間で k 平均法を行うと、強く連結されたクラスタが生まれる。
今後の課題
多数
の選択肢があるが、どのクラスタリングアルゴリズムを使うべきだろうか。最も重要な判断
基準は次のものである。
• 使うべき正しい距離関数を述べなさい。
• 分散を適切に正規化するために何を行っているか?
• 適切に可視化したときにクラスタは適切だと思うか?クラスタリングアル
ゴリズムはあなたの気持ちがわかるわけではないので、クラスタリングは
決して完璧にはならないことを理解しよう。それでもクラスタリングの結
果が適切に見えるかどうか?
10.6 私の体験談から:クラスタ爆弾
サバティカル中に参加した大手メディア/IT 企業の研究所の所長 Amanda Stent は、そこの自然言語処理
(NLP)グループのリーダーも務めていた。彼女は恐ろしく優秀で、極端なまでに礼儀正しく、基本的に沈
着冷静な人だ。しかし、怒りが一定の水準を超えるといらだちが隠せなくなり、「開発のやつら」とつぶや
く声に彼女の憤りを感じた。
研究所長としての彼女の仕事の 1 つは、社内の開発グループのメンバーとの窓口になることで、これは言
語テクノロジーの専門知識が必要だった。ここで彼女を悩ますものは、最近の面白い記事を提供するニュー
ス開発担当者だった。この仕事では、同じ話題や事件について書かれた記事を 1 つにまとめるニュースクラ
スタリングモジュールが重要な構成要素になっていた。バスケットボールの同じ試合やインターネットで話 ...