
360 12 章 ビッグデータ:スケールを追求
こういった効果の一部は綿密な正規化によって緩和できるが、分離が難しいほどデータと密着してい
ることも多く、意味のある長期的分析を不可能にする。
今後の課題
ビッ
グデータはそこにあるデータだ。優れたデータは課題の解決に適したデータである。解決し
たい問題に答えてくれないビッグデータは、バッドデータにすぎない。
12.1.2 3 つの V
経営コンサルタントたちは、ビッグデータを説明するための手段としてビッグデータの 3 つの V という
概念を生み出して、ビッグデータと通常のデータの違いを説明するための基礎を築いた。「3 つの V」とは、
量(volume)、多様性(variety)、速度(velocity)という 3 つの性質のことだ。この「3 つの V」を詳しく説
明しよう。
• 量:言うまでもなく、ビッグデータはリトルデータよりも大きい。この違いを表すものがクラスであ
る。データをスプレッドシートで表現できたり、1 台のマシンで処理できる世界ではなくなり、より
高度な計算基盤が必要になる。分析方法も効率上の理由から線形時間アルゴリズムに限定される。
• 多様性:周りから集めてきたデータは、一般に複雑で、行列ではとても表現できない。そのため、一
般性のない特殊な統合技法が必要になることが多い。
ソーシャルメディアについて考えてみよう。投稿には、テキスト、リンク、写真、動画などが含まれ
る。課題によっては、これらすべてが必要になることがあるが、テキストの処理には、リンクやマル ...