
12.8 さらなる探求のために 383
12.8 さらなる探求のために
ビッグデータ分析につ
いての本に不足はない。Leskovec, Rajaraman and Ullman [LRU14] は、おそらくそ
れらの中でも最も包括的な本であり、ここで取り扱ったトピックを深く掘り下げたいときには適した本だろ
う。本書と付属動画は、http://www.mmds.org からダウンロードできる。
私がソフトウェアテクノロジーに直接触れて学ぶために愛読する参考書は、O’Reilly Media から出ている
ものが多い。この章に関連する書籍として、同社の Bengfort and Kim [BK16] と Ryza et al. [RLOW15] を
お薦めする。
O’Neil [O’N16] は、ビッグデータ分析が社会にもたらす危険についてさまざまなことを考えさせる。特
に、代用データソースを使った不透明なモデルの誤用が、そのモデルによって解決しようとしているはずの
問題を悪化させることを強調している。
ディスクとキャッシュの速度の違いを亀の歩みと重力圏外脱出のために必要な速度の違いにたとえたの
は、Michael Bender からの借用である。
12.9 演習問題
並列処理と分散処理
12-1. [3] 並列処理と分散処理の違いを述べなさい。
12-2. [3] MapReduce の利点を挙げなさい。
12-3. [5] 整数が格納された大きなファイルをいくつも読み込ませ、次の計算をする MapReduce