July 2021
Intermediate to advanced
376 pages
6h 34m
Japanese
リレーショナルデータベースの初期の時代、ハードディスクの容量はほんの数メガバイトであり、データベースがそれほど大きくなることはなかったため、たいてい管理するのは容易でした。それが現在では、ハードディスクの容量は15TBに膨れ上がっており、現代のディスクアレイには4PBを超えるデータを格納できます。クラウドのストレージに至っては、実質的に無制限です。データの量は増加の一途をたどっており、リレーショナルデータベースはさまざまな課題に直面しています。しかし、企業がリレーショナルデータベースを引き続き利用できるようにするために、パーティショニング、クラスタリング、シャーディングなど、データを複数のストレージ層やサーバーに分散させる手法が開発されています。一方で、膨大な量のデータに対処するために、Hadoopのようなビッグデータプラットフォームへの移行に踏み切った企業もあります。本章では、リレーショナルデータベースのスケーリングに重点を置いた上で、これらの手法を詳しく見ていきます。
データベーステーブルが「大きくなりすぎる」とは、厳密にどのような状況のことでしょうか。この質問を10人のデータアーキテクト、システム管理者、開発者にぶつければ、10通りの答えが返ってくるでしょう。しかし、ほとんどの人は、テーブルの大きさが数百万行を超えた時点で、次のタスクがより困難になるか、時間がかかるようになることを認めるはずです。