7章バックアップとリカバリ

5章6章では、インフラの設計と管理について焦点を当ててきました。ここまで読んでくださったみなさんは、分散アーキテクチャでデータベースサーバーをどのようにビルドし、デプロイし、そして管理する方法をすでに理解しています。サービスの急成長に伴い、新規ノードを素早く増設したり、障害ノードを置き換える技術も身につきました。本章では、基本だが決しておろそかにはできない作業、つまりバックアップとリカバリについて説明していきます。

バックアップとリカバリは、退屈でつまらないものと思っていませんか? バックアップとリカバリは、多くのエンジニアが骨折り仕事(toil)の最たるものと考えています。新入りのエンジニアにやらせるか外部委託、もしくはサードパーティのツールを使って、なるべく関わらないようにする場合も多々あります。私もキャリアの中で、本当にひどいバックアップソフトウェアをいくつか見てきました。

とはいうものの、数多くのオペレーションの中で、バックアップとリカバリが最重要プロセスのうちの1つであることに変わりはありません。ノードをまたいで、データセンタをまたいで複製して保管しておくものは何でしょうか。日々変わりゆくビジネスの中でもっとも貴重なものであり、そして長期間にわたって保管し続けなければならないもの。それはデータです。バックアップとリカバリを、エースではないエンジニアの片手間にやらせるのはもうやめましょう。データこそ最重要であり、だからこそバックアップとリカバリはVIPのように扱わなければなりません。エンジニア全員がリカバリの対象だけでなく、その監視についても十分に理解している必要があります。多くのDevOps哲学において、エンジニア全員がプロダクション環境のレポジトリに、書き込みとプッシュをできるようにすることをすすめています。同様に、ここではエンジニア全員が、最低1度は重要データのリカバリ作業に従事することをすすめます。 ...

Get データベースリライアビリティエンジニアリング ―回復力のあるデータベースシステムの設計と運用 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.