SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム
by Betsy Beyer, Chris Jones, Jennifer Petoff, Niall Richard Murphy, 澤田 武男, 関根 達夫, 細川 一茂, 矢吹 大輔, Sky株式会社 玉川 竜司
7章Googleにおける自動化の進化
執筆:Niall Murphy
執筆協力:John Looney、Michael Kacirek
編集:Betsy Beyer
暗黒芸術を除けば、そこにあるのは自動化と機械化だけだ。
——Federico García Lorca(1898–1936)、スペイン人詩人、劇作家
SREにとって、自動化は万能薬ではなく、能力を増幅するものです。もちろん能力が増幅されても、的に向かって正確に能力を発揮できるかは別問題です。考えなしに自動化をすれば、解決した問題と同じだけの問題を作り出すことになってしまうでしょう。ソフトウェアベースの自動化は多くの環境において手作業による運用よりも優れていると私たちは信じてはいますが、そのどちらよりも優れているのは、どちらも必要としない高レベルの設計、すなわち自律的なシステムです。あるいは言い換えるなら、自動化の価値は自動化によって行うことと自動化を賢明に適用することから生じるのです。本章では、これらの自動化の価値と、私たちの自動化に対する姿勢の進化について説明していきます。
7.1 自動化の価値
それでは、自動化の価値とは何なのでしょうか?†2
7.1.1 一貫性
当然ながら、スケーラビリティは自動化への動機の一つですが、自動化を進める理由は他にもあります。例として、システムエンジニアリングに携わる多くの人々のキャリアの出発点である大学のコンピューティングシステムについて考えてみましょう。このバックグラウンドを持つシステム管理者は、概してマシン群やソフトウェア群を動作させる役割を持っており、職務を果たす上でさまざまなアクションを手作業で行うことに慣れています。よくある例の一つにユーザーアカウントの作成があります。その他には、バックアップが行われていることの確認、サーバーのフェイルオーバーの管理といった純粋な運用業務や、上流のDNSサーバーの ...