Skip to Content
SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム
book

SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム

by Betsy Beyer, Chris Jones, Jennifer Petoff, Niall Richard Murphy, 澤田 武男, 関根 達夫, 細川 一茂, 矢吹 大輔, Sky株式会社 玉川 竜司
August 2017
Intermediate to advanced
590 pages
8h 40m
Japanese
O'Reilly Japan, Inc.
Content preview from SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム

12章効果的なトラブルシューティング

執筆:Chris Jones

注意しなければならないのは、システムがどのように動作するはずなのかを理解しただけでは、エキスパートたりえないということだ。システムがなぜうまく動作しないのかを調査することこそが、エキスパートへの道なのだ。

——Brian Redman

物事がうまくいく場合というものは、物事がおかしくなる場合の中の特殊な例に過ぎない。

——John Allspaw

トラブルシューティングは、分散コンピューティングシステムの運用担当者、中でもSREにとっては欠かせないスキルですが、それを持つ者と持たざる者とに分かれる生来のスキルのように見られることがしばしばあります。そう見なされる理由の一つは、頻繁にトラブルシューティングを行う者にとっては、それはすっかり染みついたプロセスになっているからです。どのようにトラブルシューティングを行うのかを説明することは、自転車の乗り方を説明するのと同じように難しいことです。とはいえ、私たちはトラブルシューティングは学ぶことも教えることもできると信じています。

初心者はしばしばトラブルシューティングでつまずくことになりますが、これはトラブルシューティングが理想的には二つの要素に依存するためです。一つは一般的なトラブルシューティングの手法の理解(すなわち特定のシステムの知識とは関係のない部分)で、もう一つはシステムに関するしっかりとした知識です。一般的なプロセスと、大原則の応用だけで問題を調査することもできますが†1、通常このやり方はあまり効果的ではなく、本来あるべき動作を理解しておく方が効率が良くなります。初めて扱うシステムでは、システムに関する知識がないことからSREの効率は限られてしまいます。システムの設計と構成に関する知識は、かけがえのないものなのです。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

データベースリライアビリティエンジニアリング ―回復力のあるデータベースシステムの設計と運用

データベースリライアビリティエンジニアリング ―回復力のあるデータベースシステムの設計と運用

Laine Campbell, Charity Majors, 八木 和生
エレガントなSciPy ―Pythonによる科学技術計算

エレガントなSciPy ―Pythonによる科学技術計算

Juan Nunez-Iglesias, Stéfan van der Walt, Harriet Dashnow, 山崎 邦子, 山崎 康宏
リーンエンタープライズ ―イノベーションを実現する創発的な組織づくり

リーンエンタープライズ ―イノベーションを実現する創発的な組織づくり

Jez Humble, Joanne Molesky, Barry O'Reilly, 角 征典, 笹井 崇司, Eric Ries

Publisher Resources

ISBN: 9784873117911Other