Skip to Content
SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム
book

SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム

by Betsy Beyer, Chris Jones, Jennifer Petoff, Niall Richard Murphy, 澤田 武男, 関根 達夫, 細川 一茂, 矢吹 大輔, Sky株式会社 玉川 竜司
August 2017
Intermediate to advanced
590 pages
8h 40m
Japanese
O'Reilly Japan, Inc.
Content preview from SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム

30章SREの投入による運用過負荷からのリカバリ

執筆:Randall Bosetti

編集:Diane Bates

GoogleのSREチームでは、プロジェクトと対処的な運用業務に均等に時間を割り振ることが標準的なポリシーとなっていますが、日々のチケット量の増大によってこのバランスが何ヶ月かにわたって狂ってしまうことがあります。SREチームが燃え尽き症候群に陥ってしまったり、プロジェクトの作業を進められなくなったりしかねないので、運用業務の負担が大きくなりすぎるのは危険なことです。サービス改善のための時間を犠牲にしてチケットの解決に時間を割り当てすぎると、スケーラビリティや信頼性に影響が生じます。

この負担を緩和する方法の一つは、過負荷になっているチームへ一時的にSREを移籍させることです。この場合、移籍したSREは単にチケットのキューを空にするのを手助けするのではなく、チームのプラクティスを改善することに焦点を当てます。そのSREはチームの日々のルーチンワークを観察し、そのやり方を改善するための提案を行います。このコンサルテーションは、チーム自身では気づかなかったルーチンに対する新鮮な見方をチームに提供します。

このアプローチをとる場合には、複数のエンジニアを移籍させる必要はありません。2人のSREを移籍させても必ずしも良い結果が得られるとは限らず、移籍先のチームがその2人に対して身構えるような反応をすれば、逆に問題が生じることになるかもしれません。

初めてSREチームを立ち上げようとしている場合、本章で紹介するアプローチは、そのチームがチケットのローテーションだけに集中する運用チームになることを回避する手助けとなるでしょう。もしあなたが自分自身や部下をそのチームのメンバーにするなら、Ben ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

データベースリライアビリティエンジニアリング ―回復力のあるデータベースシステムの設計と運用

データベースリライアビリティエンジニアリング ―回復力のあるデータベースシステムの設計と運用

Laine Campbell, Charity Majors, 八木 和生
エレガントなSciPy ―Pythonによる科学技術計算

エレガントなSciPy ―Pythonによる科学技術計算

Juan Nunez-Iglesias, Stéfan van der Walt, Harriet Dashnow, 山崎 邦子, 山崎 康宏
リーンエンタープライズ ―イノベーションを実現する創発的な組織づくり

リーンエンタープライズ ―イノベーションを実現する創発的な組織づくり

Jez Humble, Joanne Molesky, Barry O'Reilly, 角 征典, 笹井 崇司, Eric Ries

Publisher Resources

ISBN: 9784873117911Other