Skip to Content
SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム
book

SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム

by Betsy Beyer, Chris Jones, Jennifer Petoff, Niall Richard Murphy, 澤田 武男, 関根 達夫, 細川 一茂, 矢吹 大輔, Sky株式会社 玉川 竜司
August 2017
Intermediate to advanced
590 pages
8h 40m
Japanese
O'Reilly Japan, Inc.
Content preview from SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム

6章分散システムのモニタリング

執筆:Rob Ewaschuk

編集:Betsy Beyer

GoogleのSREチームには、モニタリング及びアラートのシステムをうまく構築するための基本原則とベストプラクティスがあります。本章では、アラート発生時に人間にページを送って割り込むべき問題、そしてページを送るほどではない問題への対処方法のガイドラインを示します。

6.1 定義

モニタリングに関連するあらゆるトピックを議論しようとすれば、一般的な用語定義が定まっていないことが問題になります。Googleの内部においてさえ、用語の使われ方には幅がありますが、以下のリストに最も一般的な解釈をまとめておきます。

モニタリング
システムに関するリアルタイム定量データの収集、処理、集計、表示を行うことです。扱うデータの例としては、クエリの回数と種類、エラーの回数と種類、処理時間、サーバーの生存期間などがあります。
ホワイトボックスモニタリング
システムの内部によって公開されているメトリクスに基づくモニタリングです。ログ、Java Virtual Machine Profiling Interfaceのようなインターフェース、内部的な統計情報を出力するHTTPハンドラなどが含まれます。
ブラックボックスモニタリング
ユーザーが目にする外部の振る舞いをテストします。
ダッシュボード
サービスの主要メトリクスのサマリビューを提供する、(通常はWebベースの)アプリケーションです。ダッシュボードはユーザーにとって最も重要なメトリクスを表示するようあらかじめ構築されていますが、フィルタ、セレクタなどを持っていることもあります。ダッシュボードは、チケットキューの長さ、優先度の高いバグのリスト、各担当部署の現在のオンコールエンジニア、直近のプッシュなどを表示することもあります。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

データベースリライアビリティエンジニアリング ―回復力のあるデータベースシステムの設計と運用

データベースリライアビリティエンジニアリング ―回復力のあるデータベースシステムの設計と運用

Laine Campbell, Charity Majors, 八木 和生
エレガントなSciPy ―Pythonによる科学技術計算

エレガントなSciPy ―Pythonによる科学技術計算

Juan Nunez-Iglesias, Stéfan van der Walt, Harriet Dashnow, 山崎 邦子, 山崎 康宏
リーンエンタープライズ ―イノベーションを実現する創発的な組織づくり

リーンエンタープライズ ―イノベーションを実現する創発的な組織づくり

Jez Humble, Joanne Molesky, Barry O'Reilly, 角 征典, 笹井 崇司, Eric Ries

Publisher Resources

ISBN: 9784873117911Other