Skip to Content
サイトリライアビリティワークブック ―SREの実践方法
book

サイトリライアビリティワークブック ―SREの実践方法

by Betsy Beyer, Niall Richard Murphy, David K. Rensin, Kent Kawahara, Stephen Thorne, 澤田 武男, 関根 達夫, 細川 一茂, 矢吹 大輔, 玉川 竜司
June 2020
Intermediate to advanced
516 pages
7h 4m
Japanese
O'Reilly Japan, Inc.
Content preview from サイトリライアビリティワークブック ―SREの実践方法

4章モニタリング

執筆:Jess Frame、Anthony Lenton、Steven Thurgood、Anton Tolchanov、Nejc Trdin

協力:Carmela Quinito

モニタリングには、メトリクス、テキストのロギング、構造化されたイベントのロギング、分散トレース、イベントのイントロスペクションを含む多くの種類のデータがあります。これらのアプローチはすべてそれ自身役立つものですが、本章では主にメトリクスと構造化ロギングを取り上げます。私たちの経験では、これら2つのデータソースがSREの基礎的なモニタリングの要求には最も適しています。

最も基本的なレベルでは、モニタリングはシステムを可視化するものです。これは何か問題が起きたときに、サービスの健全性の判定とサービスの診断にとって中核的な要求となります。最初のSREの書籍『SRE サイトリライアビリティエンジニアリング』の「6章 分散システムのモニタリング」で基本的なモニタリングの定義を示し、SREが担当するシステムを以下の目的でモニタリングすることを説明しました。

  • 注意が必要な条件でのアラート
  • それらの問題の調査と診断
  • システムに関する情報をビジュアルで表示
  • 長期的な計画のために、リソースの利用やサービスの健全性に関するトレンドについて知見を得る
  • 変更の前後、あるいは実験における2つのグループ間でのシステムの振る舞いの比較

モニタリングシステムの選択や構築の際、これらのユースケースの相対的な重要性をもとに取捨選択が必要になるかもしれません。

本章ではGoogleがどのようにモニタリングシステムを管理しているかを論じ、モニタリングシステムの選択や運用に際して生じうる疑問に対するガイドラインを示します。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

Andreas C. Muller, Sarah Guido, 中田 秀基
プログラミングRust

プログラミングRust

Jim Blandy, Jason Orendorff, 中田 秀基
初めてのGraphQL ―Webサービスを作って学ぶ新世代API

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎 沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873119137Other