8章サーバ監視

監視の取り組みの多くがシステム管理者やOpsエンジニアのチームから始まることから、多くの人がすぐに「監視」と「システム管理者がやること」を結び付けてしまうのも不思議ではありません。しかし、サーバ上で起こること以外にも監視すべきものは非常にたくさんあるわけで、これは残念な傾向です。

とはいえ、この誤解にも正しいところはあります。それは、サーバ上では実際たくさんのことが起こる、ということです。サーバレスなアーキテクチャでも、プラットフォームを提供しそれを動かすためにサーバは存在しています。ここからは、最近のサーバ上で遭遇する一般的なサービスの種類、提供されるメトリクスやログの種類、それらを理解する方法について詳しく見ていきます。

始める前に1つ注意しておきます。この章では、私が最も詳しいというのもあって、オペレーティングシステムとしてLinuxを使うと仮定します。ここで扱うほとんどのことは、ツールは違うかもしれませんが一般的な意味においてWindowsにも適用できます。

8.1 OSの標準的なメトリクス

本書全体を通じて、OSの標準的メトリクス(CPU、メモリ、ロードアベレージ、ネットワーク、ディスク)への依存を厳しく批判してきました。これは、このようなメトリクスから監視を始めるのは、重要な事項(アプリケーションが動いているかどうか)と関連が弱いシグナルから監視を始めることになってしまうからです。動いているかどうかを知るためには、高いレベルから始める必要があると、2章で取り上げました。

しかし、これらのメトリクスに役立つ点が全くないというわけではありません。実際、診断やトラブルシューティングといった正しいコンテキストで使えば味方になってくれます。このような場面では、OSの標準的メトリクスは、使用可能なメトリクスの中でも強力なものの1つになります。 ...

Get 入門 監視 ―モダンなモニタリングのためのデザインパターン now with O’Reilly online learning.

O’Reilly members experience live online training, plus books, videos, and digital content from 200+ publishers.