4章統計入門
統計はソフトウェアエンジニアリングやシステム管理の世界では、軽視されがちなトピックです。また、誤解の対象でもあります。私が話をしてきた多くの人たちは、「ちょっと統計をいじる」だけで魔法のように何かが出てくるという誤解の元に運用しています。残念ながらそんなことはありません。
しかし、統計の基本は分かりやすく、監視の仕事に非常に役立つのは間違いありません。
4.1 システム運用における統計を学ぶ前に
統計の勉強を始める前に、少し背景を理解しておくとよいでしょう。
Nagiosが広く普及し、その大きな影響が、監視の仕組みの改善を長い間邪魔してきたのではないかと私は考えています。Nagiosでアラートを設定するのはとても簡単ですが、役に立たないことも多いです†1。
[†1] Nagiosを非難しているわけではありません。Nagiosが広く普及しているために、多くの監視ツールがNagiosを基準にしているというだけです。それ以外にも問題のあるツールはたくさんあります。
Nagiosで何らかのメトリクスに対するアラートを送る時には、WarningあるいはCriticalとして設定した値と、現在のメトリクスの値が比較されます。例えば、15分のロードアベレージとして5という値が返されたとしましょう。チェックスクリプトは、この値をWarningの設定値(例えば4)とCriticalの設定値(例えば10)と順に比較します。この場合、NagiosはWarningの設定値を超えたとして、期待どおりアラートを送ります。しかし、これはいつでも有用だとは限りません。
システムは予想しない(けれども問題があるとは言えない)動きをすることがあります。閾値を1回だけ超えた場合はどうでしょうか。60秒後の次のチェックの時、ロードアベレージが3.9だったらどうでしょうか。さらにその後が4.1だったらどうでしょうか。お分かりのとおり、このような場合、アラートはうるさくなるでしょう。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access