8章オブザーバビリティを実現するためのイベント解析
この部の最初の2つの章では、オブザーバビリティツールで適切にデバッグできるデータセットを作成するために必要な、テレメトリーの基本について学びました。 正しいデータを持つことは基本的な要件ですが、オブザーバビリティはそのデータからシステムに関して何を学ぶことができるかによって評価されます。 この章では、オブザーバビリティデータに適用されるデバッグ技術と、本番環境のデバッグに使用される従来の技術との違いについて説明します。
まず、従来のモニタリングツールやアプリケーションパフォーマンスモニタリング(APM)ツールで問題をデバッグするための、一般的なテクニックを詳しく調べることから始めます。 前の章で強調したように、従来のアプローチは、以前に知られていた障害モードにかなり精通していることを前提にしています。 この章では、このアプローチをもう少し詳しく説明し、問題の特定にシステムの知識を同じ程度には必要としないデバッグアプローチと対比できるようにします。
次に、オブザーバビリティベースのデバッグ技術をどのように自動化できるかを見て、効果的なデバッグワークフローを作成する上で人間とコンピューターの両方が果たす役割について考えます。 これらの要素を組み合わせることで、従来のツールでは検出不可能な問題を特定するために、オブザーバビリティツールがどのようにテレメトリーデータの分析を支援するかを理解できます。
このような仮説駆動型デバッグ(仮説を立て、それを確認するためにデータを探索する手法)は、直感やパターンマッチに頼るよりも科学的であるだけでなく、デバッグという行為を民主化するものでもあります。 従来のデバッグ手法では、システムに精通し、経験を積んだ人が素早く答えを見つけられますが、オブザーバビリティによるデバッグ手法では、好奇心が旺盛な人、本番環境のコードを熱心にチェックする人が有利になります。 ...