April 2025
Intermediate to advanced
276 pages
3h 37m
Japanese
本書の最初の章では、現代の分散システムにおいてオブザーバビリティがなぜ重要であるか、 そして、OpenTelemetry標準がどのように、 分散システムを理解する包括的なアプローチを実装するための構成要素を提供したり、 シグナルやサービス全体にわたってテレメトリーを相関させたり、 従来は閉じ込められていたサイロを打破したりするかに焦点を当てました。 これまで取り上げてきた個々のシグナル(トレース、メトリクス、ログ)には、 それぞれ特定のユースケースに適した特性がありますが、 コンテキストなしに個別に使用すると有用性が低下します。
エンジニアリングチームがサービスを適切に計装するだけでなく、 すべてのシグナルを活用してテレメトリーの文脈をデバッグワークフローに取り入れ、 リグレッションに対して迅速にトラブルシューティングすることで、 オブザーバビリティの価値を最大限に引き出すことができます。
エンジニアリングチームが本番サービスをデバッグする方法を変えることは、簡単ではありません。 テレメトリーは従来、個々のアプリケーションに合わせてカスタマイズするのが一般的であり、 そのほとんどを、システムの知識を持ち、何を見たいかがわかっている所有者自身が計装してきました。 通常、こうした経験豊富なエンジニアが、障害の最中にチームが参照するダッシュボード、アラート、ランブックを作成します。 新しいトラブルシューティングのワークフローに対して懐疑的な反応を示すのは、驚くべきことではありません。 だって、今までうまくやってきたんだし、なぜ変える必要があるの? 1章 で説明したように、この前提が誤りである理由はいくつもあり、 ...
Read now
Unlock full access