14章良いハウスキーピング
整理整頓された家、整理整頓された心。
――アーノン
またしても本番障害です。あなたとチームは一緒に座ってログを見ながら、頭を抱えています。
「それにしても、よくわからないですね」 ベンは言います。「どうしてクラッシュしたインスタンスに、接続しようとし続けるんでしょう?」
「うーん」 あなたは答えます。「インスタンスがダウンすると、それを検出して、他のインスタンスがリーダーになるのではなかったでしたっけ?」
「ちょっと待って。これ以前にも起こりませんでしたか?」 タラは言います。「何か月か前に、似たような問題をデバッグした記憶があるんです。そのときはどうやって直したんでしたっけ?」
あなたは覚えていません。過去にこの問題が発生して実際に直したとのことで、コードベースの古いコミットを調べて、前回この問題を修正したと思われるものを見つけようとします。ダメです。何も見つけられません。
「関連するコミットはないですね。よっぽどひどい名前をつけていれば別ですが」 あなたは言います。
あなたはエマが通りがかったのに気づきます。彼女はプリンシパルエンジニアで、この問題に対する知見を間違いなく持っているはずです。
「エマ、ちょっといいですか?」
「ええ、どうしました?」
「ストレージレイヤーで本番障害がまた起こっているんです。インスタンスがいくつか落ちて、それを復旧したんですが、既存のインスタンスが古いインスタンスに接続しっぱなしで、結果的にアプリケーションが止まっているんです」
エマは椅子を持ってきて、一緒にログを見ます。
「それじゃ、これを起動しているコンフィグを見せてもらえます?」
「はい」と言って、本番アプリケーションのコンフィグを表示します。エマは身を乗り出して、値を調べます。 ...
Get エンジニアリングマネージャーのしごと ―チームが必要とするマネージャーになる方法 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.