14章良いハウスキーピング

整理整頓された家、整理整頓された心。

――アーノン

またしても本番障害です。あなたとチームは一緒に座ってログを見ながら、頭を抱えています。

「それにしても、よくわからないですね」 ベンは言います。「どうしてクラッシュしたインスタンスに、接続しようとし続けるんでしょう?」

「うーん」 あなたは答えます。「インスタンスがダウンすると、それを検出して、他のインスタンスがリーダーになるのではなかったでしたっけ?」

「ちょっと待って。これ以前にも起こりませんでしたか?」 タラは言います。「何か月か前に、似たような問題をデバッグした記憶があるんです。そのときはどうやって直したんでしたっけ?」

あなたは覚えていません。過去にこの問題が発生して実際に直したとのことで、コードベースの古いコミットを調べて、前回この問題を修正したと思われるものを見つけようとします。ダメです。何も見つけられません。

「関連するコミットはないですね。よっぽどひどい名前をつけていれば別ですが」 あなたは言います。

あなたはエマが通りがかったのに気づきます。彼女はプリンシパルエンジニアで、この問題に対する知見を間違いなく持っているはずです。

「エマ、ちょっといいですか?」

「ええ、どうしました?」

「ストレージレイヤーで本番障害がまた起こっているんです。インスタンスがいくつか落ちて、それを復旧したんですが、既存のインスタンスが古いインスタンスに接続しっぱなしで、結果的にアプリケーションが止まっているんです」

エマは椅子を持ってきて、一緒にログを見ます。

「それじゃ、これを起動しているコンフィグを見せてもらえます?」

「はい」と言って、本番アプリケーションのコンフィグを表示します。エマは身を乗り出して、値を調べます。 ...

Get エンジニアリングマネージャーのしごと ―チームが必要とするマネージャーになる方法 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.