はじめに
本書は、私がUber TechnologiesにSRE(サイト信頼性エンジニア、サイトリライアビリティエンジニア)として入社してから数か月後に始めた、本番対応(プロダクションレディネス)向上の取り組みから生まれたものです。Uberの巨大でモノリシックなAPIは、ゆっくりとしたペースでマイクロサービスに分割されつつあり、私が入社した頃には、このモノリシックなAPIから分割され、このAPIとともに実行されているマイクロサービスが1,000以上ありました。個々のマイクロサービスはそのマイクロサービスを所有する開発チームによって設計、構築、メンテナンスされており、サービス全体の85%以上は、SREの関与がなく、SREのリソースを利用していませんでした。
SREを採用してSREチームを作るのは非常に難しい仕事ですが、それはSREがもっとも探しにくい種類のエンジニアだからです。サイト信頼性エンジニアリングはまだ比較的新しい分野であり、SREは(少なくともある程度は)ソフトウェア工学、システム工学、分散システムアーキテクチャの専門家でなければなりません。すべてのチームに専用のSREチームをすぐに用意することは、とてもできません。そこで、私のチーム(コンサルティングSREチーム)が生まれました。我々が上層部から受けた指示は単純なものでした。SREが関与していない85%のマイクロサービスで高い標準を推進する方法を探せというものです。
我々の使命は単純であり、受けた指示は曖昧だったので、私と私のチームには、Uberのすべてのマイクロサービスが従う標準の策定に関してかなりの自由がありました。しかし、この大規模な技術組織の中で実行されているすべてのマイクロサービスに適用すべき高い標準を考え出すのは、簡単なことではありませんでした。そこで、優れた同僚であるRick ...
Get プロダクションレディマイクロサービス ―運用に強い本番対応システムの実装と標準化 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.