5章サードパーティとの協力を円滑に進める重要性

Jonathan Mercereau(traffiq corp.、元LinkedIn)

ここ何年かの間にサイトリライアビリティエンジニアリング(SRE)の定義は進化してきましたが、その最も簡潔な要約は私なりに表現すると「ソフトウェアエンジニアリングが従来『運用』と呼んできたものを任されたときにできあがるもの」です†1。ほとんどのサイトリライアビリティチームは運用を、独自のインフラストラクチャでアプリケーションを実行することと考えています。近年では、専門性の高い領域できわめて特殊な機能を提供するサードパーティに依存する企業が増え続けています。こうした機能には例えば、ドメインネームシステム(DNS)、コンテンツデリバリネットワーク(CDN)、アプリケーション性能管理(APM)、ストレージ、支払い、電子メール、メッセージング(SMS)、セキュリティ(シングルサインオン[SSO]や2要素認証[2FA]など)、ログ処理などがあります。こうしたリソースはどれも、適切に導入されない場合にはサイトのダウンをもたらしかねない依存関係となります。

[†1] 『SRE サイトリライアビリティエンジニアリング』(オライリー)の「1章 イントロダクション」(原書 https://sre.google/sre-book/introduction/)を参照。

ベンダーとは、利用する側がコントロールできないブラックボックスなのでしょうか。必ずしもそうではありません。ベンダーの力を借りるというアプローチを取る場合には、そうしたサードパーティとの協力に対しても、不満や軋轢を減らす取り組みとして、自社内と同じ一連のSRE規律を適用することが重要です。

5.1 構築、購入、それとも採用か ...

Get SREの探求 ―様々な企業におけるサイトリライアビリティエンジニアリングの導入と実践 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.