book

Kubernetes オペレータ

by Jason Dobies, Joshua Wood

May 2025

Intermediate to advanced

156 pages

2h 9m

Japanese

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

この本は誰のためにあるのか？何を学ぶか演算子フレームワークとSDKその他の演算子ツール本書で使用されている慣例コード例を使うオライリー・オンライン・ラーニング問い合わせ先謝辞
Kubernetesの仕組み例ステートレスWebサーバステートフルは難しい演算子はソフトウェアSREである。演算子の仕組みKubernetes CRs演算子ができるまで例etcd演算子メンバー行方不明事件演算子は誰のためにあるのか？演算子の採用さあ、出発だ！
演算子ラボのセットアップクラスタ・バージョンの要件認可要件標準的なツールとテクニック推奨されるクラスタ構成クラスタのバージョンを確認するシンプルな演算子を実行する共通の出発点etcd演算子マニフェストの取得CRs：カスタムAPIエンドポイント私は誰だ：演算子サービスアカウントの定義etcd演算子をデプロイするetcdクラスタを宣言するetcdのエクササイズetcdクラスタをスケールする故障と自動復旧etcdクラスタをアップグレードする後片付け概要
標準的なスケーリング：ReplicaSetリソースカスタムリソースCRかコンフィグマップか？カスタムコントローラー演算子スコープ名前空間のスコープクラスタスコープ演算子認可サービスアカウント役割ロールバインディングクラスタロールとクラスタロールバインディング概要
演算子フレームワークの起源演算子成熟度モデル演算子SDK演算子SDKツールのインストール演算子ライフサイクルマネージャー演算子メータリング概要
アプリケーションの概要マニフェストによるインストールMySQL をデプロイするバックエンドフロントエンドマニフェストをデプロイするビジターサイトへのアクセス大掃除概要
ヘルム演算子演算子を構築するCRDに肉薄する演算子権限の見直しヘルムオペレーターを動かすAnsible演算子演算子を構築するCRDに肉薄する演算子権限の見直しAnsible演算子を実行する演算子のテスト概要リソース
演算子の初期化演算子スコープカスタムリソース定義Goタイプの定義CRDマニフェスト演算子権限コントローラーリコンサイル関数演算子執筆のヒントリソースを取り出す子どものリソース作成チャイルドリソースの削除チャイルドリソースの名前付けべき乗演算子への影響ローカルでの演算子の実行ビジターサイトの例概要リソース
OLMカスタムリソースClusterServiceVersionカタログソースサブスクリプションインストールプランオペレーターグループOLMをインストールするOLMを使用する演算子を探る演算子の削除OLMバンドルメタデータファイルカスタムリソース定義クラスタサービスバージョンファイルパッケージマニフェストファイルクラスタサービスのバージョンファイルを書くファイルのスケルトンを生成するメタデータ所有CRD必要なCRDインストールモードバージョンアップと更新パッケージマニフェストファイルを書く地元を走る前提条件OLMバンドルを構築するOLMによる演算子のインストールテスト実行する演算子ビジターサイト演算子の例概要リソース
あらゆるアプリケーションのためのSRE労せずして、紡がず自動化できる：コンピューターが望む仕事その場で走る：永続的な価値のない仕事成長の痛み：システムとともに拡大する仕事演算子：Kubernetesアプリケーション信頼性エンジニアリングアプリケーション状態を管理するソフトウェアに送られるゴールデンシグナル成功する演算子の7つの習慣概要

機能リクエストとバグ報告貢献シェアリング演算子概要
役割を微調整する

Content preview from Kubernetes オペレータ

第9章. 演算子の哲学

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている：translation-feedback@oreilly.com

演算子が解決しようとする問題を指摘し、SDKを使用して演算子を構築する方法の詳細な例を説明した。また、OLMで演算子を首尾一貫した方法で配布する方法も見てきた。演算子は何のためにあるのか」という本質的な問いを理解するために、これらの戦術をその基礎となる戦略的アイデアに結び付けてみましょう。

演算子の概念は、サイト信頼性エンジニアリング（SRE）から派生したものである。第1章では、ソフトウェアSREとしての演算子について述べた。SREの主要な考え方を復習し、演算子がそれをどのように適用するかを理解しよう。

あらゆるアプリケーションのためのSRE

SREは、ユーザ数や機能が増え続ける大規模システムの運用という課題にレスポンスしてGoogleで始まった。 SRE の主要な目的は、運営するチームを無理に大きくすることなく、サービスを成長させることである。劇的な規模のシステムを、劇的な規模のチームなしで運用するために、SRE はデプロイ、演算子、保守タスクを処理するコードを書く。SRE は、他のソフトウェアを実行するソフトウェアを作成し、それを実行し続け、長期にわたって管理する。SREは、自動化を中心とした、より広範な管理・エンジニアリングテクニックのセットである。その目標は、「自律型」ソフトウェアや「自動運転」ソフトウェアなど、さまざまな名前で呼ばれているのを聞いたことがあるかもしれない。図4-1で紹介した演算子成熟度モデルでは、"Auto Pilot "と呼んでいる。

演算子とOperator Frameworkは、Kubernetes上で実行されるアプリケーションに対して、このような自動化の実装を容易にする。Kubernetesはサービスのデプロイをオーケストレーションし、ステートレスアプリケーションの水平スケーリングや障害回復の作業の一部を自動化する。分散システムリソースをAPIの抽象化として表現する。or演算子を使用することで、開発者はこれらのプラクティスを複雑なアプリケーションに拡張することができる。

ベッツィー・ベイヤー他編による「Site Reliability Engineering」（O'Reilly）は、SREの原則に関する権威あるガイドである。GoogleのエンジニアであるCarla Geisserのコメントは、SREの自動化の要素を象徴している。「もし通常運用中に人間の演算子がシステムに触れる必要があるなら、それはバグである。¹SREはバグを修正するコードを書く。演算子は、Kubernetes上の幅広いクラスのアプリケーションのために、それらの修正をプログラミングする論理演算子だ。Operatorは、アプリケーションの実行を維持するための定期的な雑用を自動化することで、人間の介入によるバグを減らす。

労せずして、紡がず

SREは、システムの運用に必要なタスクを実行するソフトウェアを作成することで、労力を削減しようとする。この文脈での労力とは、、「自動化可能で、戦術的で、永続的な価値を持たず、サービスが成長するにつれて直線的に拡大する作業」と定義される。²

自動化できる：コンピューターが望む仕事

マシンができるなら、仕事は自動化できる。人間の判断が必要なタスクは、マシンにはできない。例えば、経費報告書はマシン主導で様々な境界チェックを受けるが、通常、すべての領収書ではないにせよ、自動化されたプロセスが境界外としてフラグを立てた項目については、最終的に人間によるレビューが必要である。範囲内のレポートの承認は自動化できるかもしれないが、範囲外のケースの最終的な受理または拒否は自動化できないかもしれない。ソフトウェアで自動化できる作業も、反復的であればソフトウェアで自動化すべきである。反復タスクを実行するソフトウェアを構築するコストは、反復の生涯にわたって償却することができる。 ...