book

Kubernetes でのクラウドネイティブデータの管理

by Jeff Carpenter, Patrick McFadin

May 2025

Intermediate to advanced

332 pages

5h 32m

Japanese

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

この本を書いた理由この本は誰のためのものか？この本の読み取り方本書で使用されている慣例コード例を使うオライリー・オンライン・ラーニング問い合わせ先謝辞
インフラの種類クラウド・ネイティブ・データとは何か？より多くのインフラ、より多くの問題世界をリードするKubernetesKubernetesでコンピートを管理するKubernetesでNetworkを管理するKubernetesでストレージを管理するクラウド・ネイティブ・データ・コンポーネント前向きに革命への準備SREマインドセットを採用する分散コンピューティングを取り入れるクラウドネイティブ・データインフラの原則概要
Docker、コンテナ、ステートDockerで状態を管理するバインドマウントボリュームTmpfsマウントボリュームドライバーデータストレージ用Kubernetesリソースポッドとボリューム永続ボリュームPersistentVolumeClaimsストレージクラスKubernetesストレージアーキテクチャフレックスボリュームコンテナ・ストレージ・インタフェースコンテナ・アタッチド・ストレージコンテナ・オブジェクト・ストレージ・インタフェース概要
困難な道Kubernetes上でデータインフラを動かすための前提条件Kubernetes上でMySQLを実行するレプリカセットデプロイサービスMySQLにアクセスするKubernetes上でApache Cassandraを実行するステートフルセットCassandraにアクセスする概要
HelmチャートでアプリケーションをデプロイするHelmを使用してMySQLをデプロイするヘルム社の仕組みラベルサービスアカウント秘密コンフィグマップヘルムチャートを更新するHelmチャートをアンインストールするHelmを使用してApache Cassandraをデプロイする親和性と反親和性Helm、CI/CD、演算子概要
Kubernetesコントロールプレーンを拡張するKubernetesクライアントを拡張するKubernetesのコントロールプレーンコンポーネントを拡張するKubernetesワーカーノードコンポーネントを拡張する演算子パターンコントローラーカスタムリソース演算子KubernetesでVitess演算子を使ってMySQLを管理するヴィテス概要PlanetScale ヴィテス演算子拡大する演算子のエコシステム演算子を選ぶビル演算子概要
K8ssandra: Kubernetes上のプロダクション・レディなCassandraK8sandraアーキテクチャK8ssandra演算子のインストールK8ssandraClusterを作成するCass Operatorを使ってKubernetesでCassandraを管理するスターゲイトAPIで開発者の生産性を高めるPrometheusとGrafanaによる統合モニタリングインフラCassandra Reaperで修理を行うCassandraでデータのバックアップと復元を行うバックアップの作成バックアップから復元するKubernetesでマルチクラスターアプリケーションをデプロイする概要
Kubernetesネイティブなアプローチが必要な理由TiDBによるスケールでのハイブリッド・データ・アクセスTiDBアーキテクチャKubernetesでTiDBをデプロイするサーバレスCassandraとDataStax Astra DBKubernetesネイティブデータベースを選ぶポイント基本要件Kubernetesネイティブの未来概要
ストリーミング入門配達の種類配信保証特集スコープKubernetesにおけるストリーミングの役割Apache Pulsarを使ってKubernetes上でストリーミングを行う環境を整えるcert-managerでデフォルトで通信を保護するHelmを使ってApache PulsarをデプロイするApache Flinkによるストリーム解析Kubernetes上でApache Flinkをデプロイする概要

アナリティクス入門Kubernetesで分析ワークロードをデプロイするApache Spark入門KubernetesでApache Sparkをデプロイするカスタムコンテナを作る申請書を提出し、実行するApache Spark向けKubernetes演算子Kubernetesの代替スケジューラアパッチ・ユニコーン火山Kubernetesのための分析エンジンダスクRay概要
クラウドネイティブAI/MLスタックAI/MLの定義AI/MLスタックの定義KServeによるリアルタイム・モデル・サービングFeastによるフル・ライフサイクル・フィーチャー管理Milvusによるベクトル類似度検索Apache Arrowによる効率的なデータ移動lakeFSによるバージョン管理されたオブジェクト・ストレージ概要
構想アプリケーション・アウェア・プラットフォーム成功へのパスを描く人々テクノロジープロセスクラウド・ネイティブ・データの未来概要

Content preview from Kubernetes でのクラウドネイティブデータの管理

第9章. Kubernetes上でのデータ分析

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている：translation-feedback@oreilly.com

テクノロジーの進歩とは、私たちがより怠惰になれる能力を手に入れたときである。

ローリアン・キリカ博士

2000年代初頭、Googleは「世界中の情報を整理し、普遍的にアクセス可能で有用なものにする」というパブリックゴールを宣言し、インターネットを魅了した。これは野心的な目標であり、これを達成するには、言葉を換えれば、「コンピュータ・サイエンス」を駆使する必要があった。データの作成速度がますます速くなっていることを考えると、Googleは誰も考えたことのないデータ量の管理方法を発明（そして再発明）する必要があった。アナリティクスと呼ばれるデータ分析を中心とした全く新しいコミュニティ、文化、産業が生まれ、最終的に "ビッグデータ "と呼ばれるようになった。今日、アナリティクスはほとんどすべてのアプリケーションスタックの本格的なメンバーであり、グーグルの問題に追いやられているわけではない。今やアナリティクスは全員の問題であり、一部の専門家に限定されたアートフォームではなく、全員がアナリティクスを機能させる方法を知る必要がある。組織は、分析機能を備えたアプリケーションをデプロイするための、信頼性が高く迅速な方法を必要としている。

本章の冒頭でチリカ博士が皮肉交じりに語っていた怠惰は、理想的な未来を描いている。ペタバイトのデータを分析するために100人のチームが日夜働く代わりに、それを1人と数分に減らすことができたらどうだろう？クラウド・ネイティブなデータ・インフラの運用方法は、そのような輝かしい怠惰を実現するために、私たち全員が目指すべきパスなのだ。

ステートフルなワークロードをKubernetes上に移行するためのいくつかの側面について、ストレージ、データベース、ストリーミングを含めてすでに見てきた。この章では、アナリティクスを見て、全体像を完成させよう。図9-1は、Kubernetesを使用して完全なデータスタックを管理するというロードマップの最後の部分として、データ分析がどのように適合するかを示している。

このアーキテクチャでは、Kubernetesクラスタ内外のリソースにブリッジする外部ネットワーク要件はなくなり、クラウド・ネイティブ・アプリケーションの特注ニーズに対応する単一の仮想データセンターだけが存在する。大きなブロックは、第1章で説明したデータインフラストラクチャのマクロコンポーネントを表し、マイクロサービスではデプロイされたユーザアプリケーションコードが追加されている。

アナリティクス入門

分析ワークロードとそれに伴うインフラ運用は、他のワークロードとは大きく異なる。アナリティクスは、オーケストレーションするための単なるコンテナ化されたシステムではない。前章で検討したデータベースのような典型的なステートフル・アプリケーションは、多くの類似した特徴を持つが、デプロイ後は静的なままか、成長が予測できるほど遅くなる傾向がある。

しかし、分析ワークロードのある側面が、多くの管理者を恐怖に陥れている。データベースのような永続的データストアがギガバイトからテラバイトのストレージを消費するのに対し、分析ボリュームは簡単にペタバイトにまで膨れ上がり、解決すべき全く新しいクラスの問題を作成することになる。これを「ビッグデータ」と呼ぶ理由はない。 ...