第9章. MotherDuckを使ってクラウドでDuckDBを使う
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
これまで、ローカルに保存されているデータであれ、リモートサーバに保存されているデータであれ、マシンにインストールしたDuckDBを使ってデータを操作する方法を学んできた。マシン上でDuckDBを使用するには、DuckDBをインストールし、Anacondaなどの開発環境をセットアップする必要がある。しかし、マシンをセットアップする手間をかけずに、データを高速に分析したい場合はどうすればいいのだろうか?MotherDuckの登場だ。
MotherDuckは、DuckDB上に構築されたサーバーレスのクラウド分析プラットフォームである。クラウドベースの管理性、拡張性、高度な分析機能を提供することで、DuckDBを強化している。要するに、自分のマシンをセットアップしなくても、MotherDuckを使って本書で学んだすべての演算子を実行できるのだ。エキサイティングだろう?
この章では、MotherDuckを使い始め、分析タスクに活用する方法を説明する。具体的には、以下のことを学ぶ:
データベースのアップロードと作成
データベースを他者と共有する
共有データベースをアタッチする
データベースへのクエリ
SDL文の作成にAIを活用する
ローカルのDuckDBデータベースとMotherDuckを接続する
ローカルとリモートのDuckDBデータベースを操作するハイブリッドクエリを実行する。
まずはマザーダックについての基本的なことから始めよう。
マザーダックについて
多くのデータ分析ユーザにとって、複雑なデータインフラは必ずしも必要ではない。必要なのは、データを簡単にホストし共有できるサーバーレス・データウェアハウスであることが多い。この、MotherDuckの出番だ。MotherDuckを使えば、簡単にデータをクラウドにアップロードし、クエリを開始することができる。MotherDuckは、Parquet、CSV、JSON、Iceberg、Delta Lakeといった様々なデータ形式をサポートしている。さらに、デュアル実行と呼ばれる機能により、クエリの一部をローカルで実行し、他の一部をクラウドで実行することができる。
さらに、MotherDuckは各ユーザに個別の独立したコンピュートインスタンスを代入することで、管理を効率化し、コストを削減する。これらのインスタンスは、数テラバイトに及ぶワークロードを管理するために、個別に拡張することができる。
これからのセクションでは、MotherDuckを使い始め、クラウド上でデータベースを作成する方法を紹介する。
マザーダックに登録する
MotherDuckを使い始めるには、まず、30日間の無料トライアルを開始する。トライアル期間終了後、無料アカウントを継続するか、有料プランにアップグレードするかを選択できる。始め方はこちら:
30DAY TRIALボタンをクリックする(図9-1参照)。
注
MotherDuckの本番インフラはAmazon Web Servicesでホストされており、サービスは主にKubernetes制御のコンテナとして稼働している。
この試用期間中にMotherDuckの機能を試してみてから、アカウントの好みを決めることができる。
図9-1. ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access