book

DuckDB: 起動して実行中

Name: DuckDB: 起動して実行中
Author: Wei-Meng Lee
ISBN: 9798341633889

by Wei-Meng Lee

March 2025

Intermediate to advanced

308 pages

5h 8m

Japanese

O'Reilly Media, Inc.

Read now

Unlock full access

序文
本書で使用されている慣例コード例を使うオライリー・オンライン・ラーニング問い合わせ先謝辞
1.DuckDBを使い始める
DuckDBの紹介なぜDuckDBを使うのか？高性能分析クエリ多様なプログラミング言語への統合と使いやすさオープンソースDuckDBの概要DuckDBにデータをロードするレコードを挿入するテーブルをクエリするアグリゲーションを行うテーブルの結合pandasからデータを読み取るDuckDBがより効率的な理由実行速度メモリ使用量概要
2.DuckDBにデータをインポートする
DuckDBデータベースを作成する異なるデータソースと形式からデータをロードするCSVファイルを扱うパーケットファイルを扱うエクセルファイルを扱うMySQLを使う概要
3.SQL入門
DuckDB CLIを使用するDuckDBにデータをインポートするドットコマンドインメモリデータベースをディスクに永続化するDuckDB SQL入門データベースを作成するテーブルの作成テーブルのスキーマを見るテーブルをドロップするテーブルを使うテーブルに行を追加する行を更新する行を削除するテーブルをクエリするテーブルの結合データの集計アナリティクス概要
4.ポーラーでDuckDBを使う
ポーラー入門極データフレームの作成ポーラーでレイジー評価を理解するDuckDBを使ってPolarsのデータフレームをクエリするsql() 関数を使用するDuckDBPyRelationオブジェクトを使用する概要
5.DuckDBでEDAを行う
我々のデータセット2015年のフライト遅延データセット地理空間分析マッピングを表示する地図上にすべての空港を表示するDuckDBで空間拡張機能を使う記述的分析を実行する各都道府県の空港を発見する各州の空港総数の集計出発空港と到着空港の各ペアのフライトカウントを取得する。航空会社から欠航便を受け取る曜日ごとのフライトカウントを取得するフライト遅延の多い時間帯を発見する最も遅延の少ない航空会社を発見する概要
6.JSONファイルでDuckDBを使用する
JSONの入門書オブジェクト文字列ブール数ネストされたオブジェクト配列ヌルDuckDBにJSONファイルを読み込むread_json_auto()関数を使うread_json()関数を使うCOPY-FROMステートメントを使用する。テーブルをJSONにエクスポートする概要
7.JupySQLでDuckDBを使う
JupySQLとは何か？JupySQLをインストールするsql ExtensionをロードするDuckDBと統合するクエリを実行するスニペットを保存する視覚化ヒストグラムボックス・プロット円グラフバー・プロットMySQLと統合する環境変数を使う.iniファイルを使うキーホルダーを使う概要
8.DuckDBを使用してリモートデータにアクセスする
DuckDBのhttpfs拡張機能CSVファイルとParquetファイルをリモートでクエリするCSVファイルにアクセスするパーケットファイルにアクセスするハグする顔のデータセットをクエリするハグする顔のデータセットを使うhf://パスを使ったデータセットの読み取りフォルダ内のファイルにアクセスするGlob構文を使った複数ファイルのクエリプライベートのハグ顔データセットを扱う概要
9.MotherDuckでDuckDBをクラウドで使う
マザーダックについてマザーダックに登録するマザーダック・プランMotherDuckを使い始めるテーブルを追加するスキーマの作成データベースを共有するデータベースを作成するデータベースを切り離すMotherDuckのデータベースを使うデータベースをクエリするAIを使ってSQLを書くDuckDB CLIからMotherDuckを使用するMotherDuckに接続するMotherDuckでデータベースをクエリするMotherDuckでデータベースを作成するハイブリッドクエリを実行する概要

インデックス
著者について

Content preview from DuckDB: 起動して実行中

第9章. MotherDuckを使ってクラウドでDuckDBを使う

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている：translation-feedback@oreilly.com

これまで、ローカルに保存されているデータであれ、リモートサーバに保存されているデータであれ、マシンにインストールしたDuckDBを使ってデータを操作する方法を学んできた。マシン上でDuckDBを使用するには、DuckDBをインストールし、Anacondaなどの開発環境をセットアップする必要がある。しかし、マシンをセットアップする手間をかけずに、データを高速に分析したい場合はどうすればいいのだろうか？MotherDuckの登場だ。

MotherDuckは、DuckDB上に構築されたサーバーレスのクラウド分析プラットフォームである。クラウドベースの管理性、拡張性、高度な分析機能を提供することで、DuckDBを強化している。要するに、自分のマシンをセットアップしなくても、MotherDuckを使って本書で学んだすべての演算子を実行できるのだ。エキサイティングだろう？

この章では、MotherDuckを使い始め、分析タスクに活用する方法を説明する。具体的には、以下のことを学ぶ：

データベースのアップロードと作成
データベースを他者と共有する
共有データベースをアタッチする
データベースへのクエリ
SDL文の作成にAIを活用する
ローカルのDuckDBデータベースとMotherDuckを接続する
ローカルとリモートのDuckDBデータベースを操作するハイブリッドクエリを実行する。

まずはマザーダックについての基本的なことから始めよう。

マザーダックについて

多くのデータ分析ユーザにとって、複雑なデータインフラは必ずしも必要ではない。必要なのは、データを簡単にホストし共有できるサーバーレス・データウェアハウスであることが多い。この、MotherDuckの出番だ。MotherDuckを使えば、簡単にデータをクラウドにアップロードし、クエリを開始することができる。MotherDuckは、Parquet、CSV、JSON、Iceberg、Delta Lakeといった様々なデータ形式をサポートしている。さらに、デュアル実行と呼ばれる機能により、クエリの一部をローカルで実行し、他の一部をクラウドで実行することができる。

さらに、MotherDuckは各ユーザに個別の独立したコンピュートインスタンスを代入することで、管理を効率化し、コストを削減する。これらのインスタンスは、数テラバイトに及ぶワークロードを管理するために、個別に拡張することができる。

これからのセクションでは、MotherDuckを使い始め、クラウド上でデータベースを作成する方法を紹介する。

マザーダックに登録する

MotherDuckを使い始めるには、まず、30日間の無料トライアルを開始する。トライアル期間終了後、無料アカウントを継続するか、有料プランにアップグレードするかを選択できる。始め方はこちら：

https://motherduck.com。
30DAY TRIALボタンをクリックする（図9-1参照）。

注

MotherDuckの本番インフラはAmazon Web Servicesでホストされており、サービスは主にKubernetes制御のコンテナとして稼働している。

この試用期間中にMotherDuckの機能を試してみてから、アカウントの好みを決めることができる。

図9-1. ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341633889

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills