Skip to Content
DuckDB: 起動して実行中
book

DuckDB: 起動して実行中

by Wei-Meng Lee
March 2025
Intermediate to advanced
308 pages
5h 8m
Japanese
O'Reilly Media, Inc.
Content preview from DuckDB: 起動して実行中

第1章. DuckDBを使い始める

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com

データ分析に関しては、多くの開発者にとってpandasがよく使われるライブラリだ。最近では、PolarsがDataFramesを扱うための、より高速で効率的な代替ライブラリとして登場した。しかし、これらのライブラリの人気()にもかかわらず、SQL(Structured Query Language)は依然として開発者の間で最も広く認知され、使用されている言語である。SQLをサポートしているデータベースにデータがストアされている場合、SQLを使ってデータをクエリしたり操作したりするのが、最も直感的で効果的なアプローチであることが多い。

Pythonはデータサイエンスにおいて、特にDataFrameオブジェクトを通して表形式のデータを扱う際に主流となっているが、SQLは依然として普遍的なデータ言語である。ほとんどの開発者がすでにSQLに慣れていることを考えると、SQLを直接データ操作に使った方が効率的ではないだろうか?

ここでDuckDBが輝く。DuckDBは当初、、高速な分析クエリに最適化されたOLAP(オンライン分析処理)データベースとして2018年に概念化された。その目的は、本格的なデータベースシステムとSQLiteのような組み込みDBのシンプルさとのギャップを埋めることだったが、トランザクションよりも分析ワークロードに焦点を当てていた。DuckDBの最初の安定リリースは2019年で、PythonやRとの統合が容易なことから、、データサイエンスや分析のコミュニティの間で非常に人気のある選択肢となった。DuckDBはオープンソースであるが、DuckDB Labsは2021年に設立され、商用サポートとさらなる開発を提供している。DuckDBをクラウド化するために、MotherDuckがDuckDBを中心に構築され、ユーザがSaaS(サービスとしてのソフトウェア)としてアクセスできるようになった。MotherDuckによって、開発者はDuckDBを分散管理された環境で利用できるようになり、より大規模なデータセットや共同利用のための拡張がより容易になった(これについては第9章で詳しく述べる)。

この章では、DuckDBとは何か、なぜデータ分析のための強力なツールなのか、そしてデータ分析作業を効率化するためにDuckDBの機能をどのように活用できるのかについて掘り下げていく。DuckDBは、SQLのパフォーマンスと柔軟性をPython環境で利用できるため、データサイエンティストやアナリストにとって貴重なツールとなる。

DuckDBの紹介

DuckDBはSQLをサポートするリレーショナルデータベース管理システム(RDBMS)であり、OLAPのために特別に設計されているため、、データ分析タスクに最適である。

別途インストールプロセスが必要な従来のデータベースシステムとは異なり、DuckDBは完全にin-processで演算子されるため、インストールやセットアップを心配する必要がない。、DuckDBの最も魅力的な特徴のひとつは、データのインポートや重複を必要とせず、pandasのデータに対して直接SQLクエリを実行できることだ。このpandasとのシームレスな統合により、DuckDBは、すでにpandasのエコシステムに精通しているデータサイエンティストやアナリストにとって、非常に強力なツールとなる。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

AWSでのサーバーレス開発

AWSでのサーバーレス開発

Sheen Brisals, Luke Hedger
初めてのGraphQL ―Webサービスを作って学ぶ新世代API

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎 沙耶, あんどうやすし
エンジニアが学ぶ会計システムの「知識」と「技術」

エンジニアが学ぶ会計システムの「知識」と「技術」

広川 敬祐, 五島 伸二, 小田 恭彦, 大塚 晃, 川勝 健司

Publisher Resources

ISBN: 9798341633889