December 2025
Intermediate to advanced
468 pages
7h 58m
Japanese
エクスプレッションの仕組みを理解したところで、次はエクスプレッションの使い方を見ていこう。本章ではDataFrameの列に関係する演算を取り上げる†1。既存の列の選択と新規列の作成に焦点を当てる。これらはデータを扱う際に行う、最も一般的な操作だろう。
まず、「7章 エクスプレッションとは」で紹介したdf.select()を再度説明する。次に、より柔軟な列の選択方法を紹介する。いわゆる列セレクタを使用する方法である。セレクタを用いると、列の名前や、データ型、位置に基づいて列を指定することができる。これらはさまざまな方法で組み合わせることができる。さらに、新しい列を作成したり、列を並べ替えたりする方法を紹介する。最後に、関連する列の演算について簡単に説明する。列の名前変更や削除、2つのDataFrameの列の結合などだ。
本章では、スター・ウォーズの世界に登場する我々が好きな反乱軍(rebels)に関するDataFrameを扱う。
starwars = pl.read_parquet("data/starwars.parquet")
rebels = starwars.drop("films").filter(
pl.col("name").is_in(["Luke Skywalker", "Leia Organa", "Han Solo"])
)
print(rebels[:, :6]) ❶
print(rebels[:, 6:11])
print(rebels[:, 11:])
❶ ここでは、DataFrameを列ごとにスライスして、本のページに収まるようにしている。折り畳みページを使う方法もあるが、この種の本ではあまり使用しない。
shape: ...
Read now
Unlock full access