book

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池彰

May 2018

Intermediate to advanced

556 pages

13h 21m

Japanese

O'Reilly Japan, Inc.

Read now

Unlock full access

Content preview from Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

210

章

pandas

を使ったデータ操作

3.13

ハイパフォーマンス

pandas

：

eval()

と

query()

これまでに説明したように、

PyData

が強力であるのは、

NumPy

のベクトル化

ブロードキャス

ト操作および

pandas

のグループ化などの直感的な構文による基本操作を、

言語で書かれたコー

ドで実行する能力を基盤にしています。こうした抽象化は多くの一般的ユースケースで効率的かつ

効果的ですが、しばしば一時的な中間オブジェクトを生成し、計算時間とメモリ使用に過大なオー

バーヘッドを引き起こす可能性があります。

（

2014

年

月リリースにリリースされた）

pandas

バージョン

0.13

から、コストのかかる中間配列

の割り当てを行わずに

言語コードの実行速度で直接操作するための実験的機能、

Numexpr

ライ

ブラリ（

https://github.com/pydata/numexpr

）の

eval()

関数と

query()

関数を提供しています。こ

こ

では、どのように使うのか、使うための考え方について見てみましょう。

3.13.1

query()

と

eval()

の必要性：複合表現

既に見てきたように、

NumPy

と

pandas

は高速なベクトル化操作をサポートしています。例えば、

つの配列で、要素ごとの加算は次のように実行します。

In[1]: import numpy as np

rng = np.random.RandomState(42)

x = rng.rand(1000000)

y = rng.rand(1000000) ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

Pythonデータサイエンスハンドブック第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池彰

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

Andreas C. Muller, Sarah Guido, 中田秀基

PythonによるAIプログラミング入門 ―ディープラーニングを始める前に身につけておくべき15の基礎技術

Prateek Joshi, 相川愛三

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873118413Other