book

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池彰

May 2018

Intermediate to advanced

556 pages

13h 21m

Japanese

O'Reilly Japan, Inc.

Read now

Unlock full access

Content preview from Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

2.9

構造化データ：

NumPy

の構造化配列

2.9

構造化データ：

NumPy

の構造化配列

多くの場合、データは均質な値の配列で十分に表現できますが、そうではない場合もあります。

この節では、

NumPy

の構造化配列とレコード配列を使用して、複合型の異種データを効率的に格

納する方法を示します。ここに示すパターンは単純な操作には有益ですが、このようなシナリオに

対しては第

章で取り上げる

pandas

の

DataFrame

が活用できます。

多くの人々に対するいくつかのカテゴリのデータ（例えば、名前、年齢、体重など）があるとし

ましょう。これらの値を

Python

プログラムで使用するために保存したいとします。これらをそれ

ぞれ別の配列に格納することは可能です。

In[1]: import numpy as np

In[2]: name = ['Alice', 'Bob', 'Cathy', 'Doug']

age = [25, 45, 37, 19]

weight = [55.0, 85.5, 68.0, 61.5]

しかし、これはあまり賢い方法ではありません。

つの配列がそれぞれ関連していることがわか

りません。

つの構造体を使用してこれらのデータをすべて格納できるのであれば、その方が自然

です。

NumPy

では、複合データ型の配列である構造化配列を使って実現できます。

次のような式を使って単純な配列を作成したことを思い出してください。

In[3]: x = np.zeros(4, dtype=int)

同様に、複合データ型指定を使用して、構造化配列を作成することができます。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

Pythonデータサイエンスハンドブック第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池彰

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

Andreas C. Muller, Sarah Guido, 中田秀基

PythonによるAIプログラミング入門 ―ディープラーニングを始める前に身につけておくべき15の基礎技術

Prateek Joshi, 相川愛三

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873118413Other