book

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池彰

May 2018

Intermediate to advanced

556 pages

13h 21m

Japanese

O'Reilly Japan, Inc.

Read now

Unlock full access

Content preview from Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

128

章

pandas

を使ったデータ操作

一般的なパターンが作れます。こうして、使い慣れた

次元の

Series

または

次元の

DataFrame

オ

ブジェクト内で、高次元のデータがコンパクトに表現できます。

この節では、

MultiIndex

オブジェクトを直接作成する方法について説明します。インデクスの

指定方法、スライス、そして複数のインデクスを持つデータの統計を計算する際に必要となる考慮

事項を取り上げ、単純なインデクス表現と階層型インデクス表現のデータを変換する機能を示しま

す。

いつものように、最初に標準的な

import

を行います。

In[1]: import pandas as pd

import numpy as np

3.6.1

多重インデクスを持つ

Series

最初に、

次元の

Series

内で

次元データを表現する方法を検討してみましょう。具体的には、

各要素が文字と数値キーを持つ一連のデータを扱います。

3.6.1.1

誤った手法

米国の州に関するデータで、異なる年の値を管理することを考えます。既に説明した

pandas

の

機能を使用するなら、単純にタプルをキーとして使用してしまうかもしれません。

In[2]: index = [('California', 2000), ('California', 2010),

('New York', 2000), ('New York', 2010),

('Texas', 2000), ('Texas', 2010)]

populations = [33871648, ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

Pythonデータサイエンスハンドブック第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池彰

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

Andreas C. Muller, Sarah Guido, 中田秀基

PythonによるAIプログラミング入門 ―ディープラーニングを始める前に身につけておくべき15の基礎技術

Prateek Joshi, 相川愛三

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873118413Other