Skip to Content
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
book

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池 彰
May 2018
Intermediate to advanced
556 pages
13h 21m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
128
3
章 
pandas
を使ったデータ操作
一般的なパターンが作れます。こうして、使い慣れた
1
次元の
Series
または
2
次元の
DataFrame
ブジェクト内で、高次元のデータがコンパクトに表現できます。
この節では、
MultiIndex
オブジェクトを直接作成する方法について説明します。インデクスの
指定方法、スライス、そして複数のインデクスを持つデータの統計を計算する際に必要となる考慮
事項を取り上げ、単純なインデクス表現と階層型インデクス表現のデータを変換する機能を示しま
す。
いつものように、最初に標準的な
import
を行います。
In[1]: import pandas as pd
import numpy as np
3.6.1
 多重インデクスを持つ
Series
最初に、
1
次元の
Series
内で
2
次元データを表現する方法を検討してみましょう。具体的には、
各要素が文字と数値キーを持つ一連のデータを扱います。
3.6.1.1
 誤った手法
米国の州に関するデータで、異なる年の値を管理することを考えます。既に説明した
pandas
機能を使用するなら、単純にタプルをキーとして使用してしまうかもしれません。
In[2]: index = [('California', 2000), ('California', 2010),
('New York', 2000), ('New York', 2010),
('Texas', 2000), ('Texas', 2010)]
populations = [33871648, ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池 彰
初めてのGraphQL ―Webサービスを作って学ぶ新世代API

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎 沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873118413Other