Skip to Content
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
book

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池 彰
May 2018
Intermediate to advanced
556 pages
13h 21m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
97
3
pandas
を使ったデータ操作
前の章では、
NumPy
とその
ndarray
オブジェクトについて詳しく説明しました。このオブジェ
クトは、
Python
で高密度の型付き配列を効率的に格納する手段と、効果的に操作する機能を提供
します。この章では、
pandas
ライブラリによって提供されるデータ構造を詳しく調べ、同様の知
識を習得します。
pandas
は、
NumPy
の上に構築された新しいパッケージであり、
DataFrame
の効
率的な実装を提供します。
DataFrame
は本質的に多次元の配列であり、行と列のラベルが付加され、
異なる型のデータや欠落したデータを許容します。
pandas
はラベル付きデータを格納するための
便利なインターフェースを提供するだけでなく、データベースやスプレッドシート・プログラムの
ユーザにとって使い慣れた強力なデータ操作も実装しています。
NumPy
ndarray
データ構造は、数値計算タスクでよく見られる、きれいで整然としたデータ
に対して欠かせない機能を提供します。こうしたデータには非常にうまく機能するものの、世界中
に溢れるさまざまな形式の非構造化データを分析するために必要となる柔軟なデータ操作(データ
へのラベルの貼り付けや欠落したデータの処理など)や、要素ごとのブロードキャストではうまく
対応できない操作(グループ化やピボットなど)を行う際には、
NumPy
の制限が明らかになります。
pandas
、特に
Series
DataFrame
オブジェクトは、
NumPy
配列構造
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池 彰
初めてのGraphQL ―Webサービスを作って学ぶ新世代API

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎 沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873118413Other