book

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池彰

May 2018

Intermediate to advanced

556 pages

13h 21m

Japanese

O'Reilly Japan, Inc.

Read now

Unlock full access

Content preview from Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

章

NumPy

の基礎

この章と

章では、

Python

でメモリ上のデータを効果的にロード、格納、操作するためのテク

ニックを説明します。トピックは非常に広範囲にわたります。データセットは幅広いソースと幅広

いフォーマットを持ちます。例えば、ドキュメント、画像、サウンドクリップ、数値測定結果、そ

の他ほとんどあらゆる形式で存在します。このように違いが明らかであるにも関わらず、基本的に

すべてのデータは数値の配列として扱うのに適しています。

例えば、画像、特にデジタル画像は、領域全体のピクセル輝度を表す単純な

次元配列の数であ

ると考えることができます。サウンドクリップは、時間に対する強度の

次元配列と考えることが

できます。テキストは、さまざまな方法で数値表現に変換できます。おそらく、特定の単語または

単語の組み合わせの頻度を表す

進数値です。どのようなデータであっても、それらを分析可能に

する最初のステップ

は、それらを数値の配列に変換することです。（このプロセスの具体的な例に

ついては、「5.4 特徴量エンジニアリング」を参照してください）。

このため、数値配列の効率的な格納と操作は、データサイエンスのプロセスにとって欠くべから

ざる要素です。ここでは数値配列を扱うために

Python

が持つ特別なツール、

NumPy

パッケージと

（第

章で説明する）

pandas

パッケージを取り上げます。

この章では、

NumPy

について詳しく説明します。

NumPy

（

Numerical Python

の略）は、データを

高密度のデータバッファへ格納し、操作を行うための効率的なインターフェースを提供します。い ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

Pythonデータサイエンスハンドブック第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池彰

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

Andreas C. Muller, Sarah Guido, 中田秀基

PythonによるAIプログラミング入門 ―ディープラーニングを始める前に身につけておくべき15の基礎技術

Prateek Joshi, 相川愛三

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873118413Other