5章NumPy配列の基礎

Pythonのデータ操作とは、すなわちNumPy配列の操作であると言って差し支えありません。(Ⅲ部で紹介する)pandasなどの新しいツールは、NumPyの上に構築されています。ここでは、NumPy配列を操作して、データやその部分配列にアクセスし、配列の分割、形状の変更、結合などの例をいくつか紹介します。ここで示した操作は、お決まりで退屈に思えるかもしれませんが、本書で使用される多くの例の基礎であり、十分に理解しておく必要があります。

ここでは基本的な配列操作を、いくつかのカテゴリに分けて説明します。

配列の属性
配列のサイズ、形状、メモリ消費量、およびデータ型の特定
配列のインデクス操作
配列要素それぞれの値の取得と設定
配列のスライス
大きな配列内から小さな部分配列の取り出しと設定
配列の形状変更
配列の形状を変更する
配列の分割と結合
複数の配列を1つにまとめ、1つの配列を多数に分割する

5.1 NumPy配列の属性

有用性の観点から、最初に配列属性について説明します。まず、NumPyの乱数生成器を使用して1次元、2次元、3次元のランダム配列を定義します。このコードを実行するたびに同じランダム配列が生成されるように、乱数生成器にシードを設定します。

In [1]: import numpy as np rng = np.random.default_rng(seed=1701) # 同じ乱数を得るために、 # 乱数シードを設定する x1 = rng.integers(10, size=6) # 1次元配列 x2 = rng.integers(10, size=(3, 4)) # 2次元配列 x3 = rng.integers(10, size=(3, ...

Get Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.