5章NumPy配列の基礎
Pythonのデータ操作とは、すなわちNumPy配列の操作であると言って差し支えありません。(Ⅲ部で紹介する)pandasなどの新しいツールは、NumPyの上に構築されています。ここでは、NumPy配列を操作して、データやその部分配列にアクセスし、配列の分割、形状の変更、結合などの例をいくつか紹介します。ここで示した操作は、お決まりで退屈に思えるかもしれませんが、本書で使用される多くの例の基礎であり、十分に理解しておく必要があります。
ここでは基本的な配列操作を、いくつかのカテゴリに分けて説明します。
- 配列の属性
- 配列のサイズ、形状、メモリ消費量、およびデータ型の特定
- 配列のインデクス操作
- 配列要素それぞれの値の取得と設定
- 配列のスライス
- 大きな配列内から小さな部分配列の取り出しと設定
- 配列の形状変更
- 配列の形状を変更する
- 配列の分割と結合
- 複数の配列を1つにまとめ、1つの配列を多数に分割する
5.1 NumPy配列の属性
有用性の観点から、最初に配列属性について説明します。まず、NumPyの乱数生成器を使用して1次元、2次元、3次元のランダム配列を定義します。このコードを実行するたびに同じランダム配列が生成されるように、乱数生成器にシードを設定します。
In [1]: import numpy as np rng = np.random.default_rng(seed=1701) # 同じ乱数を得るために、 # 乱数シードを設定する x1 = rng.integers(10, size=6) # 1次元配列 x2 = rng.integers(10, size=(3, 4)) # 2次元配列 x3 = rng.integers(10, size=(3, ...
Get Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.