August 2018
Intermediate to advanced
336 pages
5h 9m
Japanese
前章では、各層のノードが隣接する層のノードに全結合(fully connected)であるネットワーク(dense net)について解説しました。そして、このネットワークを用い手書き数字のデータセット(MNIST)を分類しました。全結合のネットワークでは、各ノードが入力画像の各ピクセルに接続されています(28×28ピクセルの画像のため、784個になります)。しかし、この手法では画像内の空間的な特徴、つまり隣り合うピクセル同士の関連をうまく捉えることができません。学習データを収める変数の定義を見ると、28×28ピクセルの画像をサイズが784のフラットなベクトルに変換してしまっています。この実装から、どのピクセルが隣り合っていたのかという、画像の「空間的な特徴」が失われてしまっていることがよくわかると思います。
# X_train is 60000 rows of 28x28 values --> reshaped in 60000 x 784X_train=X_train.reshape(60000,784)X_test=X_test.reshape(10000,784)
畳み込みニューラルネットワーク(convolutional neural network:CNN。ConvNetとも呼ばれます)は空間的な特徴を捉えることができる、画像の分類に適したネットワークです。CNNは、人間の視覚野に対する実験結果をヒントに構築されました。それは複数の皮質がレベルの異なる構造を捉えることで画像の認識を行うというもので、具体的には最初はピクセル単位、そこから線や角といった単純な構造、次にオブジェクト、さらに顔、体というように、単位要素からより複雑な構造までを段階的に捉えるというものです。 ...
Read now
Unlock full access