book

ゼロからのディープラーニング

by Seth Weidman

March 2025

Intermediate to advanced

252 pages

3h 40m

Japanese

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

ニューラルネットワークを理解するには複数のメンタルモデルが必要だ章のアウトライン本書で使用されている慣例コード例を使うオライリー・オンライン・ラーニング問い合わせ先謝辞
関数数学ダイアグラムコードデリバティブ数学ダイアグラムコードネストされた関数ダイアグラム数学コード別のダイアグラムチェーンの規則数学コード少し長い例数学ダイアグラムコード複数入力を持つ関数数学ダイアグラムコード複数の入力を持つ関数の微分ダイアグラム数学コード複数のベクトル入力を持つ関数数学既存の機能から新しい機能を作成する数学ダイアグラムコード複数のベクトル入力を持つ関数の微分ダイアグラム数学コードベクトル関数とその微分：さらに一歩進むダイアグラム数学コードベクトル関数とその微分：バックワードパス2つの2次元行列入力を持つ計算グラフ数学ダイアグラムコード楽しい部分バックワードパスダイアグラム数学コード結論
教師あり学習の概要教師あり学習モデル線形回帰線形回帰：ダイアグラム線形回帰：より役に立つ図（と数学）インターセプトを加える線形回帰：コードモデルをトレーニングする勾配を計算するダイアグラムグラデーションを計算する：数学（といくつかのコード）勾配を計算する：完全な）コードこれらの勾配を使ってモデルをトレーニングするモデルを評価する：トレーニングセットとテストセットの比較我々のモデルを評価するコード最も重要な特徴を分析するゼロからのニューラルネットワークステップ1：線形回帰の束ステップ2：非線形関数ステップ3：別の線形回帰ダイアグラムコードニューラルネットワークバックワードパス最初のニューラルネットワークの訓練と評価なぜこのようなことが起こるのか？結論
ディープラーニングの定義：最初のパスニューラルネットワークの構成要素：演算子ダイアグラムコードニューラルネットワークの構成要素：レイヤーダイアグラムブロックの上のブロックレイヤーの設計図緻密な層NeuralNetworkクラス、そして多分その他ダイアグラムコードロス・クラスゼロからのディープラーニングバッチトレーニングの実装ニューラルネットワークコードトレーナーとオプティマイザーオプティマイザートレーナーすべてをまとめる私たちの最初のディープラーニング・モデル（スクラッチから）結論と次のステップ
ニューラルネットワークについての直感ソフトマックス・クロスエントロピー損失関数コンポーネントその1：ソフトマックス関数コンポーネントその2：クロス・エントロピー損失活性化関数についてのメモ実験データの前処理モデル実験ソフトマックス・クロスエントロピー損失勢い勢いのための直感オプティマイザー・クラスにモメンタムを実装する実験運動量による確率的勾配降下学習率の低下学習率低下の種類実験学習率の減少重みの初期化数学とコード実験重みの初期化ドロップアウト定義実装実験ドロップアウト結論
ニューラルネットワークと表現学習画像データのための異なるアーキテクチャ畳み込み演算子マルチチャンネルの畳み込み演算畳み込みレイヤー実装の意義畳み込み層と完全連結層の違い畳み込みレイヤーで予測を立てる：平坦化レイヤープーリング・レイヤーマルチチャンネル畳み込み演算の実装フォワード・パスコンボリューションズバックワードパスバッチ、2次元畳み込み、マルチチャンネル2次元畳み込み最後の要素：チャンネル "を追加するこの演算子を使ってCNNを訓練する。平らにする演算子フルConv2Dレイヤー実験結論
重要な制限：分岐の処理自動差別化勾配の蓄積をコード化するリカレント・ニューラル・ネットワークの動機リカレント・ニューラル・ネットワーク入門RNNのファーストクラス：RNNLayerRNNのセカンドクラスRNNノードこの2つのクラスを一緒にするバックワードパスRNN：コードRNNLayerクラスRNNノードに不可欠な要素「バニラ」RNNノードバニラ」RNNノードの限界一つの解決策グルノデスLSTMNodes文字レベルRNNベース言語モデルのデータ表現その他の言語モデリングタスクRNNレイヤーのバリエーションを組み合わせるすべてをまとめる結論
PyTorch テンソルPyTorchによる深層学習PyTorch要素：モデル、レイヤー、オプティマイザー、ロスPyTorchを使ってニューラルネットワークの構成要素を実装する：DenseLayerを使う例PyTorchによるボストン住宅価格モデルPyTorch要素：オプティマイザとロスPyTorch要素：トレーナーPyTorchで学習を最適化するトリックPyTorchで畳み込みニューラルネットワークを作るデータローダーとトランスフォームPyTorchのLSTM追記オートエンコーダによる教師なし学習表現学習何のラベルもない状況へのアプローチPyTorchでオートエンコーダを実装する教師なし学習の強力なテストと解決策結論
マトリックス・チェーン規則バイアス項に対する損失の勾配行列の乗算による畳み込み

Content preview from ゼロからのディープラーニング

第6章リカレント・ニューラル・ネットワークリカレント・ニューラル・ネットワーク

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている：translation-feedback@oreilly.com

この章では、データのシーケンスを処理するためのニューラルネットワークアーキテクチャの一種であるリカレントニューラルネットワーク（RNN）を取り上げる。これまで見てきたニューラルネットワークは、受け取ったデータの各バッチを独立した観測データのセットとして扱っていた。第4章で見た完全接続ニューラルネットワークにも、第5章で見た畳み込みニューラルネットワークにも、MNISTの数字が他の数字の前後に到着するという概念はなかった。しかし、多くの種類のデータは、産業や金融の文脈で扱われるような時系列データであれ、文字、単語、文などが順序付けられている言語データであれ、本質的に順序付けられている。リカレント・ニューラル・ネットワークは、そのようなデータのシーケンスを取り込み、出力として正しい予測を返す方法を学習するように設計されている。その正しい予測とは、翌日の金融資産の価格であれ、文中の次の単語であれ、である。

順序データを扱うには、最初の数章で見た完全接続ニューラルネットワークから3種類の変更が必要になる。第一に、ニューラルネットワークに与えるndarrayに「新しい次元を加える」ことである。以前は、ニューラルネットワークに与えるデータは本質的に2次元であった。ndarray はそれぞれ、1つの次元がオブザベーションの数を表し、もう1つの次元が特徴の数を表していた；¹別の考え方をすれば、各観測は1次元のベクトルだったということだ。リカレントニューラルネットワークでは、各入力は依然としてオブザベーションの数を表す次元を持つが、各オブザベーションは2次元ndarray ：1つの次元はデータのシーケンスの長さを表し、2番目の次元は各シーケンス要素に存在する特徴の数を表す。したがって、RNNへの全体的な入力は、[batch_size, sequence_length, num_features]形状の3次元ndarray - シーケンスのバッチとなる。

第二に、もちろん、この新しい3次元入力を扱うためには、新しい種類のニューラルネットワークアーキテクチャを使わなければならない。しかし、3つ目の変化は、この章で議論を始めるところから始まる。この新しい形のデータを扱うためには、抽象化された全く異なるフレームワークを使わなければならない。なぜか？完全連結ニューラルネットワークと畳み込みニューラルネットワークの場合、それぞれの「演算子」は、たとえそれが実際には（行列の乗算や畳み込みの場合のように）多くの個々の加算や乗算を表していたとしても、フォワードパスとバックワードパスの両方で、入力として1つのndarray 、出力として1つのndarray （場合によっては、これらの演算の一部として演算子のパラメータを表す別のndarray ）を生成する、1つの「ミニファクトリー」と表現することができる。結局のところ、リカレント・ニューラル・ネットワークはこの方法では実装できない。その理由を発見するためにさらに読み進める前に、少し時間をとって考えてみよう。ニューラルネットワークアーキテクチャのどのような特徴が、これまで構築してきたフレームワークを崩壊させるのだろうか？答えは明快であるが、完全な解決策には実装の詳細に踏み込んだ概念が含まれ、本書の範囲を超えている。²これを解き明かすために、これまで使ってきたフレームワークの重要な限界を明らかにしよう。 ...