book

ゼロからのディープラーニング

by Seth Weidman

March 2025

Intermediate to advanced

252 pages

3h 40m

Japanese

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

ニューラルネットワークを理解するには複数のメンタルモデルが必要だ章のアウトライン本書で使用されている慣例コード例を使うオライリー・オンライン・ラーニング問い合わせ先謝辞
関数数学ダイアグラムコードデリバティブ数学ダイアグラムコードネストされた関数ダイアグラム数学コード別のダイアグラムチェーンの規則数学コード少し長い例数学ダイアグラムコード複数入力を持つ関数数学ダイアグラムコード複数の入力を持つ関数の微分ダイアグラム数学コード複数のベクトル入力を持つ関数数学既存の機能から新しい機能を作成する数学ダイアグラムコード複数のベクトル入力を持つ関数の微分ダイアグラム数学コードベクトル関数とその微分：さらに一歩進むダイアグラム数学コードベクトル関数とその微分：バックワードパス2つの2次元行列入力を持つ計算グラフ数学ダイアグラムコード楽しい部分バックワードパスダイアグラム数学コード結論
教師あり学習の概要教師あり学習モデル線形回帰線形回帰：ダイアグラム線形回帰：より役に立つ図（と数学）インターセプトを加える線形回帰：コードモデルをトレーニングする勾配を計算するダイアグラムグラデーションを計算する：数学（といくつかのコード）勾配を計算する：完全な）コードこれらの勾配を使ってモデルをトレーニングするモデルを評価する：トレーニングセットとテストセットの比較我々のモデルを評価するコード最も重要な特徴を分析するゼロからのニューラルネットワークステップ1：線形回帰の束ステップ2：非線形関数ステップ3：別の線形回帰ダイアグラムコードニューラルネットワークバックワードパス最初のニューラルネットワークの訓練と評価なぜこのようなことが起こるのか？結論
ディープラーニングの定義：最初のパスニューラルネットワークの構成要素：演算子ダイアグラムコードニューラルネットワークの構成要素：レイヤーダイアグラムブロックの上のブロックレイヤーの設計図緻密な層NeuralNetworkクラス、そして多分その他ダイアグラムコードロス・クラスゼロからのディープラーニングバッチトレーニングの実装ニューラルネットワークコードトレーナーとオプティマイザーオプティマイザートレーナーすべてをまとめる私たちの最初のディープラーニング・モデル（スクラッチから）結論と次のステップ
ニューラルネットワークについての直感ソフトマックス・クロスエントロピー損失関数コンポーネントその1：ソフトマックス関数コンポーネントその2：クロス・エントロピー損失活性化関数についてのメモ実験データの前処理モデル実験ソフトマックス・クロスエントロピー損失勢い勢いのための直感オプティマイザー・クラスにモメンタムを実装する実験運動量による確率的勾配降下学習率の低下学習率低下の種類実験学習率の減少重みの初期化数学とコード実験重みの初期化ドロップアウト定義実装実験ドロップアウト結論
ニューラルネットワークと表現学習画像データのための異なるアーキテクチャ畳み込み演算子マルチチャンネルの畳み込み演算畳み込みレイヤー実装の意義畳み込み層と完全連結層の違い畳み込みレイヤーで予測を立てる：平坦化レイヤープーリング・レイヤーマルチチャンネル畳み込み演算の実装フォワード・パスコンボリューションズバックワードパスバッチ、2次元畳み込み、マルチチャンネル2次元畳み込み最後の要素：チャンネル "を追加するこの演算子を使ってCNNを訓練する。平らにする演算子フルConv2Dレイヤー実験結論
重要な制限：分岐の処理自動差別化勾配の蓄積をコード化するリカレント・ニューラル・ネットワークの動機リカレント・ニューラル・ネットワーク入門RNNのファーストクラス：RNNLayerRNNのセカンドクラスRNNノードこの2つのクラスを一緒にするバックワードパスRNN：コードRNNLayerクラスRNNノードに不可欠な要素「バニラ」RNNノードバニラ」RNNノードの限界一つの解決策グルノデスLSTMNodes文字レベルRNNベース言語モデルのデータ表現その他の言語モデリングタスクRNNレイヤーのバリエーションを組み合わせるすべてをまとめる結論
PyTorch テンソルPyTorchによる深層学習PyTorch要素：モデル、レイヤー、オプティマイザー、ロスPyTorchを使ってニューラルネットワークの構成要素を実装する：DenseLayerを使う例PyTorchによるボストン住宅価格モデルPyTorch要素：オプティマイザとロスPyTorch要素：トレーナーPyTorchで学習を最適化するトリックPyTorchで畳み込みニューラルネットワークを作るデータローダーとトランスフォームPyTorchのLSTM追記オートエンコーダによる教師なし学習表現学習何のラベルもない状況へのアプローチPyTorchでオートエンコーダを実装する教師なし学習の強力なテストと解決策結論
マトリックス・チェーン規則バイアス項に対する損失の勾配行列の乗算による畳み込み

Content preview from ゼロからのディープラーニング

序文

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている：translation-feedback@oreilly.com

ニューラルネットワークやディープラーニングについて学ぼうとすると、ブログ記事から質の異なるMOOC（CourseraやUdacityで提供されているような大規模公開オンライン講座）、さらには書籍まで、豊富なリソースに出会ってきたことだろう。しかし、もしあなたがこの序文を読み取っているのだとしたら、おそらくあなたが出会ったニューラルネットワークの説明は、どれもどこか欠けているのだろう。私も学び始めたときに同じことを発見した。さまざまな説明は、盲人が象のさまざまな部分を説明しているようなもので、全体を説明しているものはなかった。それが、私がこの本を書くことになった理由である。

ニューラルネットワークに関する既存のリソースは、そのほとんどが2つのカテゴリーに分類される。概念的で数学的なものもあり、ニューラルネットワークの説明で発見されるような、両端に矢印のついた線で結ばれた円を描いたものと、"理論を理解する "ための、何が起こっているのかについての広範な数学的説明の両方が含まれている。その典型的な例が、イアン・グッドフェローらによる非常に優れた書籍『Deep Learning』（MIT Press）である。

他のリソースには、実行すると損失値が時間とともに減少し、ニューラルネットワークが "学習 "しているように見えるコードのブロックが密集している。例えば、PyTorchのドキュメントにある以下の例は、確かにランダムに生成されたデータに対してシンプルなニューラルネットワークを定義し、学習させている：

# N is batch size; D_in is input dimension;
# H is hidden dimension; D_out is output dimension.
N, D_in, H, D_out = 64, 1000, 100, 10

# Create random input and output data
x = torch.randn(N, D_in, device=device, dtype=dtype)
y = torch.randn(N, D_out, device=device, dtype=dtype)

# Randomly initialize weights
w1 = torch.randn(D_in, H, device=device, dtype=dtype)
w2 = torch.randn(H, D_out, device=device, dtype=dtype)

learning_rate = 1e-6
for t in range(500):
    # Forward pass: compute predicted y
    h = x.mm(w1)
    h_relu = h.clamp(min=0)
    y_pred = h_relu.mm(w2)

    # Compute and print loss
    loss = (y_pred - y).pow(2).sum().item()
    print(t, loss)

    # Backprop to compute gradients of w1 and w2 with respect to loss
    grad_y_pred = 2.0 * (y_pred - y)
    grad_w2 = h_relu.t().mm(grad_y_pred)