Skip to Content
ゼロからのディープラーニング
book

ゼロからのディープラーニング

by Seth Weidman
March 2025
Intermediate to advanced
252 pages
3h 40m
Japanese
O'Reilly Media, Inc.
Book available
Content preview from ゼロからのディープラーニング

付録A. ディープ・ダイブ

このセクションでは、完成のために理解することは重要だが、必須ではないいくつかの技術的な領域について深く掘り下げていく。

マトリックス・チェーン規則

まず、 、WTを次のように置き換えることができる理由を説明する。 ν u ( X ) 第1章の連鎖規則式に当てはめる。

Lは文字通りであることを忘れてはならない:

σ ( X W 11 ) + σ ( X W 12 ) + σ ( X W 21 ) + σ ( X W 22 ) + σ ( X W 31 ) + σ ( X W 32 )

という事実の省略形である:

σ ( X W 11 ) = σ ( x 11 × w 11 + x 12 × w 21 + x 13 × w 31 )
σ ( X W 12 ) = σ ( x 11 × w 12 + x 12 × w 22 + x 13 × w 32 )

といった具合だ。これらの式の一つだけを拡大してみよう。偏微分をとるとどうなるか、 σ ( X W 11 ) の各要素に関してである。 X (の6つの成分すべてに対して行いたいことである)。 L )?

まあ、それ以来だ:

σ ( X W 11 ) = σ ( x 11 × w 11 + x 12 × w 21 + x 13 × w 31 )

に対する偏微分であることを理解するのはそれほど難しくない。 x 1 に関する偏微分であることは、連鎖律の非常に単純な適用によって容易に理解できる:

σ u ( X W 11 ) × w 11

XW 11式でx 11が掛けられるのはw 11だけなので、それ以外に関する偏導関数は0である。

そこで、Xのすべての要素に関してσ(XW11)の偏導関数を計算すると、次のような全体的な式が得られる。 σ(XW 11 ) X :

σ(XW 11 ) X = σ u ( X W 11 ) × w 11 σ u ( X W 11 ) × w 21 σ u ( X W 11 ) × w 31 0 0 0 0 0 0

同様に、例えば、Xの各要素に関するσ(XW32)の偏微分を計算することができる:

0 0 0 0 0 0 σ u ( X W 32 ) × w 12 σ u ( X W 32 ) × w 22 σ u ( X W 32 ) × w 32

これで、実際に計算するためのすべての構成要素が揃った。 Λ X ( S ) を直接計算する。先の行列と同じ形の行列を6つ計算し、結果を足し合わせればよい。

高度なものではないが、再び計算が面倒になることに注意してほしい。以下の計算をスキップして、最終的に単純な式である結論に直行しても構わない。しかし、計算をすることで、結論が驚くほど単純であることをより理解できるだろう。そして、物事に感謝すること以外に、人生とは何のためにあるのだろうか?

ここには2つのステップがある。まず、次のように明示的に書き出す。 Λ X ( S ) は今述べた6つの行列の和である: ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

経理における人工知能

経理における人工知能

Yves Hilpisch
ファストAPI

ファストAPI

Bill Lubanovic
データサイエンス講義

データサイエンス講義

Rachel Schutt, Cathy O'Neil, 瀬戸山 雅人, 石井 弓美子, 河内 崇, 河内 真理子, 古畠 敦, 木下 哲也, 竹田 正和, 佐藤 正士, 望月 啓充

Publisher Resources

ISBN: 9798341625617Supplemental Content