March 2025
Intermediate to advanced
252 pages
3h 40m
Japanese
このセクションでは、完成のために理解することは重要だが、必須ではないいくつかの技術的な領域について深く掘り下げていく。
まず、 、WTを次のように置き換えることができる理由を説明する。 を第1章の連鎖規則式に当てはめる。
Lは文字通りであることを忘れてはならない:
という事実の省略形である:
といった具合だ。これらの式の一つだけを拡大してみよう。偏微分をとるとどうなるか、 の各要素に関してである。 (の6つの成分すべてに対して行いたいことである)。 )?
まあ、それ以来だ:
に対する偏微分であることを理解するのはそれほど難しくない。 に関する偏微分であることは、連鎖律の非常に単純な適用によって容易に理解できる:
XW 11式でx 11が掛けられるのはw 11だけなので、それ以外に関する偏導関数は0である。
そこで、Xのすべての要素に関してσ(XW11)の偏導関数を計算すると、次のような全体的な式が得られる。 :
同様に、例えば、Xの各要素に関するσ(XW32)の偏微分を計算することができる:
これで、実際に計算するためのすべての構成要素が揃った。 を直接計算する。先の行列と同じ形の行列を6つ計算し、結果を足し合わせればよい。
高度なものではないが、再び計算が面倒になることに注意してほしい。以下の計算をスキップして、最終的に単純な式である結論に直行しても構わない。しかし、計算をすることで、結論が驚くほど単純であることをより理解できるだろう。そして、物事に感謝すること以外に、人生とは何のためにあるのだろうか?
ここには2つのステップがある。まず、次のように明示的に書き出す。 は今述べた6つの行列の和である: ...