Dodatek A Skok na głęboką wodę
W tym dodatku szczegółowo omawiam kilka zagadnień technicznych, które są ważnym uzupełnieniem książki, ale które nie są obowiązkowe.
Reguła łańcuchowa dla macierzy
Zaczynam od objaśnienia, dlaczego można podstawić WT za w wyrażeniu na regułę łańcuchową z rozdziału 1.
Pamiętaj, że L jest obliczane tak:
σ(XW11) + σ(XW12) + σ(XW21) + σ(XW22) + σ(XW31) + σ(XW32)
Jest to skrótowy zapis tego, że:
σ(XW11) = σ(x11 × w11 + x12 × w21 + x13 × w31)
σ(XW12) = σ(x11 × w12 + x12 × w22 + x13 × w32)
i tak dalej. Przyjrzyjmy się tylko jednemu z tych wyrażeń. Jak wyglądałaby pochodna cząstkowa na przykład dla σ(XW11) względem każdego ...
Get Uczenie głębokie od zera now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.