Rozdział 11. Uczenie głębokich sieci neuronowych

W rozdziale 10. poznaliśmy naszą pierwszą sztuczną sieć neuronową i wytrenowaliśmy sieć GSN. Nie była ona jednak zbyt głęboka, gdyż zawierała jedynie dwie warstwy ukryte. A gdybyśmy na przykład musieli zajmować się bardzo złożonym problemem, np. wykrywaniem setek typów obiektów na zdjęciach o wysokiej rozdzielczości? Wymagałoby to wyuczenia znacznie głębszej sieci neuronowej, być może składającej się z (powiedzmy) 10 warstw, z których każda zawierałaby setki neuronów i setki tysięcy połączeń. To nie byłaby bułka z masłem:

Po pierwsze, musimy poradzić sobie z niełatwym problemem zanikających gradientów (lub ściśle powiązanym z nim problemem eksplodujących gradientów), który dotyczy głębokich sieci ...

Get Uczenie maszynowe z użyciem Scikit-Learn i TensorFlow now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.

Start your free trial

Uczenie maszynowe z użyciem Scikit-Learn i TensorFlow by Aurélien Géron

Rozdział 11. Uczenie głębokich sieci neuronowych

Don’t leave empty-handed

It’s yours, free.

Check it out now on O’Reilly