Rozdział 11. Uczenie głębokich sieci neuronowych
W rozdziale 10. poznaliśmy naszą pierwszą sztuczną sieć neuronową i wytrenowaliśmy sieć GSN. Nie była ona jednak zbyt głęboka, gdyż zawierała jedynie dwie warstwy ukryte. A gdybyśmy na przykład musieli zajmować się bardzo złożonym problemem, np. wykrywaniem setek typów obiektów na zdjęciach o wysokiej rozdzielczości? Wymagałoby to wyuczenia znacznie głębszej sieci neuronowej, być może składającej się z (powiedzmy) 10 warstw, z których każda zawierałaby setki neuronów i setki tysięcy połączeń. To nie byłaby bułka z masłem:
- Po pierwsze, musimy poradzić sobie z niełatwym problemem zanikających gradientów (lub ściśle powiązanym z nim problemem eksplodujących gradientów), który dotyczy głębokich sieci ...
Get Uczenie maszynowe z użyciem Scikit-Learn i TensorFlow now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.