Rozdział 11. Uczenie głębokich sieci neuronowych

W rozdziale 10. poznaliśmy naszą pierwszą sztuczną sieć neuronową i wytrenowaliśmy sieć GSN. Nie była ona jednak zbyt głęboka, gdyż zawierała jedynie dwie warstwy ukryte. A gdybyśmy na przykład musieli zajmować się bardzo złożonym problemem, np. wykrywaniem setek typów obiektów na zdjęciach o wysokiej rozdzielczości? Wymagałoby to wyuczenia znacznie głębszej sieci neuronowej, być może składającej się z (powiedzmy) 10 warstw, z których każda zawierałaby setki neuronów i setki tysięcy połączeń. To nie byłaby bułka z masłem:

  • Po pierwsze, musimy poradzić sobie z niełatwym problemem zanikających gradientów (lub ściśle powiązanym z nim problemem eksplodujących gradientów), który dotyczy głębokich sieci ...

Get Uczenie maszynowe z użyciem Scikit-Learn i TensorFlow now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.