Chapitre 4. Les extensions
Dans le dernier chapitre, après avoir passé deux chapitres à raisonner à partir des premiers principes sur ce que sont les modèles d'apprentissage profond et comment ils devraient fonctionner, nous avons finalement construit notre premier modèle d'apprentissage profond et l'avons entraîné à résoudre le problème relativement simple de la prédiction des prix des maisons à partir de caractéristiques numériques sur les maisons. Sur la plupart des problèmes du monde réel, cependant, réussir à former des modèles d'apprentissage profond n'est pas si facile : alors que ces modèles peuvent concevablement trouver une solution optimale à tout problème qui peut être formulé comme un problème d'apprentissage supervisé, en pratique ils échouent souvent, et en effet il y a peu de garanties théoriques qu'une architecture de modèle donnée trouvera en fait une bonne solution à un problème donné. Il existe néanmoins des techniques bien comprises qui augmentent les chances de réussite de la formation des réseaux neuronaux ; elles feront l'objet de ce chapitre.
Nous allons commencer par passer en revue ce que les réseaux neuronaux "essaient de faire" mathématiquement : trouver le minimum d'une fonction. Ensuite, je montrerai une série de techniques qui peuvent aider les réseaux à y parvenir, en démontrant leur efficacité sur l'ensemble de données ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access