book

Apprentissage profond à partir de zéro

Name: Apprentissage profond à partir de zéro
Author: Seth Weidman
ISBN: 9798341611115

by Seth Weidman

November 2024

Intermediate to advanced

252 pages

7h 2m

French

O'Reilly Media, Inc.

Read now

Unlock full access

Préface
Comprendre les réseaux neuronaux nécessite plusieurs modèles mentaux.Plans des chapitresConventions utilisées dans ce livreUtiliser des exemples de codeApprentissage en ligne O'ReillyComment nous contacterRemerciements
1. Les fondements
FonctionsMathématiquesDiagrammesCodeProduits dérivésMathématiquesDiagrammesCodeFonctions imbriquéesDiagrammeMathématiquesCodeUn autre diagrammeLa règle de la chaîneMathématiquesCodeUn exemple un peu plus longMathématiquesDiagrammeCodeFonctions avec entrées multiplesMathématiquesDiagrammeCodeDérivées des fonctions à entrées multiplesDiagrammeMathématiquesCodeFonctions avec entrées vectorielles multiplesMathématiquesCréer de nouvelles fonctionnalités à partir de fonctionnalités existantesMathématiquesDiagrammeCodeDérivées de fonctions à entrées vectorielles multiplesDiagrammeMathématiquesCodeLes fonctions vectorielles et leurs dérivés : Un pas de plusDiagrammeMathématiquesCodeLes fonctions vectorielles et leurs dérivés : Le passage à l'enversGraphique de calcul avec deux entrées matricielles 2DMathématiquesDiagrammeCodeLa partie amusante : La passe arrièreDiagrammeMathématiquesCodeConclusion
2. Principes de base
Aperçu de l'apprentissage superviséModèles d'apprentissage superviséRégression linéaireRégression linéaire : Un diagrammeRégression linéaire : Un diagramme plus utile (et les mathématiques)Ajouter l'interceptionRégression linéaire : Le codeFormer le modèleCalculer les gradients : Un diagrammeCalculer les dégradés : Les mathématiques (et un peu de code)Calculer les gradients : Le code (complet)Utiliser ces gradients pour entraîner le modèleÉvaluer notre modèle : Ensemble de formation versus ensemble de testÉvaluer notre modèle : Le codeAnalyse la caractéristique la plus importanteLes réseaux neuronaux à partir de zéroÉtape 1 : Une série de régressions linéairesÉtape 2 : Une fonction non linéaireÉtape 3 : Une autre régression linéaireDiagrammesCodeRéseaux neuronaux : Le passage à reboursEntraîne et évalue notre premier réseau neuronal.Deux raisons pour lesquelles cela se produitConclusion
3. Deep Learning à partir de zéro
Définition du Deep Learning : Un premier passageLes éléments constitutifs des réseaux neuronaux : OpérationsDiagrammeCodeLes éléments constitutifs des réseaux neuronaux : Les couchesDiagrammesBlocs de construction sur Blocs de constructionLe plan des couchesLa couche denseLa classe NeuralNetwork, et peut-être d'autresDiagrammeCodeClasse de perteDeep Learning à partir de zéroMise en œuvre de la formation par lotsNeuralNetwork : CodeFormateur et optimiseurOptimiseurEntraîneurTout assemblerNotre premier modèle de Deep Learning (à partir de rien)Conclusion et prochaines étapes
4. Extensions
Quelques intuitions à propos des réseaux neuronaux.La fonction de perte de l'entropie croisée SoftmaxComposant #1 : La fonction SoftmaxComposant #2 : La perte d'entropie croiséeNote sur les fonctions d'activationExpériencesPrétraitement des donnéesModèleExpérience : Perte d'entropie croisée SoftmaxL'élanL'intuition au service de l'élanMise en œuvre du momentum dans la classe OptimizerExpérience : Descente stochastique de gradient avec momentumDécroissance du taux d'apprentissageTypes de décroissance du taux d'apprentissageExpériences : Décroissance du taux d'apprentissageInitialisation du poidsMathématiques et codeExpériences : Initialisation du poidsAbandonDéfinitionMise en œuvreExpériences : AbandonConclusion
5. Réseaux neuronaux convolutionnels
Réseaux neuronaux et apprentissage par représentation.Une architecture différente pour les données d'imageL'opération de convolutionL'opération de convolution multicanalCouches convolutivesImplications de la mise en œuvreLes différences entre les couches convolutives et les couches entièrement connectéesFaire des prédictions avec les couches convolutionnelles : La couche d'aplatissementMise en commun des couchesMise en œuvre de l'opération de convolution multicanalLa passe avantConvolutions : Le passage à l'enversLots, convolutions 2D et canaux multiplesConvolutions 2DLe dernier élément : Ajouter des "canaux"Utiliser cette opération pour former un CNNL'opération d'aplatissementLa couche Conv2D complèteExpériencesConclusion
6. Réseaux neuronaux récurrents
La limitation de la clé : Gérer les ramificationsDifférenciation automatiqueCoder l'accumulation de gradientsMotivation pour les réseaux neuronaux récurrentsIntroduction aux réseaux neuronaux récurrentsLa première classe pour les RNN : Couche RNNLa deuxième classe pour les RNN : RNNNodeAssembler ces deux classesLe passage à l'enversRNNs : Le codeLa classe RNNLayerLes éléments essentiels des nœuds RNN"Nœuds RNN "VanilleLimites des nœuds RNN "VanillaUne solution : GRUNodesLSTMNodesReprésentation des données pour un modèle de langage basé sur un RNN au niveau des caractèresAutres tâches de modélisation du langageCombiner les variantes des couches RNNTout mettre bout à boutConclusion
7. PyTorch
Tenseurs PyTorchDeep Learning avec PyTorchÉléments de PyTorch : Modèle, couche, optimiseur et perteMise en œuvre des éléments constitutifs d'un réseau neuronal à l'aide de PyTorch : Couche denseExemple : Modèle des prix des logements à Boston dans PyTorch.PyTorch Elements : Optimiseur et pertePyTorch Elements : FormateurAstuces pour optimiser l'apprentissage dans PyTorchRéseaux neuronaux convolutifs dans PyTorchDataLoader et TransformationsLes LSTM dans PyTorchPost-scriptum : Apprentissage non supervisé via les autoencodeursApprentissage de la représentationUne approche pour les situations sans aucune étiquetteMise en œuvre d'un autoencodeur dans PyTorchUn test plus solide pour l'apprentissage non supervisé et une solutionConclusion
A. Plongées profondes
Règle de la chaîne matricielleGradient de la perte par rapport aux termes de biaisConvolutions via la multiplication des matrices
Index

Content preview from Apprentissage profond à partir de zéro

Chapitre 5. Réseaux neuronaux convolutionnels

Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com

À l'adresse ce chapitre, nous aborderons les réseaux neuronaux à convolution (CNN). Les CNN constituent l'architecture de réseau neuronal standard utilisée pour la prédiction lorsque les observations en entrée sont des images, ce qui est le cas dans un large éventail d'applications de réseaux neuronaux. Jusqu'à présent dans le livre, nous nous sommes exclusivement concentrés sur les réseaux neuronaux entièrement connectés, que nous avons implémentés sous la forme d'une série de couches Dense. Ainsi, nous commencerons ce chapitre en passant en revue certains éléments clés de ces réseaux et nous nous en servirons pour motiver les raisons pour lesquelles nous pourrions vouloir utiliser une architecture différente pour les images. Nous aborderons ensuite les CNN de la même manière que nous avons introduit d'autres concepts dans ce livre : nous discuterons d'abord de leur fonctionnement à un niveau élevé, puis à un niveau inférieur, et enfin nous montrerons en détail comment ils fonctionnent en codant l'opération de convolution à partir de zéro.¹ À la fin de ce chapitre, tu auras une compréhension suffisamment approfondie du fonctionnement des CNN pour pouvoir les utiliser à la fois pour résoudre des problèmes et pour apprendre par toi-même les variantes avancées des CNN, telles que les ResNets, les DenseNets ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Apprentissage automatique pratique avec Scikit-Learn et PyTorch

Publisher Resources

ISBN: 9798341611115

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Apprentissage profond à partir de zéro

by Seth Weidman

Chapitre 5. Réseaux neuronaux convolutionnels

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.