
238
Chapitre 6. Vision par ordinateur et réseaux de neurones convolutifs
inférieur à 3,6%. La variante gagnante se fondait sur un CNN extrêmement profond
constitué de 152 couches (d’autres variantes en possédaient 34, 50 et 101). Elle a
conrmé la tendance générale
: les modèles sont de plus en plus profonds, avec de
moins en moins de paramètres. Pour entraîner un réseau aussi profond, l’astuce a été
d’utiliser des connexions de saut (également appelées connexions de raccourci, ou skip
connections en anglais)
: le signal fourni à une couche est également ajouté à la sortie
d’une couche qui se trouve un peu plus haut dans la pile. Voyons pourquoi ...