CHAPITRE 8 Apprentissage par renforcement

Les techniques d’apprentissage que nous avons étudiées jusqu’ici dans ce livre se répartissent en deux catégories : apprentissage supervisé ou apprentissage non supervisé. Dans les deux cas, la résolution d’un problème nécessite qu’un informaticien conçoive une architecture profonde qui gère et traite les données d’entrée, et connecte la sortie de l’architecture à une fonction de perte adaptée au problème en question. Ce cadre est largement applicable, mais toutes les applications ne s’inscrivent pas parfaitement dans ce style de pensée. Considérons le défi que constituerait l’entraînement d’un modèle d’apprentissage automatique ayant pour but de gagner une partie d’échecs. Il semble raisonnable de traiter ...

Get TensorFlow pour le Deep learning now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.