Chapitre 1. Introduction aux grands modèles linguistiques
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
L'humanité se trouve à un point d'inflexion. À partir de Network+ 2012, les développements dans la construction de systèmes d'IA (utilisant des réseaux neuronaux profonds) se sont accélérés de sorte qu'à la fin de la décennie, ils ont donné le premier système logiciel capable de rédiger des articles indiscernables de ceux écrits par des humains. Ce système était un modèle d'IA appelé Generative Pre-trained Transformer 2, ou GPT-2. L'année 2022 a marqué la sortie de ChatGPT, qui a démontré à quel point cette technologie était prête à révolutionner la façon dont nous interagissons avec la technologie et l'information. Atteignant un million d'utilisateurs actifs en cinq jours, puis cent millions d'utilisateurs actifs en deux mois, la nouvelle race de modèles d'IA a commencé par des chatbots de type humain, mais s'est rapidement transformée en un changement monumental dans notre approche des tâches courantes, comme la traduction, la génération de texte, le résumé, et bien plus encore. Il est devenu un outil inestimable pour les programmeurs, les éducateurs et les chercheurs.
Le succès de ChatGPT était sans précédent et a popularisé davantage de recherches sur la technologie qui le sous-tendait, à savoir les grands modèles de langage (LLMs). Des modèles propriétaires et publics ont été publiés à ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access