Systèmes de production à apprentissage automatique
by Robert Crowe, Hannes Hapke, Emily Caveness, Di Zhu
Chapitre 6. Techniques de gestion des ressources modèles
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Les systèmes de calcul, de stockage et d'E/S dont ton modèle a besoin détermineront le coût de la mise en production et de la maintenance de ton modèle pendant toute sa durée de vie. Dans ce chapitre, nous allons examiner quelques techniques importantes qui peuvent nous aider à gérer les besoins en ressources du modèle. Nous nous concentrerons sur trois domaines clés qui sont les principaux moyens d'optimiser les modèles à la fois dans la ML traditionnelle et dans l'IA générative (GenAI) :
-
Réduction de la dimensionnalité
-
Quantification des paramètres de modèles et élagage des graphes de modèles
-
Distillation des connaissances pour capturer les connaissances contenues dans les grands modèles
Réduction de la dimensionnalité : Effet de la dimensionnalité sur la performance
Nous commencerons par discuter de la dimensionnalité et de la façon dont elle affecte les performances et les besoins en ressources de notre modèle.
Dans un passé pas si lointain, la génération de données et, dans une certaine mesure, le stockage des données étaient beaucoup plus coûteux qu'ils ne le sont aujourd'hui. À l'époque, de nombreux experts du domaine réfléchissaient soigneusement aux caractéristiques ou aux variables à mesurer avant de concevoir leurs expériences et leurs transformations de caractéristiques. ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access