Skip to Content
L'IA générative sur AWS
book

L'IA générative sur AWS

by Chris Fregly, Antje Barth, Shelbee Eigenbrode
November 2024
Intermediate to advanced
312 pages
8h 54m
French
O'Reilly Media, Inc.
Book available
Content preview from L'IA générative sur AWS

Chapitre 8. Optimisation du déploiement des modèles

Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com

Après avoir adapté ton modèle à ta tâche cible, tu voudras finalement déployer ton modèle afin de pouvoir commencer à interagir avec lui et éventuellement l'intégrer dans une application conçue pour le consommer.

Avant de déployer ton modèle génératif, tu dois comprendre les ressources dont il peut avoir besoin ainsi que l'expérience prévue pour interagir avec lui. Pour déterminer les ressources dont ton modèle aura besoin, tu devras identifier des exigences telles que la vitesse à laquelle ton modèle doit générer des compléments, le budget de calcul dont tu disposes et les compromis que tu es prêt à faire en ce qui concerne les performances du modèle pour pouvoir atteindre une vitesse d'inférence plus rapide et réduire potentiellement les coûts de stockage.

Dans ce chapitre, tu vas explorer différentes techniques pour effectuer des optimisations post-entraînement sur ton modèle, notamment l'élagage, la quantification et la distillation. D'autres considérations et réglages potentiels de tes configurations de déploiement devront également être effectués après le déploiement, comme la sélection des ressources informatiques optimales pour équilibrer les coûts et les performances.

Optimisation des modèles pour l'inférence

La taille des modèles d'IA générative présente souvent un défi pour le déploiement ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Deploying Next Generation Multicast-enabled Applications

Deploying Next Generation Multicast-enabled Applications

Vinod Joseph, Srinivas Mulugu
Science des données sur AWS

Science des données sur AWS

Chris Fregly, Antje Barth
L'IA explicable pour les praticiens

L'IA explicable pour les praticiens

Michael Munn, David Pitman

Publisher Resources

ISBN: 9798341615045Supplemental Content