Chapitre 4. Évaluer les systèmes d'IA
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Un modèle n'est utile que s'il fonctionne aux fins prévues. Tu dois évaluer les modèles dans le contexte de ton application. Le chapitre 3 présente différentes approches de l'évaluation automatique. Ce chapitre explique comment utiliser ces approches pour évaluer les modèles pour tes applications.
Ce chapitre comporte trois parties. Il commence par une discussion sur les critères que tu pourrais utiliser pour évaluer tes applications et sur la façon dont ces critères sont définis et calculés. Par exemple, de nombreuses personnes s'inquiètent que l'IA invente des faits - comment la cohérence des faits est-elle détectée ? Comment sont mesurées les capacités spécifiques à un domaine comme les mathématiques, les sciences, le raisonnement et la synthèse ?
La deuxième partie se concentre sur la sélection des modèles. Étant donné le nombre croissant de modèles de base parmi lesquels choisir, il peut être difficile de choisir le bon modèle pour ton application. Des milliers de points de référence ont été introduits pour évaluer ces modèles selon différents critères. Peut-on se fier à ces critères ? Comment choisir les critères à utiliser ? Qu'en est-il des classements publics qui regroupent plusieurs critères ?
Le paysage des modèles regorge de modèles propriétaires et de modèles open source. Une question que de nombreuses ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access