Kubeflow pour l'apprentissage automatique
by Trevor Grant, Holden Karau, Boris Lublinsky, Richard Liu, Ilan Filonenko
Chapitre 6. Magasin d'artefacts et de métadonnées
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
L'apprentissage automatique implique généralement de traiter une grande quantité de données brutes et intermédiaires (transformées) dont le but ultime est de créer et de déployer le modèle. Pour comprendre notre modèle, il est nécessaire de pouvoir explorer les ensembles de données utilisés pour sa création et ses transformations (lignage des données). La collection de ces ensembles de données et la transformation qui leur est appliquée sont appelées les métadonnées de notre modèle.1
Les métadonnées des modèles sont essentielles à la reproductibilité de l'apprentissage automatique ;2 La reproductibilité est essentielle pour des déploiements de production fiables. La capture des métadonnées nous permet de comprendre les variations lors de la réexécution des tâches ou des expériences. La compréhension des variations est nécessaire pour développer et améliorer nos modèles de manière itérative. Elle fournit également une base solide pour les comparaisons de modèles. Comme Pete Warden l'a défini dans ce billet:
Pour reproduire les résultats, le code, les données de formation et la plateforme globale doivent être enregistrés avec précision.
Les mêmes informations sont également requises pour d'autres opérations courantes de ML - comparaison de modèles, création de modèles reproductibles, etc.
Il existe de ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access