Systèmes de production à apprentissage automatique
by Robert Crowe, Hannes Hapke, Emily Caveness, Di Zhu
Chapitre 4. Voyage et stockage des données
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Ce chapitre traite de l'évolution des données tout au long du cycle de vie d'un pipeline de production. Nous examinerons également les outils disponibles pour aider à gérer ce processus.
Comme nous l'avons évoqué dans les chapitres précédents, les données constituent un élément essentiel du cycle de vie de la ML. Comme les données et les modèles ML changent tout au long du cycle de vie ML, il est important de pouvoir identifier, tracer et reproduire les problèmes de données et les changements de modèles. Comme l'explique ce chapitre, les métadonnées ML (MLMD), les métadonnées TensorFlow (TFMD) et la validation des données TensorFlow (TFDV) sont des outils importants pour t'aider à le faire. MLMD est une bibliothèque permettant d'enregistrer et de récupérer les métadonnées associées aux flux de travail ML, ce qui peut t'aider à analyser et à déboguer les différentes parties d'un système ML qui interagissent. TFMD fournit des représentations standard des principaux éléments de métadonnées utilisés lors de l'entraînement des modèles de ML, y compris un schéma qui décrit tes attentes concernant les caractéristiques des données d'entrée du pipeline. Par exemple, tu peux spécifier le type attendu, la valence et la plage de valeurs autorisées dans le format de schéma de TFMD. Tu peux ensuite utiliser un schéma défini ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access