book

Kubeflow pour l'apprentissage automatique

Name: Kubeflow pour l'apprentissage automatique
ISBN: 9798341615496

by Trevor Grant, Holden Karau, Boris Lublinsky, Richard Liu, Ilan Filonenko

November 2024

Intermediate to advanced

264 pages

7h 25m

French

O'Reilly Media, Inc.

Read now

Unlock full access

Avant-propos
Préface
Nos suppositions à ton sujetTa responsabilité en tant que praticienConventions utilisées dans ce livreExemples de codesUtiliser des exemples de codeApprentissage en ligne O'ReillyComment contacter les auteursComment nous contacterRemerciementsGriefs
1. Kubeflow : Ce que c'est et à qui ça s'adresse
Cycle de vie du développement du modèleQuelle est la place de Kubeflow ?Pourquoi conteneuriser ?Pourquoi Kubernetes ?La conception de Kubeflow et ses composants de base.Exploration des données avec les blocs-notesPréparation des données et des caractéristiquesFormationRéglage des hyperparamètresValidation du modèleInférence/prédictionPipelinesAperçu des composantsAlternatives à KubeflowClipper (RiseLabs)MLflow (Databricks)AutresPrésentation de nos études de casModifié National Institute of Standards and Technology (Institut national des normes et de la technologie)Données de la liste de diffusionRecommander un produitTomodensitométrieConclusion
2. Bonjour Kubeflow
Se mettre en place avec KubeflowInstallation de Kubeflow et de ses dépendancesConfiguration de Kubernetes localConfiguration de ton environnement de développement Kubeflow.Création de notre premier projet KubeflowFormation et déploiement d'un modèleFormation et suivi des progrèsRequête de testAller au-delà d'un déploiement localConclusion
3. Kubeflow Design : Au-delà de l'essentiel
Se déplacer dans le tableau de bord centralCarnets de notes (JupyterHub)Formation des opérateursPipelines KubeflowRéglage des hyperparamètresInférence de modèleMétadonnéesRésumé des composantsComposants de soutienMinIOIstioKnativeApache SparkIsolation des utilisateurs multiples de KubeflowConclusion
4. Pipelines Kubeflow
Commencer avec les pipelinesExploration des pipelines d'échantillons préemballésConstruire un pipeline simple en PythonStockage des données entre les étapesIntroduction aux composants des pipelines Kubeflow.Argo : la fondation des pipelinesCe que Kubeflow Pipelines ajoute au flux de travail d'ArgoConstruire un pipeline à partir d'images existantesComposants du pipeline KubeflowSujets avancés sur les pipelinesExécution conditionnelle des étapes du pipelineExécuter les pipelines dans les délais impartisConclusion
5. Préparation des données et des caractéristiques
Choisir l'outillage adéquatPréparation des données locales et des caractéristiquesRécupérer les donnéesNettoyage des données : Filtrer les déchetsFormatage des donnéesPréparation de l'articleConteneurs sur mesureOutillage distribuéTensorFlow étenduLes données distribuées à l'aide d'Apache SparkPréparation distribuée des fonctionnalités à l'aide d'Apache Spark.La mise en place d'un pipelineUtilisation d'un carnet entier comme étape du pipeline de préparation des donnéesConclusion
6. Magasin d'artefacts et de métadonnées
Métadonnées de ML KubeflowRequête programmatiqueL'interface utilisateur des métadonnées de KubeflowUtilisation des outils de métadonnées de MLflow avec Kubeflow.Création et déploiement d'un serveur de suivi MLflowEnregistrement des données sur les exécutionsUtilisation de l'interface utilisateur MLflowConclusion
7. Formation d'un modèle d'apprentissage automatique
Construire un outil de recommandation avec TensorFlowPour commencerDémarrer une nouvelle session de bloc-notesFormation TensorFlowDéployer un travail de formation TensorFlowFormation distribuéeUtilisation des GPUUtilisation d'autres cadres pour la formation distribuéeEntraîner un modèle à l'aide de Scikit-LearnDémarrer une nouvelle session de bloc-notesPréparation des donnéesFormation Scikit-LearnExpliquer le modèleModèle d'exportationIntégration dans les pipelinesConclusion
8. Inférence de modèle
Modèle ServirModèle d'exigences en matière de serviceSurveillance du modèlePrécision, dérive et explicabilité du modèleExigences en matière de surveillance des modèlesMise à jour du modèleExigences relatives à la mise à jour du modèleRésumé des exigences en matière d'inférenceInférence de modèle dans KubeflowServir TensorFlowRévisionSeldon CoreConception d'un graphique d'inférence SeldonTester ton modèleServir les demandesSurveillance de tes modèlesRévisionKFServingServerless et le plan de servicePlan de donnéesExemple de visite guidéeÉplucher l'infrastructure sous-jacenteRévisionConclusion

9. Étude de cas utilisant plusieurs outils
L'exemple du débruitage des tomodensitogrammesPréparation des données avec PythonDS-SVD avec Apache SparkVisualisationLe pipeline de débruitage des tomodensitogrammesPartager le pipelineConclusion
10. Réglage des hyperparamètres et apprentissage automatique des machines
AutoML : Une vue d'ensembleOptimisation des hyperparamètres avec Kubeflow KatibConcepts KatibInstallation de KatibRéalise ta première expérience KatibPréparer ton code de formationConfiguration d'une expérienceExécuter l'expérienceInterface utilisateur de KatibTuning Distributed Training JobsRecherche d'architecture neuronaleAvantages de Katib par rapport aux autres cadres de travailConclusion
A. Configurations de l'exécuteur Argo et compromis
B. Outils et configuration spécifiques au Cloud
Google CloudInstances accélérées par la TPUFlux de données pour TFX
C. Utilisation de Model Serving dans les applications
Construire des applications de streaming en s'appuyant sur le Model ServingMoteurs et bibliothèques de traitement des fluxPrésentation de CloudflowConstruire des applications par lots en s'appuyant sur le Model Serving
Index

Content preview from Kubeflow pour l'apprentissage automatique

Chapitre 5. Préparation des données et des caractéristiques

Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com

Les algorithmes d'apprentissage automatique ne valent que ce que valent leurs données d'apprentissage. Obtenir de bonnes données pour la formation implique la préparation des données et des caractéristiques.

La préparation des données est le processus qui consiste à rechercher les données et à s'assurer qu'elles sont valides. Il s'agit d'un processus en plusieurs étapes¹ qui peut inclure la collecte des données, l'augmentation, le calcul des statistiques, la validation du schéma, l'élagage des valeurs aberrantes et diverses techniques de validation. Le manque de données peut entraîner un surajustement, l'absence de corrélations significatives, et bien d'autres choses encore. Faire l'effort de collecter plus d'enregistrements et d'informations sur chaque échantillon pendant la préparation des données peut considérablement améliorer le modèle.²

La préparation des caractéristiques (parfois appelée ingénierie des caractéristiques) fait référence à la transformation des données d'entrée brutes en caractéristiques que le modèle d'apprentissage automatique peut utiliser.³ Une mauvaise préparation des caractéristiques peut faire perdre des relations importantes, comme un modèle linéaire dont les termes non linéaires ne sont pas développés, ou un modèle d'apprentissage profond dont l'orientation de ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Informationssicherheit und Datenschutz, 3rd Edition

Publisher Resources

ISBN: 9798341615496

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Kubeflow pour l'apprentissage automatique

by Trevor Grant, Holden Karau, Boris Lublinsky, Richard Liu, Ilan Filonenko

Chapitre 5. Préparation des données et des caractéristiques

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.