book

Kubeflow pour l'apprentissage automatique

Name: Kubeflow pour l'apprentissage automatique
ISBN: 9798341615496

by Trevor Grant, Holden Karau, Boris Lublinsky, Richard Liu, Ilan Filonenko

November 2024

Intermediate to advanced

264 pages

7h 25m

French

O'Reilly Media, Inc.

Read now

Unlock full access

Avant-propos
Préface
Nos suppositions à ton sujetTa responsabilité en tant que praticienConventions utilisées dans ce livreExemples de codesUtiliser des exemples de codeApprentissage en ligne O'ReillyComment contacter les auteursComment nous contacterRemerciementsGriefs
1. Kubeflow : Ce que c'est et à qui ça s'adresse
Cycle de vie du développement du modèleQuelle est la place de Kubeflow ?Pourquoi conteneuriser ?Pourquoi Kubernetes ?La conception de Kubeflow et ses composants de base.Exploration des données avec les blocs-notesPréparation des données et des caractéristiquesFormationRéglage des hyperparamètresValidation du modèleInférence/prédictionPipelinesAperçu des composantsAlternatives à KubeflowClipper (RiseLabs)MLflow (Databricks)AutresPrésentation de nos études de casModifié National Institute of Standards and Technology (Institut national des normes et de la technologie)Données de la liste de diffusionRecommander un produitTomodensitométrieConclusion
2. Bonjour Kubeflow
Se mettre en place avec KubeflowInstallation de Kubeflow et de ses dépendancesConfiguration de Kubernetes localConfiguration de ton environnement de développement Kubeflow.Création de notre premier projet KubeflowFormation et déploiement d'un modèleFormation et suivi des progrèsRequête de testAller au-delà d'un déploiement localConclusion
3. Kubeflow Design : Au-delà de l'essentiel
Se déplacer dans le tableau de bord centralCarnets de notes (JupyterHub)Formation des opérateursPipelines KubeflowRéglage des hyperparamètresInférence de modèleMétadonnéesRésumé des composantsComposants de soutienMinIOIstioKnativeApache SparkIsolation des utilisateurs multiples de KubeflowConclusion
4. Pipelines Kubeflow
Commencer avec les pipelinesExploration des pipelines d'échantillons préemballésConstruire un pipeline simple en PythonStockage des données entre les étapesIntroduction aux composants des pipelines Kubeflow.Argo : la fondation des pipelinesCe que Kubeflow Pipelines ajoute au flux de travail d'ArgoConstruire un pipeline à partir d'images existantesComposants du pipeline KubeflowSujets avancés sur les pipelinesExécution conditionnelle des étapes du pipelineExécuter les pipelines dans les délais impartisConclusion
5. Préparation des données et des caractéristiques
Choisir l'outillage adéquatPréparation des données locales et des caractéristiquesRécupérer les donnéesNettoyage des données : Filtrer les déchetsFormatage des donnéesPréparation de l'articleConteneurs sur mesureOutillage distribuéTensorFlow étenduLes données distribuées à l'aide d'Apache SparkPréparation distribuée des fonctionnalités à l'aide d'Apache Spark.La mise en place d'un pipelineUtilisation d'un carnet entier comme étape du pipeline de préparation des donnéesConclusion
6. Magasin d'artefacts et de métadonnées
Métadonnées de ML KubeflowRequête programmatiqueL'interface utilisateur des métadonnées de KubeflowUtilisation des outils de métadonnées de MLflow avec Kubeflow.Création et déploiement d'un serveur de suivi MLflowEnregistrement des données sur les exécutionsUtilisation de l'interface utilisateur MLflowConclusion
7. Formation d'un modèle d'apprentissage automatique
Construire un outil de recommandation avec TensorFlowPour commencerDémarrer une nouvelle session de bloc-notesFormation TensorFlowDéployer un travail de formation TensorFlowFormation distribuéeUtilisation des GPUUtilisation d'autres cadres pour la formation distribuéeEntraîner un modèle à l'aide de Scikit-LearnDémarrer une nouvelle session de bloc-notesPréparation des donnéesFormation Scikit-LearnExpliquer le modèleModèle d'exportationIntégration dans les pipelinesConclusion
8. Inférence de modèle
Modèle ServirModèle d'exigences en matière de serviceSurveillance du modèlePrécision, dérive et explicabilité du modèleExigences en matière de surveillance des modèlesMise à jour du modèleExigences relatives à la mise à jour du modèleRésumé des exigences en matière d'inférenceInférence de modèle dans KubeflowServir TensorFlowRévisionSeldon CoreConception d'un graphique d'inférence SeldonTester ton modèleServir les demandesSurveillance de tes modèlesRévisionKFServingServerless et le plan de servicePlan de donnéesExemple de visite guidéeÉplucher l'infrastructure sous-jacenteRévisionConclusion

9. Étude de cas utilisant plusieurs outils
L'exemple du débruitage des tomodensitogrammesPréparation des données avec PythonDS-SVD avec Apache SparkVisualisationLe pipeline de débruitage des tomodensitogrammesPartager le pipelineConclusion
10. Réglage des hyperparamètres et apprentissage automatique des machines
AutoML : Une vue d'ensembleOptimisation des hyperparamètres avec Kubeflow KatibConcepts KatibInstallation de KatibRéalise ta première expérience KatibPréparer ton code de formationConfiguration d'une expérienceExécuter l'expérienceInterface utilisateur de KatibTuning Distributed Training JobsRecherche d'architecture neuronaleAvantages de Katib par rapport aux autres cadres de travailConclusion
A. Configurations de l'exécuteur Argo et compromis
B. Outils et configuration spécifiques au Cloud
Google CloudInstances accélérées par la TPUFlux de données pour TFX
C. Utilisation de Model Serving dans les applications
Construire des applications de streaming en s'appuyant sur le Model ServingMoteurs et bibliothèques de traitement des fluxPrésentation de CloudflowConstruire des applications par lots en s'appuyant sur le Model Serving
Index

Content preview from Kubeflow pour l'apprentissage automatique

Chapitre 9. Étude de cas utilisant plusieurs outils

Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com

Dans ce chapitre, nous allons discuter de ce qu'il faut faire si tu as besoin d'utiliser d'"autres" outils pour ton pipeline particulier de science des données. Python dispose d'une pléthore d'outils permettant de gérer un large éventail de formats de données. RStats dispose d'un vaste référentiel de fonctions mathématiques avancées. Scala est le langage par défaut des moteurs de traitement des big data tels qu'Apache Spark et Apache Flink. Les programmes hérités qu'il serait coûteux de reproduire existent dans n'importe quel nombre de langages.

Un avantage très important de Kubeflow est que les utilisateurs n'ont plus besoin de choisir le langage qui convient le mieux à l'ensemble de leur pipeline, mais peuvent au contraire utiliser le meilleur langage pour chaque travail (tant que le langage et le code sont conteneurisables).

Nous démontrerons ces concepts à l'aide d'un exemple complet de débruitage de tomodensitogrammes. Les tomodensitogrammes à faible dose permettent aux cliniciens de les utiliser comme outil de diagnostic en délivrant une fraction de la dose de radiation - cependant, ces tomodensitogrammes souffrent souvent d'une augmentation du bruit blanc. Les tomodensitogrammes sont présentés dans un format connu sous le nom de DICOM, et nous utiliserons un conteneur avec une bibliothèque ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Informationssicherheit und Datenschutz, 3rd Edition

Publisher Resources

ISBN: 9798341615496

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Kubeflow pour l'apprentissage automatique

by Trevor Grant, Holden Karau, Boris Lublinsky, Richard Liu, Ilan Filonenko

Chapitre 9. Étude de cas utilisant plusieurs outils

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.