Kubeflow pour l'apprentissage automatique
by Trevor Grant, Holden Karau, Boris Lublinsky, Richard Liu, Ilan Filonenko
Chapitre 9. Étude de cas utilisant plusieurs outils
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Dans ce chapitre, nous allons discuter de ce qu'il faut faire si tu as besoin d'utiliser d'"autres" outils pour ton pipeline particulier de science des données. Python dispose d'une pléthore d'outils permettant de gérer un large éventail de formats de données. RStats dispose d'un vaste référentiel de fonctions mathématiques avancées. Scala est le langage par défaut des moteurs de traitement des big data tels qu'Apache Spark et Apache Flink. Les programmes hérités qu'il serait coûteux de reproduire existent dans n'importe quel nombre de langages.
Un avantage très important de Kubeflow est que les utilisateurs n'ont plus besoin de choisir le langage qui convient le mieux à l'ensemble de leur pipeline, mais peuvent au contraire utiliser le meilleur langage pour chaque travail (tant que le langage et le code sont conteneurisables).
Nous démontrerons ces concepts à l'aide d'un exemple complet de débruitage de tomodensitogrammes. Les tomodensitogrammes à faible dose permettent aux cliniciens de les utiliser comme outil de diagnostic en délivrant une fraction de la dose de radiation - cependant, ces tomodensitogrammes souffrent souvent d'une augmentation du bruit blanc. Les tomodensitogrammes sont présentés dans un format connu sous le nom de DICOM, et nous utiliserons un conteneur avec une bibliothèque ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access