Chapitre 10. Apprentissage automatique avec MLlib
Jusqu'à présent, nous nous sommes concentrés sur les charges de travail d'ingénierie des données avec Apache Spark. L'ingénierie des données est souvent une étape préalable à la préparation de tes données pour les tâches d'apprentissage automatique (ML), qui seront au cœur de ce chapitre. Nous vivons à une époque où les applications d'apprentissage automatique et d'intelligence artificielle font partie intégrante de nos vies. Il y a de fortes chances que, que nous le réalisions ou non, nous soyons tous les jours en contact avec des modèles ML à des fins telles que les recommandations et les publicités pour les achats en ligne, la détection des fraudes, la classification, la reconnaissance d'images, la correspondance des formes, et bien d'autres choses encore. Ces modèles de ML conduisent à des décisions commerciales importantes pour de nombreuses entreprises. Selon cette étude de McKinsey, 35 % de ce que les consommateurs achètent sur Amazon et 75 % de ce qu'ils regardent sur Netflix sont motivés par des recommandations de produits basées sur l'apprentissage automatique. Construire un modèle performant peut faire ou défaire les entreprises.
Dans ce chapitre, nous allons te permettre de commencer à construire des modèles ML à l'aide de MLlib, la bibliothèque d'apprentissage automatique de facto dans ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access