Chapitre 7. AutoGluon pour les données tabulaires
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
En 2021, je travaillais pour une entreprise de vente au détail qui se débattait depuis des mois avec ses modèles d’acquisition de clients. Les membres de l’équipe de science des données de l’entreprise avaient passé des semaines à construire des pipelines complexes d’ingénierie des caractéristiques, à tester différents algorithmes et à ajuster manuellement les hyperparamètres. Malgré leurs efforts, ils n’atteignaient qu’une précision de 82 % pour prédire quels prospects se transformeraient en clients — ce qui n’était guère mieux que leur approche basée sur des règles métier.
Par curiosité, j’ai proposé d’essayer le TabularPredictor d’AutoGluon sur leur ensemble de données. En moins de 30 minutes, on avait un modèle fonctionnel qui atteignait une précision de 89 % avec seulement trois lignes de code. Il ne s’agissait pas seulement d’une performance de validation : le modèle a conservé une précision de 87 % sur un ensemble de test entièrement mis de côté avant même que la modélisation ne commence, et après son déploiement, il a systématiquement atteint une précision de 85 % à 88 % sur les nouveaux prospects au cours des trois mois suivants. La légère baisse entre la validation et la production est courante et attendue ; ce qui comptait, c’est qu’il surpassait largement le modèle de 82 % construit à ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access