CHAPITRE 3 Classification avec les données Titanic
Ce chapitre présente les étapes successives d’un problème de classification habituel, en travaillant sur le jeu de données Titanic (https://oreil.ly/PjceO). Nous entrerons dans les détails des différentes étapes de l’analyse dans les chapitres ultérieurs.
Suggestion de structure du projet
Un bon outil pour réaliser des analyses de données exploratoires se nomme Jupyter (https://jupyter.org). C’est un environnement open source basé sur des calepins (notebooks) qui sait gérer le langage Python et quelques autres. Son principe est de créer des cellules contenant soit du code, soit des commentaires selon le format Markdown.
Je me sers en général de Jupyter dans deux modes. Le premier sert aux analyses ...
Get Machine learning : les fondamentaux now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.