CHAPITRE 7 Nettoyage et préparation des données
L’analyse et la modélisation des données demandent beaucoup d’efforts consacrés à la préparation des données : chargement, nettoyage, transformation et réarrangement. On considère que ces tâches représentent 80 % ou plus du travail d’un analyste. Parfois, c’est la manière dont les données sont stockées dans les fichiers ou les bases de données qui n’est pas adaptée à une tâche particulière. De nombreux chercheurs choisissent de faire un traitement ad hoc des données d’un format à un autre en utilisant un langage de programmation général, comme Python, Perl, R ou Java, ou encore des outils de traitement de texte Unix comme sed ou awk. Heureusement, pandas, avec les fonctionnalités natives du langage ...
Get Analyse de données avec Python now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.