March 2019
Intermediate to advanced
256 pages
4h 57m
French
Nous allons dans ce chapitre découvrir quelques techniques habituelles de prétraitement en utilisant le jeu de données suivant :
>>> X2 = pd.DataFrame(
... {
... "a": range(5),
... "b": [-100, -50, 0, 200, 1000],
... }
... )
>>> X2
a b
0 0 -100
1 1 -50
2 2 0
3 3 200
4 4 1000La standardisation des données permet à certains algorithmes de mieux travailler, notamment SVM. Il s’agit pour chacune des colonnes de contenir une moyenne égale à zéro, avec un écart-type égal à 1. La librairie sklearn propose la méthode .fit_transform qui combine .fit et .transform :
>>> from sklearn import preprocessing >>> std = preprocessing.StandardScaler() >>> std.fit_transform(X2) array([[-1.41421356, -0.75995002], ...
Read now
Unlock full access