Rozdział 7. Wstępne przetwarzanie danych
W tym rozdziale opisane są najczęściej wykonywane operacje przetwarzania danych. Wykorzystane są w tym celu następujące dane:
>>> X2 = pd.DataFrame(
... {
... “a”: range(5),
... “b”: [-100, -50, 0, 200, 1000],
... }
... )
>>> X2
a b
0 0 -100
1 1 -50
2 2 0
3 3 200
4 4 1000
Normalizacja
Niektóre algorytmy, na przykład maszyna wektorów nośnych, lepiej działają wtedy, gdy dane są znormalizowane, tj. ich średnia jest równa 0, a odchylenie standardowe równe 1. Biblioteka sklearn
udostępnia metodę fit_transform
, łączącą w sobie metody fit
i transform
. Poniższy kod przedstawia przykład jej użycia:
>>> from sklearn import preprocessing
>>> std = preprocessing.StandardScaler()
>>> ...
Get Uczenie maszynowe w Pythonie now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.