Rozdział 7. Wstępne przetwarzanie danych

W tym rozdziale opisane są najczęściej wykonywane operacje przetwarzania danych. Wykorzystane są w tym celu następujące dane:

>>> X2 = pd.DataFrame(
...     {
...         “a”: range(5),
...         “b”: [-100, -50, 0, 200, 1000],
...     }
... )
>>> X2
   a     b
0  0  -100
1  1   -50
2  2     0
3  3   200
4  4  1000

Normalizacja

Niektóre algorytmy, na przykład maszyna wektorów nośnych, lepiej działają wtedy, gdy dane są znormalizowane, tj. ich średnia jest równa 0, a odchylenie standardowe równe 1. Biblioteka sklearn udostępnia metodę fit_transform, łączącą w sobie metody fit i transform. Poniższy kod przedstawia przykład jej użycia:

>>> from sklearn import preprocessing
>>> std = preprocessing.StandardScaler()
>>> ...

Get Uczenie maszynowe w Pythonie now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.