Rozdział 7. Wstępne przetwarzanie danych

W tym rozdziale opisane są najczęściej wykonywane operacje przetwarzania danych. Wykorzystane są w tym celu następujące dane:

>>> X2 = pd.DataFrame(

...     {

...         “a”: range(5),

...         “b”: [-100, -50, 0, 200, 1000],

...     }

... )

>>> X2

   a     b

0  0  -100

1  1   -50

2  2     0

3  3   200

4  4  1000

Normalizacja

Niektóre algorytmy, na przykład maszyna wektorów nośnych, lepiej działają wtedy, gdy dane są znormalizowane, tj. ich średnia jest równa 0, a odchylenie standardowe równe 1. Biblioteka sklearn udostępnia metodę fit_transform, łączącą w sobie metody fit i transform. Poniższy kod przedstawia przykład jej użycia:

>>> from sklearn import preprocessing

>>> std = preprocessing.StandardScaler()

>>> ...

Get Uczenie maszynowe w Pythonie now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.

Start your free trial

Uczenie maszynowe w Pythonie by Matt Harrison

Rozdział 7. Wstępne przetwarzanie danych

Normalizacja

Don’t leave empty-handed

It’s yours, free.

Check it out now on O’Reilly