Rozdział 4. Obsługa danych liczbowych
4.0. Wprowadzenie
Dane ilościowe pozwalają na pomiar wielkości dowolnych elementów: klasy, miesięcznej sprzedaży lub ocen uczniów. Naturalnym sposobem na przedstawienie tego pomiaru jest użycie liczb, na przykład 29 uczniów lub sprzedaż w wysokości 529 392 zł. W rozdziale przedstawię wiele strategii z zakresu przekształcania surowych danych liczbowych na cechy wykorzystywane później w algorytmach uczenia maszynowego.
4.1. Przeskalowywanie cechy
Problem
Musisz przeskalować wartości cech liczbowych w taki sposób, aby mieściły się w przedziale wyznaczonym przez dwie wartości.
Rozwiązanie
Do przeskalowania tablicy cech użyj oferowanej przez bibliotekę scikit-learn klasy MinMaxScaler
.
# Wczytanie bibliotek.
Get Uczenie maszynowe w Pythonie now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.