Rozdział 4. Obsługa danych liczbowych

4.0. Wprowadzenie

Dane ilościowe pozwalają na pomiar wielkości dowolnych elementów: klasy, miesięcznej sprzedaży lub ocen uczniów. Naturalnym sposobem na przedstawienie tego pomiaru jest użycie liczb, na przykład 29 uczniów lub sprzedaż w wysokości 529 392 zł. W rozdziale przedstawię wiele strategii z zakresu przekształcania surowych danych liczbowych na cechy wykorzystywane później w algorytmach uczenia maszynowego.

4.1. Przeskalowywanie cechy

Problem

Musisz przeskalować wartości cech liczbowych w taki sposób, aby mieściły się w przedziale wyznaczonym przez dwie wartości.

Rozwiązanie

Do przeskalowania tablicy cech użyj oferowanej przez bibliotekę scikit-learn klasy MinMaxScaler.

# Wczytanie bibliotek.

Get Uczenie maszynowe w Pythonie now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.