Rozdział 40. Inżynieria cech

W poprzednich rozdziałach przedstawiłem Ci zarys podstawowych problemów uczenia maszynowego. Dotychczas we wszystkich przykładach zakładałem, że dysponujemy danymi liczbowymi zapisanymi w tablicy o wymiarach [liczba_próbek, liczba_cech]. W praktyce dane rzadko występują w takiej postaci. Dlatego jednym z najważniejszych kroków podczas stosowania uczenia maszynowego w praktyce jest inżynieria cech (ang. feature engineering), czyli proces polegający na zebraniu wszystkich posiadanych informacji na temat problemu i przekształceniu ich w liczby, które można zapisać w macierzy cech.

W tym rozdziale omówię kilka typowych zadań inżynierii cech: przyjrzymy się cechom reprezentującym dane kategorialne, teksty i obrazy. Dodatkowo ...

Get Python Data Science now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.