Rozdział 4. Reprezentacja danych i cechy inżynierskie

Do tej pory zakładaliśmy, że nasze dane pojawiają się jako dwuwymiarowa tablica liczb zmiennoprzecinkowych, w której każda kolumna jest cechą ciągłą opisującą punkty danych. W przypadku wielu zastosowań dane są gromadzone w inny sposób. Szczególnie powszechnym typem cechy są cechy kategorialne, znane również jako cechy dyskretne; zwykle nie są one numeryczne. Rozróżnienie między cechami kategorialnymi a cechami ciągłymi jest analogiczne do rozróżnienia między klasyfikacją a regresją, tylko po stronie wejścia, a nie wyjścia. Przykłady cech ciągłych, które widzieliśmy, to jasność pikseli i pomiary wielkości kwiatów roślin. Przykładami cech kategorycznych są marka produktu, kolor produktu lub ...

Get Machine learning, Python i data science now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.