Rozdział 5. Obsługa danych kategoryzujących
5.0. Wprowadzenie
Bardzo często użyteczne jest mierzenie obiektów nie w kategoriach ich ilości, ale pewnej jakości. Związane z tym informacje są z reguły przedstawiane jako obserwacje w oddzielnych kategoriach, takich jak na przykład płeć, kolor lub marka samochodu. Jednak nie wszystkie dane kategoryzujące są takie same. Zbiór kategorii bez powiązanej z nimi kolejności jest określany mianem kategorii nominalnej. Oto wybrane przykłady takich kategorii:
- niebieski, czerwony, zielony,
- mężczyzna, kobieta,
- banan, truskawka, jabłko.
Natomiast zbiór kategorii zawierających pewną naturalną kolejność jest określany mianem kategorii porządkowej, na przykład:
- mało, średnio, dużo,
- młody, stary,
- pozytywny, neutralny, ...
Get Uczenie maszynowe w Pythonie now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.