Rozdział 5. Obsługa danych kategoryzujących

5.0. Wprowadzenie

Bardzo często użyteczne jest mierzenie obiektów nie w kategoriach ich ilości, ale pewnej jakości. Związane z tym informacje są z reguły przedstawiane jako obserwacje w oddzielnych kategoriach, takich jak na przykład płeć, kolor lub marka samochodu. Jednak nie wszystkie dane kategoryzujące są takie same. Zbiór kategorii bez powiązanej z nimi kolejności jest określany mianem kategorii nominalnej. Oto wybrane przykłady takich kategorii:

  • niebieski, czerwony, zielony,
  • mężczyzna, kobieta,
  • banan, truskawka, jabłko.

Natomiast zbiór kategorii zawierających pewną naturalną kolejność jest określany mianem kategorii porządkowej, na przykład:

  • mało, średnio, dużo,
  • młody, stary,
  • pozytywny, neutralny, ...

Get Uczenie maszynowe w Pythonie now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.