Rozdział 6. Podobieństwo, sąsiedzi i klastry

Podstawowe pojęcia: Obliczanie podobieństwa obiektów opisanych przez dane; Wykorzystywanie podobieństwa do celów predykcji; Klastrowanie jako segmentacja oparta na podobieństwie.

Przykładowe techniki: Poszukiwanie podobnych jednostek; Metody najbliższych sąsiadów; Metody klastrowania; Miary odległości do obliczania podobieństwa.

Podobieństwo leży u podstaw wielu metod nauki o danych i rozwiązań problemów biznesowych. Jeżeli dwa obiekty (osoby, firmy, produkty) są pod jakimiś względami podobne, to często dzielą także inne cechy. Procedury eksploracji danych bywają często oparte na grupowaniu obiektów według podobieństwa lub na poszukiwaniu „właściwego” rodzaju podobieństwa. W sposób dorozumiany ...

Get Analiza danych w biznesie now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.