Rozdział 5. Nadmierne dopasowanie i jego unikanie

Podstawowe pojęcia: Generalizacja; Dopasowanie i nadmierne dopasowanie; Kontrola złożoności.

Przykładowe techniki: Sprawdzian krzyżowy; Wybór atrybutów; Przycinanie drzew; Regularyzacja.

Jednymi z najważniejszych podstawowych pojęć nauki o danych są pojęcia nadmiernego dopasowania i generalizacji. Jeśli pozwolimy sobie na wystarczającą elastyczność podczas poszukiwania wzorców w konkretnym zbiorze danych, to te wzorce znajdziemy. Niestety, te „wzorce” mogą być tylko zdarzeniami losowymi w ramach danych. Jak wspomnieliśmy wcześniej, jesteśmy zainteresowani wzorcami, które dokonują generalizacji — prawidłowo prognozują wystąpienia, których jeszcze nie zaobserwowaliśmy. Znajdowanie w danych ...

Get Analiza danych w biznesie now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.