Rozdział 8. Wybieranie cech
Do utworzenia modelu danych należy wybrać odpowiednie cechy. Uwzględnienie niewłaściwych cech może negatywnie wpływać na funkcjonowanie modelu. Na przykład silnie skorelowane cechy powodują, że wskaźniki regresji (lub wskaźniki ważności cech w modelu drzewa decyzyjnego) są mało wiarygodne i trudne w interpretacji.
Inną kwestią wymagającą rozważenia jest wymiarowość danych. Wraz ze wzrostem liczby wymiarów dane stają się coraz rzadsze, przez co coraz trudniej jest je przetwarzać. Uzupełnianie brakujących wartości na podstawie sąsiednich danych jest coraz mniej skuteczne.
Czas trenowania modelu jest funkcją liczby kolumn (wydłuża się bardziej niż liniowo). Jeżeli dane są wiarygodne i precyzyjne, wtedy w krótszym czasie ...
Get Uczenie maszynowe w Pythonie now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.