Rozdział 5. Wykrywanie anomalii w ruchu sieciowym metodą grupowania według k-średnich

Klasyfikacja i regresja to potężne, dobrze znane techniki uczenia maszynowego. W rozdziale 4. został opisany klasyfikator służący do prognozowania nieznanych wartości. Tkwił w nim pewien haczyk: aby przewidzieć nieznaną wartość na podstawie nowych danych, potrzebna była znajomość wartości docelowej odpowiadającej wielu znanym wcześniej rekordom. Klasyfikatory są pomocne jedynie wtedy, gdy my, badacze danych, wiemy, czego szukamy, i możemy podać mnóstwo przykładów, w których z danych wejściowych powstawały znane dane wyjściowe. Grupa takich technik nosi nazwę nadzorowanego uczenia maszynowego, ponieważ w procesie uczenia dla każdego rekordu wejściowego dostępna ...

Get Zaawansowana analiza danych w PySpark now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.