Rozdział 5. Klasyfikacja
Specjalistom data science często są powierzane zadania automatyzacji decyzji w problemach biznesowych. Czy e-mail jest formą phishingu[1]? Czy klient będzie chciał zrezygnować z usług firmy? Czy użytkownik w sieci kliknie reklamę? To wszystko są problemy klasyfikacji, czyli odmiany uczenia nadzorowanego, w którym najpierw uczymy model na danych dających znane wyniki, a następnie wprowadzamy do tak wytrenowanego modelu dane o nieznanych rezultatach. Klasyfikacja jest prawdopodobnie najważniejszą formą predykcji: jej celem jest przewidzenie, czy rekord jest „0”, czy „1” (phishing/nie phishing, kliknął/nie kliknął, zrezygnuje/nie zrezygnuje), lub czy jest jedną z wielu kategorii (np. Gmail filtruje maile i dzieli te przychodzące ...
Get Statystyka praktyczna w data science now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.