Rozdział 6. Filtrowanie dokumentów
W rozdziale zademonstrowano, jak klasyfikować dokumenty na podstawie ich treści. Jest to bardzo praktyczne zastosowanie inteligencji maszynowej, które staje się coraz popularniejsze. Chyba najbardziej przydatnym i ogólnie znanym zastosowaniem filtrowania dokumentów jest eliminowanie spamu. Dużym problemem związanym z ogólną dostępnością poczty elektronicznej i wyjątkowo niskim kosztem wysyłania wiadomości e-mail jest to, że każda osoba, której adres „trafi w nieodpowiednie ręce”, prawdopodobnie będzie otrzymywać niepożądane wiadomości e-mail o charakterze komercyjnym. Utrudni to czytanie wiadomości, które rzeczywiście są godne zainteresowania.
Oczywiście problem ze spamem nie dotyczy wyłącznie poczty elektronicznej. ...
Get Nowe usługi 2.0. Przewodnik po analizie zbiorów danych now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.