Rozdział 4. Klasyfikacja tekstu

Organizowanie to coś, co robisz, zanim coś zaczniesz robić, żeby wszystko się nie pomieszało, kiedy będziesz to robić.

— A.A. Milne

Niemal wszyscy sprawdzamy codziennie pocztę, często wielokrotnie. Przydatną funkcją oferowaną przez większość usług pocztowych jest możliwość automatycznego oddzielania spamu od zwykłych wiadomości. Jest to zastosowanie popularnego zadania NLP zwanego klasyfikacją tekstu, na którym skupimy się w tym rozdziale. Klasyfikacja tekstu polega na przypisywaniu danego fragmentu tekstu do jednej lub kilku kategorii z większego zbioru możliwych kategorii. W przykładzie z identyfikacją spamu mamy dwie kategorie — spam i nie spam — a każda przychodząca wiadomość jest przypisywana do jednej z nich. ...

Get Przetwarzanie języka naturalnego w praktyce now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.