November 2012
Intermediate to advanced
888 pages
54h 46m
Polish
Mając dany fragment tekstu, chcemy dokonać jego klasyfikacji — na przykład zdecydować, czy otrzymany list można potraktować jako spam, bądź czy zawarty w liście dowcip jest naprawdę śmieszny.
Można w tym celu skorzystać w biblioteki Classifier Lucasa Carlsona, dostępnej w gemie classifier. W bibliotece tej znajduje się naiwny klasyfikator bayesowski oraz klasyfikator wykorzystujący bardziej zaawansowaną technikę ukrytego indeksowania semantycznego (LSI — Latent Semantic Indexing).
Interfejs naiwnego klasyfikatora bayesowskiego jest elementarny: tworzy się obiekt Classifier::Bayes z określeniem rodzaju klasyfikacji jako parametrem, po czym dokonuje się ...