Rozdział 6. Obsługa tekstu
6.0. Wprowadzenie
Pozbawiony struktury tekst, taki jak zawartość książki lub wiadomość w serwisie Twitter, to jedno z najbardziej interesujących źródeł cech i jednocześnie najtrudniejsze do obsłużenia. W rozdziale omówię strategie przekształcania tekstu na cechy dostarczające wielu informacji. Nie oznacza to jednak, że zaprezentowane tutaj receptury są wyczerpujące. Istnieją całe dyscypliny akademickie koncentrujące się na obsłudze tekstu i podobnych typów danych, a opis stosowanych w tym zakresie technik mógłby wypełnić małą bibliotekę. Mimo to można mówić tu o kilku najczęściej używanych technikach, które będą nieocenionymi narzędziami w arsenale każdego, kto zajmuje się przetwarzaniem tekstu.
6.1. Oczyszczanie tekstu ...
Get Uczenie maszynowe w Pythonie now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.