Rozdział 21. Przetwarzanie języka naturalnego
Byli na wielkiej uczcie języków i pokradli okruszyny.
— William Shakespeare
Przetwarzanie języka naturalnego (NLP — ang. natural language processing) jest określeniem technik przetwarzania danych związanych z językiem naturalnym. To bardzo szerokie pole, ale przyjrzymy się kilku technikom — zaczniemy od prostszych, aby później przejść do bardziej skomplikowanych.
Chmury wyrazowe
W rozdziale 1. obliczaliśmy liczbę wystąpień słów w zainteresowaniach użytkowników. Częstotliwość pojawiania się słów można zilustrować za pomocą chmury wyrazowej, w której słowa mają rozmiar zależny od liczby ich wystąpień w analizowanym tekście.
Ogólnie rzecz biorąc, analitycy danych rzadko korzystają z chmur słów między ...
Get Data science od podstaw now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.