Rozdział 10. Reprezentacja i eksploracja tekstu
Podstawowe pojęcia: Znaczenie konstruowania przyjaznych eksploracji reprezentacji danych; Reprezentacja tekstu do celów eksploracji danych.
Przykładowe techniki: Reprezentacja worka słów (bag of words); Kalkulacja TFIDF; N-gramy; Sprowadzanie do formy podstawowej (stemming); Ekstrakcja wyrażeń nazwowych; Modele tematyczne.
Do tej pory ignorowaliśmy lub omijaliśmy istotny etap procesu eksploracji danych: przygotowanie danych. Świat nie zawsze obdarowuje nas danymi reprezentowanymi jako wektory cech, które większość metod eksploracji danych przyjmuje za dane wejściowe. Dane są przedstawiane w sposób naturalny dla problemów, z których się wywodzą. Jeśli chcemy zastosować wiele narzędzi eksploracji ...
Get Analiza danych w biznesie now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.