KAPITEL 21

Linguistische Datenverarbeitung

Sie waren auf einem großen Fest der Sprachen und haben die Überreste gestohlen.

– William Shakespeare

Linguistische Datenverarbeitung (LDV) bezieht sich auf die Anwendung von Computertechnologien auf Sprache. Dies ist ein weites Feld, und wir werden sowohl einige einfache als auch weniger einfache Techniken betrachten.

Wortwolken

In Kapitel 1 haben wir die Interessen von Nutzern ausgezählt. Eine Methode zum Visualisieren von Wörtern und ihrer Anzahl sind Wortwolken, bei denen die Wörter in einer Größe entsprechend ihrer Anzahl angeordnet werden.

Im Allgemeinen denken Data Scientists nicht viel über Wortwolken nach, größtenteils weil die Platzierung der Wörter nicht viel bedeutet außer »hier war genug ...

Get Einführung in Data Science, 2nd Edition now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.