Kapitel 2. Sentiment-Analyse mit Tidy Data

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Im vorigen Kapitel haben wir uns eingehend damit beschäftigt, was wir unter dem Format "aufgeräumter Text" verstehen, und gezeigt, wie dieses Format verwendet werden kann, um Fragen zur Worthäufigkeit anzugehen. So konnten wir analysieren, welche Wörter in Dokumenten am häufigsten verwendet werden und Dokumente vergleichen. Wir befassen uns mit dem Thema Meinungsforschung oder Stimmungsanalyse. Wenn sich menschliche Leser einem Text nähern, nutzen wir unser Verständnis der emotionalen Absicht von Wörtern, um daraus zu schließen, ob ein Textabschnitt positiv oder negativ ist oder vielleicht von einer anderen, differenzierteren Emotion wie Überraschung oder Abscheu geprägt ist. Mit den Werkzeugen des Text Mining können wir uns dem emotionalen Inhalt eines Textes programmatisch nähern, wie in Abbildung 2-1 unter dargestellt.

tmwr 0201
Abbildung 2-1. Ein Flussdiagramm einer typischen Textanalyse, die tidytext für die Sentimentanalyse nutzt. In diesem Kapitel wird gezeigt, wie die Sentiment-Analyse mit den Prinzipien von tidy data umgesetzt wird.

Eine Möglichkeit, die Stimmung eines Textes zu analysieren, besteht darin, den Text als Kombination seiner einzelnen Wörter zu betrachten und den Stimmungsgehalt des gesamten ...

Get Text Mining mit R now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.