Kapitel 9. Grafische Analyse von Text

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Bis zu diesem Punkt haben wir traditionelle Klassifizierungs- und Clustering-Algorithmen auf Texte angewendet. Diese Algorithmen ermöglichen es uns, Abstände zwischen Begriffen zu messen, Phrasen zu gewichten und Wahrscheinlichkeiten für Äußerungen zu berechnen, so dass wir über die Beziehungen zwischen Dokumenten nachdenken können. Aufgaben wie die maschinelle Übersetzung, die Beantwortung von Fragen und das Befolgen von Anweisungen erfordern jedoch oft komplexere, semantische Schlussfolgerungen.

Wie würdest du zum Beispiel aus einer großen Anzahl von Nachrichtenartikeln ein Modell der darin enthaltenen Erzählungen erstellen - der Handlungen der Hauptakteure oder der Handlungen anderer, der Abfolge von Ereignissen, von Ursache und Wirkung? Mithilfe der Techniken in Kapitel 7 könntest du die Entitäten oder Schlüsselbegriffe extrahieren oder mit den in Kapitel 6 beschriebenen Methoden zur Themenmodellierung nach Themen suchen. Aber um Informationen über die Beziehungen zwischen diesen Entitäten, Phrasen und Themen zu modellieren, brauchst du eine andere Art von Datenstruktur.

Lass uns überlegen, wie solche Beziehungen in den Überschriften einiger unserer Artikel zum Ausdruck kommen können:

headlines = ['FDA approves gene therapy',
             'Gene therapy reduces tumor growth',
             'FDA recalls pacemakers']

Traditionell werden ...

Get Angewandte Textanalyse mit Python now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.