Kapitel 12. Aufbau eines Knowledge Graph
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
In diesem Buch haben wir uns durch viele Blaupausen für die Textanalyse gearbeitet. Unser Ziel war es immer, mit Hilfe von Statistik und maschinellem Lernen Muster in den Daten zu erkennen. In Kapitel 10 haben wir erklärt, wie Einbettungen verwendet werden können, um Fragen wie "Was gehört zu Deutschland wie Paris zu Frankreich?" zu beantworten. Einbettungen stellen eine Art implizites Wissen dar, das aus den Trainingsdokumenten auf der Grundlage eines Konzepts der Ähnlichkeit gelernt wurde.
Eine Wissensbasis hingegen besteht aus strukturierten Aussagen der Form "Berlin Hauptstadt von Deutschland". In diesem Fall ist "Hauptstadt von" eine genau definierte Beziehung zwischen den beiden spezifischen Entitäten Berlin und Deutschland. Das Netzwerk, das aus vielen Entitäten und ihren Beziehungen besteht, ist ein Graph im mathematischen Sinne, ein Wissensgraph. Abbildung 12-1 zeigt einen einfachen Wissensgraphen zur Veranschaulichung des Beispiels. In diesem Kapitel werden wir Blaupausen vorstellen, um strukturierte Informationen aus unstrukturiertem Text zu extrahieren und einen grundlegenden Wissensgraphen zu erstellen.