Kapitel 9. Natürliche Sprachen lesen und schreiben
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Die Daten, mit denen du bisher gearbeitet hast, lagen meist in Form von Zahlen oder zählbaren Werten vor. In den meisten Fällen hast du die Daten einfach gespeichert, ohne sie anschließend zu analysieren. In diesem Kapitel soll es um das schwierige Thema der englischen Sprache gehen.1
Woher weiß Google, wonach du suchst, wenn du "süßes Kätzchen" in seine Bildersuche eingibst? Wegen des Textes, der die Bilder mit den süßen Kätzchen umgibt. Woher weiß YouTube, dass es einen bestimmten Monty Python-Sketch anzeigt, wenn du "toter Papagei" in die Suchleiste eingibst? Aufgrund des Titels und des Beschreibungstextes, der jedes hochgeladene Video begleitet.
Sogar die Eingabe von Begriffen wie "verstorbener Vogel Monty Python" führt sofort zu demselben Sketch "Toter Papagei", obwohl auf der Seite selbst die Wörter "verstorben" oder "Vogel" nicht erwähnt werden. Google weiß, dass ein "Hot Dog" ein Lebensmittel ist und dass ein "kochender Welpe" etwas ganz anderes ist. Wie das? Das ist alles Statistik!
Auch wenn du vielleicht nicht denkst, dass die Textanalyse etwas mit deinem Projekt zu tun hat, kann das Verständnis der dahinter stehenden Konzepte für alle Arten von maschinellem Lernen sowie für die allgemeinere Fähigkeit, reale Probleme in probabilistischen und algorithmischen Begriffen zu modellieren, äußerst ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access