Kapitel 12. Ein Sprachmodell von Grund auf
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Jetzt sind wir bereit, in die Tiefe zu gehen... in die Tiefe des Deep Learning! Du hast bereits gelernt, wie man ein grundlegendes neuronales Netzwerk trainiert, aber wie kommt man von dort aus zu hochmodernen Modellen? In diesem Teil des Buches werden wir alle Geheimnisse lüften, angefangen bei Sprachmodellen.
In Kapitel 10 hast du gesehen, wie du ein vortrainiertes Sprachmodell fein abstimmst, um einen Textklassifikator zu erstellen. In diesem Kapitel werden wir genau erklären, was in diesem Modell steckt und was ein RNN ist. Als Erstes wollen wir einige Daten sammeln, mit denen wir schnell einen Prototyp unserer verschiedenen Modelle erstellen können.
Die Daten
Wenn wir mit der Arbeit an einem neuen Problem beginnen, versuchen wir immer zuerst, einen möglichst einfachen Datensatz zu finden, mit dem wir Methoden schnell und einfach ausprobieren und die Ergebnisse interpretieren können. Als wir vor ein paar Jahren begannen, an der Sprachmodellierung zu arbeiten, fanden wir keinen Datensatz, der ein schnelles Prototyping ermöglicht hätte, also haben wir einen erstellt. Wir nennen ihn Human Numbers und er enthält einfach die ersten 10.000 Zahlen, die auf Englisch geschrieben wurden.
Jeremy Sagt
Einer der häufigsten praktischen Fehler, den ich selbst bei sehr erfahrenen Praktikern sehe, ist, dass sie nicht ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access