Kapitel 9. Vertiefung der Tabellenmodellierung
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Bei der tabellarischen Modellierung werden die Daten in Form einer Tabelle (wie eine Tabellenkalkulationoder CSV) verwendet. Das Ziel ist es, den Wert in einer Spalte auf der Grundlage der Werte in den anderen Spalten vorherzusagen. In diesem Kapitel befassen wir uns nicht nur mit Deep Learning, sondern auch mit allgemeineren maschinellen Lerntechniken wie Random Forests, da diese je nach Problemstellung bessere Ergebnisse liefern können.
Wir werden uns ansehen, wie wir die Daten vorverarbeiten und bereinigen sollten und wie wir die Ergebnisse unserer Modelle nach dem Training interpretieren, aber zuerst werden wir sehen, wie wir Spalten, die Kategorien enthalten, mit Hilfe von Einbettungen in ein Modell einspeisen können, das Zahlen erwartet.
Kategoriale Einbettungen
In tabellarischen Daten können einige Spalten numerische Daten enthalten, wie z.B. "Alter", währendandere String-Werte enthalten, wie z.B. "Geschlecht". Die numerischen Daten können direkt in das Modell eingespeist werden (mit einigen optionalen Vorverarbeitungen), aber die anderen Spalten müssen in Zahlen umgewandelt werden. Da die Werte in diesen Spalten verschiedenen Kategorien entsprechen, nennen wir diese Art von Variablen oft kategorische Variablen. Die erste Art wird als kontinuierlicheVariablen bezeichnet.
Jargon: Kontinuierliche ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access