Kapitel 9. Vertiefung der Tabellenmodellierung

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Bei der tabellarischen Modellierung werden die Daten in Form einer Tabelle (wie eine Tabellenkalkulationoder CSV) verwendet. Das Ziel ist es, den Wert in einer Spalte auf der Grundlage der Werte in den anderen Spalten vorherzusagen. In diesem Kapitel befassen wir uns nicht nur mit Deep Learning, sondern auch mit allgemeineren maschinellen Lerntechniken wie Random Forests, da diese je nach Problemstellung bessere Ergebnisse liefern können.

Wir werden uns ansehen, wie wir die Daten vorverarbeiten und bereinigen sollten und wie wir die Ergebnisse unserer Modelle nach dem Training interpretieren, aber zuerst werden wir sehen, wie wir Spalten, die Kategorien enthalten, mit Hilfe von Einbettungen in ein Modell einspeisen können, das Zahlen erwartet.

Kategoriale Einbettungen

In tabellarischen Daten können einige Spalten numerische Daten enthalten, wie z.B. "Alter", währendandere String-Werte enthalten, wie z.B. "Geschlecht". Die numerischen Daten können direkt in das Modell eingespeist werden (mit einigen optionalen Vorverarbeitungen), aber die anderen Spalten müssen in Zahlen umgewandelt werden. Da die Werte in diesen Spalten verschiedenen Kategorien entsprechen, nennen wir diese Art von Variablen oft kategorische Variablen. Die erste Art wird als kontinuierlicheVariablen bezeichnet.

Jargon: Kontinuierliche ...

Get Deep Learning für Programmierer mit fastai und PyTorch now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.