KAPITEL 4

Repräsentation von Daten und Merkmalsgenerierung

Bisher sind wir davon ausgegangen, dass unsere Daten als zweidimensionale Arrays von Fließkommazahlen vorliegen, wobei jede Spalte ein kontinuierliches Merkmal beschreibt. Bei vielen Anwendungen werden Daten aber nicht auf diese Weise gesammelt. Kategorische Merkmale kommen besonders häufig vor. Diese auch diskrete Merkmale genannten Eigenschaften sind für gewöhnlich keine Zahlen. Der Unterschied zwischen kategorischen und kontinuierlichen Merkmalen ist analog zum Unterschied zwischen Klassifikation und Regression, nur aufseiten der Eingabedaten und nicht bei der Ausgabe. Bereits betrachtete Beispiele für kontinuierliche Merkmale sind die Helligkeit von Pixeln und Messungen der Größe ...

Get Einführung in Machine Learning mit Python now with O’Reilly online learning.

O’Reilly members experience live online training, plus books, videos, and digital content from 200+ publishers.