KAPITEL 8

Dimensionsreduktion

Viele Aufgaben beim Machine Learning enthalten für jeden Datenpunkt Tausende oder sogar Millionen Merkmale. Das Training wird dadurch nicht nur extrem langsam, auch das Finden einer geeigneten Lösung wird dadurch erschwert, wie wir gleich sehen werden. Dieses Problem wird bisweilen als Fluch der Dimensionalität bezeichnet.

Glücklicherweise lässt sich bei realen Aufgaben die Anzahl der Merkmale beträchtlich reduzieren, sodass sich eine nicht zu bewältigende Aufgabe bearbeiten lässt. Betrachten Sie beispielsweise die MNIST-Bilder (aus Kapitel 3): Die Pixel an den Bildrändern sind so gut wie immer weiß, daher könnten Sie diese Pixel aus dem Trainingsdatensatz entfernen, ohne viel Information zu verlieren. Abbildung ...

Get Praxiseinstieg Machine Learning mit Scikit-Learn und TensorFlow now with O’Reilly online learning.

O’Reilly members experience live online training, plus books, videos, and digital content from 200+ publishers.