KAPITEL 8
Dimensionsreduktion
Viele Aufgaben beim Machine Learning enthalten für jeden Datenpunkt Tausende oder sogar Millionen Merkmale. Das Training wird dadurch nicht nur extrem langsam, auch das Finden einer geeigneten Lösung wird dadurch erschwert, wie wir gleich sehen werden. Dieses Problem wird bisweilen als Fluch der Dimensionalität bezeichnet.
Glücklicherweise lässt sich bei realen Aufgaben die Anzahl der Merkmale beträchtlich reduzieren, sodass sich eine nicht zu bewältigende Aufgabe bearbeiten lässt. Betrachten Sie beispielsweise die MNIST-Bilder (aus Kapitel 3): Die Pixel an den Bildrändern sind so gut wie immer weiß, daher könnten Sie diese Pixel aus dem Trainingsdatensatz entfernen, ohne viel Information zu verlieren. Abbildung ...
Get Praxiseinstieg Machine Learning mit Scikit-Learn und TensorFlow now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.