Kapitel 16. Dimensionalitätsreduktion
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Die Dimensionalitätsreduktion wandelt einen Datensatz aus einem hochdimensionalen Raum in einen niedrigdimensionalen Raum um und kann eine gute Wahl sein, wenn du vermutest, dass es "zu viele" Variablen gibt. Ein Übermaß an Variablen, in der Regel Prädiktoren, kann ein Problem darstellen, weil es schwierig ist, Daten in höheren Dimensionen zu verstehen oder zu visualisieren.
Welche Probleme können durch Dimensionalitätsreduktion gelöst werden?
Die Dimensionalitätsreduktion kann entweder bei der Merkmalsentwicklung oder bei der explorativen Datenanalyse eingesetzt werden. Bei hochdimensionalen Biologieexperimenten beispielsweise besteht eine der ersten Aufgaben vor der Modellierung darin, festzustellen, ob es unerwünschte Trends in den Daten gibt (z. B. Effekte, die nichts mit der Fragestellung zu tun haben, wie Unterschiede zwischen den Laboren). Bei Hunderttausenden von Dimensionen ist es schwierig, die Daten zu entschlüsseln, und die Dimensionalitätsreduktion kann eine Hilfe bei der explorativen Datenanalyse sein.
Eine weitere mögliche Folge einer Vielzahl von Prädiktoren ist die mögliche Beeinträchtigung eines Modells. Das einfachste Beispiel ist eine Methode wie die gewöhnliche lineare Regression, bei der die Anzahl der Prädiktoren geringer sein sollte als die Anzahl der Datenpunkte, die zur Anpassung des ...
Get Aufgeräumtes Modellieren mit R now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.