KAPITEL 15
Multiple Regression
Ich schaue mir nicht das Problem an und füge dann Variablen hinzu, die damit nichts zu tun haben.
– Bill Parcells
Obwohl die Vizepräsidentin von Ihrem Vorhersagemodell sehr beeindruckt ist, denkt sie, dass es noch besser geht. Also haben Sie zusätzliche Daten gesammelt: Sie wissen, wie viele Stunden pro Tag jeder Nutzer arbeitet und welche Nutzer einen Doktortitel tragen. Sie möchten diese zusätzlichen Daten verwenden, um Ihr Modell zu verbessern.
Sie entwerfen ein entsprechendes lineares Modell mit weiteren unabhängigen Variablen:
minutes = α + β1friends + β2work hours + β3phd + ε
Ob ein Nutzer einen Doktortitel hat oder nicht, ist offensichtlich keine Zahl, aber wir können, wie in Kapitel 11 erwähnt, eine Dummy-Variable ...
Get Einführung in Data Science, 2nd Edition now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.