Rozdział 15. Regresja wieloraka
Przyglądając się problemowi, nie da się wstawić do niego zmiennych niewywierających na niego wpływu.
— Bill Parcells
Osoba zlecająca Ci utworzenie modelu jest nim zachwycona, ale uważa, że możesz postarać się bardziej. Ponadto udało Ci się zebrać dodatkowe dane — teraz wiesz, ile godzin dziennie każdy z użytkowników spędza w pracy, a także kto dysponuje stopniem naukowym doktora. Dane te możesz zastosować w celu poprawy modelu.
W związku z tym możemy hipotetycznie utworzyć model liniowy z większą liczbą zmiennych niezależnych:
minuty = α + β1 znajomi + β2 godziny spędzone w pracy + β3 doktorat + ε
Oczywiście posiadanie doktoratu nie jest liczbą, ale zgodnie z treścią rozdziału 11. możemy wprowadzić zmienną fikcyjną ...
Get Data science od podstaw now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.