Rozdział 15. Regresja wieloraka

Przyglądając się problemowi, nie da się wstawić do niego zmiennych niewywierających na niego wpływu.

— Bill Parcells

Osoba zlecająca Ci utworzenie modelu jest nim zachwycona, ale uważa, że możesz postarać się bardziej. Ponadto udało Ci się zebrać dodatkowe dane — teraz wiesz, ile godzin dziennie każdy z użytkowników spędza w pracy, a także kto dysponuje stopniem naukowym doktora. Dane te możesz zastosować w celu poprawy modelu.

W związku z tym możemy hipotetycznie utworzyć model liniowy z większą liczbą zmiennych niezależnych:

minuty = α + β1 znajomi + β2 godziny spędzone w pracy + β3 doktorat + ε

Oczywiście posiadanie doktoratu nie jest liczbą, ale zgodnie z treścią rozdziału 11. możemy wprowadzić zmienną fikcyjną ...

Get Data science od podstaw now with the O’Reilly learning platform.

O’Reilly members experience live online training, plus books, videos, and digital content from nearly 200 publishers.