Rozdział 3. Klasyfikacja danych: baza Titanic
W tym rozdziale opisany jest typowy proces klasyfikacji danych na przykładzie bazy Titanic (https://oreil.ly/PjceO). W następnych rozdziałach szczegółowo opisane są poszczególne etapy analizy danych.
Proponowany schemat projektu
Do eksploracji danych doskonale nadaje się bezpłatne środowisko Jupyter (https://jupyter.org), obsługujące różne języki, m.in. Python, i umożliwiające tworzenie komórek kodu i dokumentów w formacie Markdown.
Środowiska Jupyter używam w dwóch trybach. W pierwszym przeprowadzam szybką analizę danych, a w drugim przygotowuję raport w formacie Markdown zawierający komórki z kodem, który ilustruje ważne aspekty i wnioski z analizy. Jeżeli używasz innego środowiska, może być konieczne ...
Get Uczenie maszynowe w Pythonie now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.