Rozdział 3. Klasyfikacja danych: baza Titanic

W tym rozdziale opisany jest typowy proces klasyfikacji danych na przykładzie bazy Titanic (https://oreil.ly/PjceO). W następnych rozdziałach szczegółowo opisane są poszczególne etapy analizy danych.

Proponowany schemat projektu

Do eksploracji danych doskonale nadaje się bezpłatne środowisko Jupyter (https://jupyter.org), obsługujące różne języki, m.in. Python, i umożliwiające tworzenie komórek kodu i dokumentów w formacie Markdown.

Środowiska Jupyter używam w dwóch trybach. W pierwszym przeprowadzam szybką analizę danych, a w drugim przygotowuję raport w formacie Markdown zawierający komórki z kodem, który ilustruje ważne aspekty i wnioski z analizy. Jeżeli używasz innego środowiska, może być konieczne ...

Get Uczenie maszynowe w Pythonie now with O’Reilly online learning.

O’Reilly members experience live online training, plus books, videos, and digital content from 200+ publishers.