Rozdział 17. Redukcja wymiarowości danych

Istnieje wiele technik przekształcania cech na mniejszy zbiór wykorzystywanych do badania, wizualizowania i klastrowania danych, jak również do tworzenia modeli prognozujących.

W tym rozdziale zaprezentowana jest analiza głównych składowych oraz techniki UMAP, t-SNE i PHATE na przykładzie danych pasażerów Titanica.

Poniżej przedstawiony jest kod modelu:

>>> ti_df = tweak_titanic(orig_df)
>>> std_cols = “pclass,age,sibsp,fare”.split(“,”)
>>> X_train, X_test, y_train, y_test = get_train_test_X_y(
...     ti_df, “survived”, std_cols=std_cols
... )
>>> X = pd.concat([X_train, X_test])
>>> y = pd.concat([y_train, y_test])

Analiza głównych składowych

Analiza głównych składowych (ang. Principal Component ...

Get Uczenie maszynowe w Pythonie now with O’Reilly online learning.

O’Reilly members experience live online training, plus books, videos, and digital content from 200+ publishers.