Rozdział 17. Redukcja wymiarowości danych

Istnieje wiele technik przekształcania cech na mniejszy zbiór wykorzystywanych do badania, wizualizowania i klastrowania danych, jak również do tworzenia modeli prognozujących.

W tym rozdziale zaprezentowana jest analiza głównych składowych oraz techniki UMAP, t-SNE i PHATE na przykładzie danych pasażerów Titanica.

Poniżej przedstawiony jest kod modelu:

>>> ti_df = tweak_titanic(orig_df)
>>> std_cols = “pclass,age,sibsp,fare”.split(“,”)
>>> X_train, X_test, y_train, y_test = get_train_test_X_y(
...     ti_df, “survived”, std_cols=std_cols
... )
>>> X = pd.concat([X_train, X_test])
>>> y = pd.concat([y_train, y_test])

Analiza głównych składowych

Analiza głównych składowych (ang. Principal Component ...

Get Uczenie maszynowe w Pythonie now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.