Rozdział 17. Redukcja wymiarowości danych
Istnieje wiele technik przekształcania cech na mniejszy zbiór wykorzystywanych do badania, wizualizowania i klastrowania danych, jak również do tworzenia modeli prognozujących.
W tym rozdziale zaprezentowana jest analiza głównych składowych oraz techniki UMAP, t-SNE i PHATE na przykładzie danych pasażerów Titanica.
Poniżej przedstawiony jest kod modelu:
>>> ti_df = tweak_titanic(orig_df)
>>> std_cols = “pclass,age,sibsp,fare”.split(“,”)
>>> X_train, X_test, y_train, y_test = get_train_test_X_y(
... ti_df, “survived”, std_cols=std_cols
... )
>>> X = pd.concat([X_train, X_test])
>>> y = pd.concat([y_train, y_test])
Analiza głównych składowych
Analiza głównych składowych (ang. Principal Component ...
Get Uczenie maszynowe w Pythonie now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.