Rozdział 17. Redukcja wymiarowości danych

Istnieje wiele technik przekształcania cech na mniejszy zbiór wykorzystywanych do badania, wizualizowania i klastrowania danych, jak również do tworzenia modeli prognozujących.

W tym rozdziale zaprezentowana jest analiza głównych składowych oraz techniki UMAP, t-SNE i PHATE na przykładzie danych pasażerów Titanica.

Poniżej przedstawiony jest kod modelu:

>>> ti_df = tweak_titanic(orig_df)

>>> std_cols = “pclass,age,sibsp,fare”.split(“,”)

>>> X_train, X_test, y_train, y_test = get_train_test_X_y(

...     ti_df, “survived”, std_cols=std_cols

... )

>>> X = pd.concat([X_train, X_test])

>>> y = pd.concat([y_train, y_test])

Analiza głównych składowych

Analiza głównych składowych (ang. Principal Component ...

Get Uczenie maszynowe w Pythonie now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.

Start your free trial

Uczenie maszynowe w Pythonie by Matt Harrison

Rozdział 17. Redukcja wymiarowości danych

Analiza głównych składowych

Don’t leave empty-handed

It’s yours, free.

Check it out now on O’Reilly