Rozdział 19. Potoki
W bibliotece scikit-learn
funkcjonuje pojęcie potoku (ang. pipeline). Za pomocą klasy Pipeline
można łączyć ze sobą transformatory i modele, a cały proces traktować jak model biblioteki scikit-learn
. Można w nim nawet implementować niestandardową logikę.
Potok klasyfikacyjny
Poniżej przedstawiona jest przykładowa funkcja tweak_titanic
wykorzystana w potoku:
>>> from sklearn.base import (
... BaseEstimator,
... TransformerMixin,
... )
>>> from sklearn.pipeline import Pipeline
>>> def tweak_titanic(df):
... df = df.drop(
... columns=[
... “name”,
... “ticket”,
... “home.dest”,
... “boat”,
... “body”,
... “cabin”,
... ]
... ).pipe(pd.get_dummies, drop_first=True)
... return DFLR
>>> ...
Get Uczenie maszynowe w Pythonie now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.