Rozdział 19. Potoki

W bibliotece scikit-learn funkcjonuje pojęcie potoku (ang. pipeline). Za pomocą klasy Pipeline można łączyć ze sobą transformatory i modele, a cały proces traktować jak model biblioteki scikit-learn. Można w nim nawet implementować niestandardową logikę.

Potok klasyfikacyjny

Poniżej przedstawiona jest przykładowa funkcja tweak_titanic wykorzystana w potoku:

>>> from sklearn.base import (
...     BaseEstimator,
...     TransformerMixin,
... )
>>> from sklearn.pipeline import Pipeline
 
>>> def tweak_titanic(df):
...     df = df.drop(
...         columns=[
...             “name”,
...             “ticket”,
...             “home.dest”,
...             “boat”,
...             “body”,
...             “cabin”,
...         ]
...     ).pipe(pd.get_dummies, drop_first=True)
...     return DFLR
 
>>> ...

Get Uczenie maszynowe w Pythonie now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.