
130 Глава 4
случае не ведет к утрате важной информации — например, если мы удалим столбец
color_blue
, информация об объектах все равно сохранится, — ведь если мы видим при-
знаки
color_green=0
и
color_red=0
, это однозначно свидетельствует, что футболка синяя.
Используя функцию
get_dummies
, мы можем удалить первый столбец, передав аргумент
True
параметру
drop_first
, как показано в следующем примере кода:
>>> pd.get_dummies(df[['price', 'color', 'size']],
... drop_first=True)
price size color_green color_red
0 10.1 1 1 0
1 13.5 2 0 1
2 15.3 3 0 0
Чтобы удалить избыточный столбец через
OneHotEncoder
, нам нужно задать