
Конструирование признаков | 145
не закодирован. Проблема в том, что Amazon постоянно пополняется новыми брен-
дами. Для решения этой проблемы вы создаете категорию «Неизвестные» со значе -
нием 2 000 000 в надежде охватить все бренды, с которыми не сталкивалась модель
в ходе обучения.
Ваша модель перестает спотыкаться, но продавцы жалуются, что их новые бренды
не получают трафик. Дело в том, что ваша модель не видела категорию «Неизвест-
ные» в обучающем наборе, поэтому не рекомендует товары бренда, попавшего
в эту категорию. Вы исправляете это, изменив кодирование и дав 99% кодов наибо-
лее популярным брендам, оставив 1% для категории «Неизвестные ...