
184 Глава 6
параметров и отобрана соответствующая модель, ее обобщающую способность оконча-
тельно проверяют на тестовом наборе данных.
Недостатком метода откладывания является чрезмерная чувствительность оценки про-
изводительности к способу, которым выбирают подмножества для обучения и провер-
ки. Иными словами, оценка может существенно различаться на разных выборках из
одного и того же исходного набора. Далее мы рассмотрим более надежный метод оцен-
ки производительности — k-кратную перекрестную проверку. Фактически это повто-
рение метода откладывания k раз на k подмножествах обучающих данных.
Исходный набор данных
Обучающий ...