CAPÍTULO 5
O Sobreajuste e Como Evitá-lo
Conceitos Fundamentais: Generalização; Ajuste e sobreajuste; Controle de complexidade.
Técnicas Exemplares: Validação cruzada; Seleção de atributo; Poda; Regularização.
Uma das noções fundamentais mais importantes de data science é a de sobreajuste e generalização. Se nos permitirmos flexibilidade suficiente na busca por padrões em um conjunto particular de dados, certamente vamos encontrá-los. Infelizmente, esses “padrões” podem ser apenas ocorrências ao acaso. Como discutimos anteriormente, estamos interessados em padrões que generalizem — que possam prever bem exemplos que ainda não foram observados. O sobreajuste de dados é a existência de ocorrências aleatórias nos dados que pare-çam padrões interessantes, ...
Get Data Science Para Negócios now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.