Capítulo 6. Aplicação e avaliação da modelação em R e Python
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Depois de o meticuloso processo de análise exploratória de dados, em que os dados são visualizados, compreendidos e pré-processados, passamos para uma das fases mais importantes do ciclo de vida da ciência dos dados: a fase de modelação. Esta fase é onde o conhecimento teórico encontra a aplicação prática. Aproveitando os conhecimentos obtidos na EDA, os cientistas de dados selecionam, concebem e treinam modelos para prever ou classificar resultados desconhecidos. É uma fase em que os dados limpos e transformados são introduzidos em algoritmos, transformando a informação em bruto em conhecimentos acionáveis. À medida que nos aprofundamos na fase de modelação, vamos explorar vários algoritmos, técnicas e melhores práticas para garantir que os nossos modelos são exactos e interpretáveis.
Etapas de modelação
Antes de nos aprofundarmos na fase de modelação, vamos considerar o objetivo da modelação. A modelação centra-se na criação e formação de modelos preditivos utilizando dados para fazer previsões ou classificações precisas em dados novos e não vistos. Os modelos podem ser supervisionados ou não supervisionados, pelo que abordarei ambos nesta secção.
Seleção e treino de modelos
Um dos primeiros passos na seleção e formação de modelos é a escolha de um algoritmo. Um algoritmo é um conjunto de regras ...