
Descubra e Visualize os Dados para Obter Informações | 55
Figura 2-10. Comparação de viés de amostragem estratificada versus amostragem aleatória
Agora, você deve remover o atributo income_cat para que os dados voltem ao seu
estado original:
for set_ in (strat_train_set, strat_test_set):
set_.drop("income_cat", axis=1, inplace=True)
Ficamos um tempo na geração de conjuntos de testes por uma boa razão: esta parte crítica
é muitas vezes negligenciada em um projeto de Aprendizado de Máquina. Além disso,
muitas dessas ideias serão úteis mais tarde quando discutirmos a validação cruzada. Agora,
é hora de avançar para o próximo estágio: explorar os ...