
60 | Capítulo 2: Projeto de Aprendizado de Máquina de Ponta a Ponta
A diagonal principal (superior esquerda até a parte inferior direita) seria cheia de linhas
retas se o Pandas plotasse cada variável em relação a si mesma, o que não seria muito útil.
Então, em vez disso, o Pandas exibe um histograma para cada atributo (outras opções
estão disponíveis, veja a documentação do Pandas para mais detalhes).
O atributo mais promissor para prever o valor médio da habitação é a renda média, então
vamos observar o gráfico de dispersão de correlação (Figura 2-16):
housing.plot(kind="scatter", x="median_income", y="median_house_value",
alpha=0.1)
Esta plo ...