
69
2
장
머신러닝 프로젝트 처음부터 끝까지
경도
인구
중간 주택 가격
위도
그림
2-1
캘리포니아 주택 가격
2.2
큰 그림 보기
머신러닝 주택 회사에 오신 것을 환영합니다! 맨 처음 할 일은 캘리포니아 인구조사 데이터를
사용해 캘리포니아의 주택 가격 모델을 만드는 것입니다. 이 데이터는 캘리포니아의 블록 그룹
block
group
마다 인구
population
, 중간 소득
median
income
, 중간 주택 가격
median
housing
price
등을 담고 있
습니다. 블록 그룹은 미국 인구조사국에서 샘플 데이터를 발표하는 데 사용하는 최소한의 지리
적 단위입니다 (하나의 블록 그룹은 보통
600
~
3
,
000
명의 인구를 나타냅니다 ). 여기서는 간단
하게 구역이라고 부르겠습니다.
이 데이터로 모델을 학습시켜서 다른 측정 데이터가 주어졌을 때 구역의 중간 주택 가격을 예
측해야 합니다.