
Data Science
12
#
키는
근속
연수
구간
,
값은
해당
구간에
속하는
사용자들의
평균
연봉
average
_
salary
_
by
_
bucket = {
tenure
_
bucket: sum(salaries) / len(salaries)
for tenure
_
bucket, salaries in salary
_
by
_
tenure
_
bucket.items()
이처럼 훨씬 흥미로운 결과가 나온다.
{'between two and five': 61500.0,
'less than two': 48000.0,
'more than five': 79166.66666666667}
결과를 통해 이제 이런 말을 할 수 있게 되었다. “
5
년 이상의 경력을 가진 데이터
과학자들은 경력이 없거나 적은 데이터 과학자들보다
65
%나 더 번다!”
여기서 우리는 구간을 임의로 설정했지만, 경력이
1
년 증가함에 따라 연봉이
평균적으로 어떻게 변하는지를 알아보는 것도 정말 흥미로울 것이다. 그렇게 하
면 단순히 연봉에 대한 정보를 흥미롭게 요약하는 데 그치는 것이 아니라 연봉
을 예측할 수 있게 된다. 예측에 대해서는
14
장 ‘단순 회귀 분석’에서 알아보자.
1.3.4
유료 계정
점심을 먹고 돌아오자, 수익관리부 부사장이 자리에서 기다리고 있다. 그녀는
어떤 사용자들이 유료 계정으로 전환하는지 ...