데이터 준비가 단순히 ‘분석 전에 수행하는 과정’이라고 가볍게 생각할 수 있겠지만, 사실은 데
이터를 이해하는 데 필수이면서도 시간이 많이 소요되는 작업입니다. 분석할 데이터의 타입을
이해하는 일은 매우 중요하므로 충분한 시간을 들여야 하며, 데이터셋을 명확히 이해하고 데이
터 품질을 검토하는 데이터 프로파일링 또한 중요합니다. 필자는 분석 프로젝트를 진행할 때
계속해서 프로파일링을 수행하며 쿼리 결과가 맞는지 확인합니다. 데이터 품질이 낮으면 항상
어디선가 문제가 생기기 마련이니 지금까지 배운 데이터 정제와 보강법을 잘 활용하고, 데이터
형태를 원하는 대로 가공하는 방법도 반드시 숙지합시다. 책 전체에 걸쳐 다양한 분석을 수행
하는 동안 이 장에서 배운 데이터 준비 방법을 반복해서 익히게 될 겁니다. 다음 장에서는 시계
열 분석 방법을 알아봅니다.
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.