
33
2
장
데이터의 중요성
데이터의 중요성
2
CHAPTER
이 장에서는 이 책에서 다룰 사용 사례와 데이터셋을 소개하고, 실습과 추가 연구를 위해 해당
데이터를 다운로드할 수 있는 위치 정보를 제공합니다. 또한 데이터 유형, 배치 및 스트리밍 데
이터의 차이도 알아봅니다. 구글이 제공하는 무료 주피터 노트북(구글 코랩)으로 데이터 전처
리 실습을 진행하고, 프로젝트용 깃허브 저장소를 만드는 내용으로 마무리할 예정입니다.
2.1
사용 사례 및 데이터셋 개요
이 책에서는 수학이나 알고리즘 중심이 아닌 프로젝트 기반으로
ML
을 다룹니다. 여기서 선정
한 사용 사례는 의료, 소매, 에너지, 통신, 금융 분야 등 다양한 분야에 걸쳐 있습니다. 예를 들
어, 고객 이탈에 관한 사용 사례는 모든 분야에 적용할 수 있습니다. 어느 정도 데이터 전처리
경험이 있다면, 각 사용 사례 프로젝트를 독립적으로 진행할 수 있습니다. 필요한 부분만 선택
해 학습하면서 숙련도를 높일 수도 있습니다. [표
2
-
1
]은 관련 절, 사용 사례, 분야, 노코드나
로우코드 여부를 보여줍니다.
표
2-1
산업 분야 및 코딩 유형별 사용 사례 목록
관련 절 사용 사례 분야 유형
2
.
1
.
1
제품 가격 소매
N
/
A
2
.
1
.
2
심장 질환 예방 캠페인 헬스케어 로우코드 데이터 전처리