
40
로우코드 AI
그림
2-8
자동차 가격 책정 모델에 기여하는 데이터 요소들
2.2
데이터 및 파일 유형
데이터는 중요한 첫 단계이므로 몇 가지 기본 용어와 개념을 살펴보겠습니다. 만약 정량적 데
이터와 정성적 데이터, 정형 데이터와 반정형 데이터, 비정형 데이터, 배치 데이터와 스트리밍
데이터의 차이를 이미 안다면
2
.
3
절 ‘깃허브와 구글 코랩 개요’로 건너뛰어도 좋습니다.
2.2.1
정량적 및 정성적 데이터
데이터 분석에서 다뤄지는 데이터의 유형에는 정량적 데이터와 정성적 데이터가 있습니다. 정
량적 데이터는 세거나 측정할 수 있는 수치입니다. 웹사이트를 방문한 사람의 수, 제품 구매 빈
도, 회계연도 수익, 기계 고장 빈도 등을 예로 들 수 있습니다. 구체적인 수치를 제공하므로 명
확히 분석할 수 있습니다.
정성적 데이터는 측정하거나 계산할 수 없는 데이터를 말합니다. 숫자가 아닌 언어로 표현된
서술형 데이터로 볼 수 있죠.
ML
에서 데이터를 이 둘로 구분하는 게 왜 중요할까요? 정성적 데
이터를
ML
모델에 직접 입력할 수 없기 때문입니다. 따라서 정성적 데이터를 정량적 데이터로
변환하는 전처리 과정이 필요합니다. 정성적 데이터를 처리하는 방법은
3
장에서 다룹니다.
자동차 가격
시계열 데이터
시장 가격 데이터
자동차 데이터
위치 데이터
매출 데이터