
42
로우코드 AI
반정형 데이터
는 정형 데이터와 비정형 데이터의 중간쯤에 해당하는 데이터 유형입니다. 표 형
식과 같은 데이터 모델은 없지만, 태그와 시맨틱 표시자
semantic
marker
와 같은 정보가 포함될 수
있습니다. 반정형 데이터는 본질적으로 정형 데이터와 비정형 데이터를 조합한 것입니다. 가령
동영상 파일에 날짜나 위치와 같은 메타 태그가 포함될 수 있지만, 그 안의 정보는 구조화되어
있지 않습니다.
다음은 반정형 데이터의 몇 가지 예시입니다.
•
CSV
,
XML
,
JSON
파일
•
HTML
•
이메일: 정형 데이터만큼은 아니지만, 어느 정도 구조가 정해져 있기에 반정형 데이터로 간주합니다. 일반
적으로 헤더, 본문, 첨부 파일로 구성되죠. 헤더에는 발신자, 수신자, 메시지 날짜에 관한 정보가 포함되며,
본문에는 메시지 텍스트가 포함됩니다.
[그림
2
-
9
]는 비정형, 반정형, 정형 데이터를 비교한 그림입니다.
그림
2-9
비정형, 반정형, 정형 데이터 예시
1
2.2.3
데이터 파일 형식
데이터 파일의 형식은 다양하며, 형식마다 용도가 있습니다. [표
2
-
3
]은 가장 일반적인 데이터
파일의 유형을 몇 가지 보여줍니다.
1
옮긴이_ 이메일의 실제 내용(텍스트)은 비정형 데이터로 간주하지만, 정해진 카테고리별로 이메일을 분류할 수 있으니 반정형