Skip to Content
SQL로 시작하는 데이터 분석
book

SQL로 시작하는 데이터 분석

by 캐시 타니무라, 박상근
August 2022
Beginner to intermediate
436 pages
9h 43m
Korean
Hanbit Media, Inc.
Content preview from SQL로 시작하는 데이터 분석
239
5
텍스트 분석
지금까지 텍스트 분석에
SQL
을 사용하면 적합한 경우와 그렇지 않은 경우를 알아봤습니다.
SQL
코드를 작성하기에 앞서 텍스트 분석 예제로 사용할 데이터셋을 알아봅시다.
5.2
데이터셋:
UFO
목격 보고
이 장 예제에서는 미국
UFO
보고 센터
1
에서 편찬한
UFO
목격 보고 데이터셋을 사용합니다.
데이터셋은
2006
년부터
2020
년까지 작성된 약
95
,
000
개의 보고서로 구성됩니다. 보고서는
개인이 온라인 포럼을 통해 작성한 것입니다.
이 책의 깃허브에서
ufo
테이블 생성 코드를 제공하며, 이 테이블은 단 두 개의 필드로 구성됩
니다.
sighting
_
report
필드에는
UFO
목격 날짜, 보고 날짜, 게시 날짜 그리고 목격 위치와
UFO
의 모양, 목격 지속 시간 등의 메타데이터가 저장돼 있으며,
description
필드에는 목격
에 대한 서술이 텍스트로 저장돼 있습니다. [그림
5
-
1
]은 샘플 데이터입니다.
그림
5-1
ufo
테이블 샘플
이 데이터셋을 이용한 예제를 살펴보면서, 첫 번째 열
sighting
_
report
에 저장된 데이터를
구조화해 저장하는 방법과 두 번째 열
description
의 데이터를 활용한 다양한 분석 방법을
알아봅니다. 분석을 수행할 때 데이터를 처리하고 구조화된 결과 데이터를 새로운 테이블에 저
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

견고한 데이터 엔지니어링

견고한 데이터 엔지니어링

조 라이스, 맷 하우슬리
행동 데이터 분석

행동 데이터 분석

플로랑 뷔송
데이터 과학을 위한 통계(2판)

데이터 과학을 위한 통계(2판)

이준용, 피터 브루스, 앤드루 브루스, 피터 게데크

Publisher Resources

ISBN: 9791169210089