411
8
장
복잡한 데이터셋 생성
8.4.3
개인 식별 정보와 데이터 프라이버시
데이터 프라이버시는 데이터 전문가가 분석을 수행할 때 주의해야 하는 주요 문제입니다. 여
러 속성이 포함된 대용량 데이터셋을 분석하면 좋은 인사이트와 개선 방향 등을 이끌어낼 수
있지만, 데이터셋에 개인 정보 관련 속성이 포함돼 있다면 데이터 수집 및 사용과 관련한 윤리
적, 규제적 문제가 없는지 살펴야 합니다. 환자, 학생, 금융 데이터를 다루는 서비스에서는 오
래전부터 고객 프라이버시 규제가 존재했으며, 최근 몇 년 사이에는 소비자의 데이터 프라이버
시 권리를 규제하는 법률이 제정됐습니다. 유럽 연합 (
EU
)에서 제정한 일반 개인정보 보호법
General
Data
Protection
Regulation
(
GDPR
)이 대표적인 예입니다. 이 외에도 캘리포니아 소비자 개인
정보 보호법
California
Consumer
Privacy
Act
(
CCPA
), 호주 개인정보 보호 원칙
Australian
Privacy
Principles
,
브라질 일반 개인정보 보호법 (
LGPD
) 등이 있습니다.
이러한 규정들은 개인 식별 정보
personally
identifiable
information
(
PII
)의 처리 및 저장에 관한 내용을
다루며, 몇몇 규정에서는 개인 식별 정보의 삭제에 관한 내용까지도 다룹니다.
PII
는 이름, 주
소, 이메일 주소, 생년월일, 사회 보장 번호
social
security
number
등 개인을 특정하는 정보를 의미합
니다. 심장 박동 수, 혈압,