November 2023
Beginner to intermediate
344 pages
3h 47m
Korean

스테판 베일리(Stephen Bailey) 박사
비즈니스 프로세스를 변환하고 자동화할 수 있는 데이터의 능력 때문에 데이터는 ‘새로운 금’으로 불립니다. 그렇지만 사생활 보호에 대한 인권을 침해할 수 있는 능력 때문에 ‘새로운 우라늄’이라고 불리기도 합니다. 원자력 엔지니어가 금과 우라늄의 근본적인 차이점을 쉽게 나열할 수 있듯이, 데이터 엔지니어도 위험한 데이터와 안전한 데이터를 본능적으로 식별하고 두 종류의 데이터를 분리하는 방법을 알아야 합니다.
예를 들어 매사추세츠 종합 병원(MGH)에서 진료받은 유명인의 의료 기록을 재식별한 링크 공격을 생각해보세요. 1997년 MGH는 데이터베이스에서 이름과 환자 ID가 제거된 약 15,000개의 기록을 공개했습니다. 이러한 예방 조치에도 불구하고, 하버드 연구원 라타냐 스위니Latanya Sweeney는 우편 번호와 생년월일, 성별이라는 3가지 간접 식별자를 이용해 공개적으로 사용 가능한 유권자 정보를 익명화된 의료 기록과 연결할 수 있었습니다. 그 결과 스위니는 (꼼꼼히 살펴보기만 하면) 매사추세츠 주지사까지 포함하는 다수의 개인을 재식별하기에 충분한 적은 수의 기록을 얻었습니다.
20년이 지나 모든 비즈니스가 MGH가 되었고 인터넷을 사용할 수 ...