
94
1
부
LLM의 구성 요소
서 개인식별정보를 없애거나 모델이 이를 암기하지 못하도록 하는 것이 바람직합니다. 하지만
여기에 유명 인사의 개인식별정보가 포함된다면 문제가 더 복잡해집니다. 모델이 유명 인사의
생년월일과 같은 사실적 질문에 정확히 답하기를 원하면서도 개인정보 보호라는 가치와 투명
성과 개방성이라는 가치가 충돌하게 됩니다. 누구를 ‘유명 인사’로 간주할지, 이들에게 어느 수
준까지 개인정보 보호를 적용할지는 기술적이면서도 사회적으로 매우 복잡한 문제입니다.
개인정보로 분류되는 데이터에는 이름, 주소, 신용카드 번호, 정부 발급 신분증 번호, 의료 기
록과 진단 정보, 이메일 주소, 전화번호, 개인의 정체성이 드러나는 소속 집단 (예: 종교, 인종,
노동조합), 위치 정보 등이 포함됩니다.
개인정보 침해 공격은 표적 공격과 비표적 공격으로 나뉩니다. 비표적 공격은 모델을 이용해
대량의 텍스트를 생성한 후, 멤버십 추론 공격으로 암기된 가능성이 높은 텍스트를 찾아내는
방식입니다. 반면 표적 공격은 특정 개인이나 집단의 개인정보를 직접 복구하려는 시도입니
다. 표적 공격은 상대적으로 훨씬 어려운데, 이는 언어 모델이 정보를 암기하는 데는 능숙하지
만, 특정 이메일 주소가 어떤 개인과 연결되는지를 파악하는
연관 짓기
능력은 부족하기 때문입
니다.
연습 문제 ...