
99
5
장
적대적 입력의 원리
5
장에서는 적대적 사례의 생성을 뒷받침하는 핵심 원리를 살펴봅니다. 복잡한 수식과 구체적
인 기술은 잠시 접어두고, 앞에서 이야기한 내용을 바탕으로 설명을 시작하겠습니다. 세부사항
을 다루기에 앞서, 적절한 비유를 들어 직관적 이해를 돕고자 합니다. 이 장의 목적은 심층 신
경망 (
DNN
)이 적대적 섭동이나 적대적 패치로 인해 어떻게 잘못된 결과를 도출하는지 이해하
는 것입니다.
앞에서 배운 개념을 다시 설명하면 다음과 같습니다.
적대적 섭동
입력 데이터에 분산되어 눈에 보이지 않을 정도의 미세한 변화를 가함으로써 모델이 잘못된 결
과를 도출하도록 합니다. 이미지 데이터에서는 여러 개의 서로 다른 픽셀에 변화를 주어 적대
적 섭동의 효과를 얻습니다.
적대적 패치
모델이 잘못된 결과를 도출하도록 입력 데이터의 특정 부분에 패치(스티커)를 추가하는 방법
입니다. 이미지 데이터에 내부나 측면 등 위치에 상관없이 적용할 수 있습니다. 적대적 패치는
사람이 인식할 수는 있지만, 유해 (양성 )한 것으로 보이지 않으므로 쉽게 지나칠 수 있습니다.
적대적 입력의 원리
CHAPTER
5