
112
2
부
적대적 입력 생성하기
터셋에 대해 다른 의류 범주를 구분하기에 충분할 수 있습니다.
이 개념을 염두에 두고 입력 공간과 돌출이 적대적 입력의 생성과 어떤 관련이 있는지 살펴보
겠습니다.
5.3
섭동 공격: 변화의 최소화, 영향의 최대화
지금까지 학습한 적대적 사례는
DNN
모델의 입력 공간에서 미확인 영역의 결함을 악용해 잘
못된 예측을 유도합니다. 이 사례는 사람이 눈치채지 못할 섭동이나 패치를 소개합니다.
3
어
떤 섭동이 무해한 (양성 ) 이미지를 적대적 이미지로 바꾸더라도, 데이터의 변화를 최소화하고
DNN
이 생성한 결과에 미치는 영향은 최대화해야 한다는 광범한 원칙이 있습니다.
Fashion
-
MNIST
에서 ‘코트’ 이미지에 약간의 섭동을 추가해보겠습니다. 몇 개의 두드러진 픽
셀에 변화를 주거나 많은 픽셀에 매우 미세한 변화를 주어 오분류를 유발하는 문제를 고려해봅
시다. 이미지에서 선택한 픽셀을 변경하면 입력 공간을 통해 다른 위치로 이동하여 원래 [그림
5
-
2
]에서 설명한 예측 지도의 곳곳으로 이동합니다. 이 이동은 원래 이미지 위치 (원으로 표
시)에서 대치 이미지 위치 (삼각형으로 표시 )로 가는 화살표로 [그림
5
-
8
]에 표시되었습니다.
한편, 이미지는 입력 공간 내의 위치가 더이상 ‘코트’ 분류 영역 내에 있지 않도록 변경되어야
합니다. ...