
126
2
부
적대적 입력 생성하기
대체 모델 사용하기: 복제 공격/전송 공격
적대적 입력을 개발하고 테스트하기 위해 대상
DNN
의 사본이나 근사치 역할을 하는
DNN
을 교체해서 사용하는 것이 가능합니다. 이러한 방식으로 공격자는 실제 대상에 공격을 개
시하기 전에 대체 신경망에서 ‘화이트 박스’ 또는 ‘점수 기반 블랙박스’ 방법을 사용해 공격을
개발할 수 있습니다.
이 접근법은 공격을 세분화하는 동안 적대적 방식을 은밀하게 유지할 수 있다는 이점이 있습
니다. 실제 모델에 접근해서 처리하면 의심을 받습니다. 공격자가 실제 모델에 접근할 수 없
을 때 사용할 수 있는 유일한 방법입니다.
대체 모델이 대상 모델과 동일하면 이를 복제 공격이라고 합니다. 모델이 대상 모델과 유사
할 경우 적대적 입력이 대상 알고리즘으로 전달되어야 성공하기 때문에 전송 공격이라고 합
니다.
6
장에서 설명하는 화이트 박스, 점수 기반 블랙박스, 제한된 블랙박스 방법이 최종 대상이나
대체물에 사용된다고 해서 위협을 받는 실제 대상
DNN
에 공격자가 접근하거나 그
DNN
을
완전히 안다고 할 수는 없습니다. 자세한 내용은
7
장에서 다룹니다.
6.1
화이트 박스
화이트 박스 방법은
DNN
모델 (매개변수와 아키텍처 )에 대한 완전한 정보가 필요하며 수학적
최적화 방법을 사용합니다 입력 공간의 예측 ...