
585
14
장
합성곱 신경망을 사용한 컴퓨터 비전
하나의 물체를 분류하고 위치를 잘 추정했지만 (꽃 데이터셋처럼) 이미지에 여러 물체가 들어
있는 경우는 어떻게 해야 할까요?
14.9
객체 탐지
하나의 이미지에서 여러 물체를 분류하고 위치를 추정하는 작업을
객체
탐지
object
detection
라고 합
니다. 몇 년 전까지 널리 사용되던 방법은 하나의 물체를 분류하고 위치를 찾는 분류기를 훈련
한 다음 [그림
14
-
24
]처럼 이미지를 모두 훑는 것입니다. 이 예에서는 이미지를
6
×
8
격자
grid
로 나누고 하나의
CNN
(굵은 검정 사각형 )이 모든
3
×
3
영역을 지나갑니다. 이
CNN
이 이미
지 왼쪽 상단을 지나갈 때 가장 왼쪽에 있는 장미꽃의 일부를 감지합니다.
45
그다음 오른쪽으
로 한 스텝 이동해서 같은 꽃을 다시 감지합니다. 그다음 스텝에서 가장 위쪽에 있는 장미꽃을
감지하기 시작합니다. 다시 오른쪽으로 한 스텝 이동해서 같은 꽃을 감지합니다. 이런 식으로
CNN
이 전체 이미지를 슬라이딩하면서 모든
3
×
3
영역을 봅니다. 또한 객체 크기가 서로 다르
기 때문에
CNN
이 다른 크기의 영역을 슬라이딩할 수 있습니다. 예를 들어
3
×
3
영역이 끝나
면
CNN
이
4
×
4
영역도 슬라이드할 수 있습니다.
그림
14-24
이미지 위를 슬라이딩하면서 여러 물체를 감지합니다 ...