1. Object Detection
Object Detection은 컴퓨터비전, 영상처리와 관계가 깊은 기술이다.
- Classification: 이미지가 어떤 클래스에 속하는지 분류
- Classification + Localization: 이미지 속의 객체 분류 + bbox 위치 찾기 (객체 하나)
- Object Detection: 이미지 속의 객체 분류 + bbox 위치 찾기 (객체 여러개)
- image classification task에 bbox를 찾는 regression task가 추가된 것
- Instance Segmenataion: 이미지 속의 객체 분류 + 픽셀 단위로 위치 찾기 (객체 여러개)
2. Bounding box
H*W 크기의 이미지일 때, 좌측 상단이 (0,0), 우측 하단을 (W, H)로 표현한다.
하지만, 픽셀값으로 효율적인 연산을 하기 위해 (W, H)를 최대값 (1, 1)로 변환한다.
하지만, 다양한 해상도의 이미지를 처리하고 bbox 좌표를 그대로 사용하면 loss값이 너무 커질 수 있어 (W, H)를 정규화해 최대 (1, 1)값을 갖도록 한다.
3. Object Detection 모델 종류
object detection 모델은 크게 2-stage, 1-stage로 나뉘며 아래 과정으로 이루어진다.
- region proposal: 물체가 있을만한 영역을 빠르게 찾는 알고리즘
- classification: 특정 객체가 어떤 물체인지(클래스에 속하는지) 분류
3-1. 2-stage detector
- region proposal → classification 순차적으로 수행한다.
- 정확도 측면에서는 좋지만, 예측 속도가 느려 실시간 탐지에 제한적이다.
- R-CNN 계열 모델이 2-stage 종류에 속한다. (R-CNN, Fast R-CNN, Faster R-CNN)
3-2. 1-stage detector
- classification과 region proposal을 한번에 수행한다.
- 2-stage보다 예측 속도가 빠르지만 정확도가 낮다.
- YOLO, SSD, RetinaNet 모델이 1-stage 종류에 속한다.
참고 자료
'Deep Learning > Object Detection' 카테고리의 다른 글
NMS (Non Maximum Suppression) (0) | 2022.09.04 |
---|---|
성능 평가 지표 3(속도) (0) | 2022.09.04 |
IoU (Intersection over Union) (0) | 2022.09.03 |
성능 평가 지표 2 (0) | 2022.09.03 |
성능 평가 지표 1 (0) | 2022.09.03 |