YOLO: 객체 검출을 단일 회귀 문제로 재정의한 혁신적 패러다임

1. 서론: 객체 인식 패러다임 전환

객체 인식(Object Detection)은 “무엇(What)”과 “어디(Where)”를 동시에 해결하는 문제입니다.
전통적으로는 R-CNN 계열의 2단계 방식(영역 제안 -> 분류)이 주류였지만, 파이프라인이 복잡하고 추론 속도가 느렸습니다.

YOLO(You Only Look Once)는 이를 단일 단계(1-stage) 회귀 문제로 재정의했습니다.

객체 검출을 (x, y, w, h, class_prob) 예측 문제로 일체화해 속도/효율을 크게 높였습니다.

입력을 SxS 그리드로 나누고 각 셀이 객체 존재 여부와 박스를 예측합니다.
영역 제안과 분류를 분리하지 않고 한 번에 처리합니다.

이미지 전체를 한 번에 보므로 주변 문맥까지 반영되어 일반화에 유리합니다.

버전	백본 네트워크	핵심 특징	주요 개선
YOLO v1 (2016)	Custom CNN	단일 스케일 회귀 예측	실시간 검출(약 45 FPS) 출발점
YOLO v2 / YOLO9000 (2017)	Darknet-19	Anchor Box, BN 도입	mAP 향상, 클래스 확장
YOLO v3 (2018)	Darknet-53 (Residual)	다중 스케일 예측, 독립 로지스틱 분류	소형 객체 성능 및 정밀도 향상

YOLO는 객체 검출을 “빠른 단일 회귀 문제”로 재해석해 실시간 비전의 표준을 만든 모델 계열입니다.
v1의 단순한 출발에서 v2의 구조 개선, v3의 다중 스케일 정밀화로 발전했고, 이후 YOLO 계열 확장의 기반이 되었습니다.