대상 감지 작업에는 이미지에서 특정 대상의 위치를 확인하고 분류하는 작업이 포함됩니다. R-CNN 및 해당 변형과 같은 이전 방법은 파이프를 사용하여 여러 단계에서 이 작업을 수행합니다. 각 개별 구성 요소는 개별적으로 교육해야 하기 때문에 속도가 느리고 최적화하기 어려울 수 있습니다.
특성
YOLO 는 물체 감지를 회귀 문제로 재정의합니다. 단일 컨볼 루션 신경망 (CNN) 을 전체 이미지에 적용하고, 이미지를 메쉬로 나누고, 각 메쉬의 클래스 확률과 경계 상자를 예측합니다.
이 알고리즘은 또한 경계 상자에서 물체의 확률을 예측할 수 있습니다. 객체의 중심이 그리드 셀에 떨어지면 그리드 셀은 객체를 탐지합니다. 각 메시에는 여러 개의 경계 상자가 있습니다. 훈련에서, 우리는 대상당 하나의 포위 상자만 있기를 바란다. 따라서 어떤 상자가 지면 참 상자와 가장 겹치는지에 따라 상자를 할당하여 오브젝트를 예측합니다.