[DL] YOLO 모델들 주요 특징 정리 (v1 부터 v12까지)

728x90

YOLO는 2016년 YOLOv1부터 시작하여, 매 버전마다 새로운 기술과 혁신을 도입해왔다. 아래 표는 YOLOv1부터 YOLOv12까지의 주요 특징을 정리한 것이다.

 

버전 (연도) 주요 특징 참고 문헌
YOLOv1 (2016) 단일 단계 객체 검출기를 도입한다. 이미지 그리드를 분할한 후 바운딩 박스와 클래스 확률을 한 번에 예측한다 (실시간 45 FPS이다). Redmon et al., CVPR 2016
YOLOv2 (2017) 앵커 박스를 도입하고 멀티 스케일 학습을 수행하며, YOLO9000을 발표한다. 배치 정규화와 높은 해상도 입력을 통해 정확도를 향상시킨다. Redmon & Farhadi, CVPR 2017
YOLOv3 (2018) 더 깊은 Darknet-53 백본을 사용하며, 3 스케일 예측 및 로지스틱 클래스 분류를 도입한다. 다중 라벨 지원을 한다. Redmon & Farhadi, 2018 (arXiv)
YOLOv4 (2020) CSPDarknet53 백본과 PANet neck, Mosaic augmentation 등 다양한 기술을 적용하여 mAP를 향상시킨다. Bochkovskiy et al., 2020
YOLOv5 (2020) 최초의 PyTorch 기반 YOLO를 제공하며, SPPF 모듈 및 다양한 데이터 증강 기법을 도입한다. 여러 크기의 모델을 제공한다. Ultralytics (비공식 논문)
YOLOv6 (2022) 앵커 프리 디자인 및 효율적인 디커플드 헤드를 도입한다. 산업용 응용과 YOLOv6-Seg를 지원한다. Li et al., 2022 (Meituan)
YOLOv7 (2022) Extended ELAN (E-ELAN) 및 모델 재파라미터화 기법을 도입하며, 객체 추적 및 인스턴스 분할을 지원한다. Wang et al., 2022 (ArXiv)
YOLOv8 (2023) 객체 검출, 인스턴스 분할, 포즈 추정, 분류를 단일 코드베이스로 지원한다. Decoupled Head와 C2f 모듈을 도입한다. Ultralytics (2023)
YOLOv9 (2024) Programmable Gradient Information (PGI)와 Reversible CSP, GELAN을 도입하여 경량 모델의 성능을 개선한다. Wang et al., 2024 (ArXiv)
YOLOv10 (2024) NMS-free 디자인과 대형 커널 컨볼루션, 부분 Attention을 적용하며, One-to-Many/One-to-One 헤드 구조를 도입한다. Ao Wang et al., 2024
YOLOv11 (2024) CSP와 Self-Attention을 결합한 C2PSA 모듈과 C3k2 병목 블록을 도입하며, 파라미터를 22% 절감하여 정확도와 효율성을 모두 개선한다. Ultralytics (2024)
YOLOv12 (2025) Area Attention (A2) 모듈, Residual ELAN (R-ELAN) 백본, FlashAttention 등을 도입하여 CNN과 Transformer의 장점을 결합한다. Tian, Ye, Doermann, 2025 (ArXiv)

 

728x90

'NewTechs > Summary' 카테고리의 다른 글

[LLM] DeepSeek 관련 정보 정리  (1) 2025.02.01