728x90
YOLO는 2016년 YOLOv1부터 시작하여, 매 버전마다 새로운 기술과 혁신을 도입해왔다. 아래 표는 YOLOv1부터 YOLOv12까지의 주요 특징을 정리한 것이다.
버전 (연도) | 주요 특징 | 참고 문헌 |
YOLOv1 (2016) | 단일 단계 객체 검출기를 도입한다. 이미지 그리드를 분할한 후 바운딩 박스와 클래스 확률을 한 번에 예측한다 (실시간 45 FPS이다). | Redmon et al., CVPR 2016 |
YOLOv2 (2017) | 앵커 박스를 도입하고 멀티 스케일 학습을 수행하며, YOLO9000을 발표한다. 배치 정규화와 높은 해상도 입력을 통해 정확도를 향상시킨다. | Redmon & Farhadi, CVPR 2017 |
YOLOv3 (2018) | 더 깊은 Darknet-53 백본을 사용하며, 3 스케일 예측 및 로지스틱 클래스 분류를 도입한다. 다중 라벨 지원을 한다. | Redmon & Farhadi, 2018 (arXiv) |
YOLOv4 (2020) | CSPDarknet53 백본과 PANet neck, Mosaic augmentation 등 다양한 기술을 적용하여 mAP를 향상시킨다. | Bochkovskiy et al., 2020 |
YOLOv5 (2020) | 최초의 PyTorch 기반 YOLO를 제공하며, SPPF 모듈 및 다양한 데이터 증강 기법을 도입한다. 여러 크기의 모델을 제공한다. | Ultralytics (비공식 논문) |
YOLOv6 (2022) | 앵커 프리 디자인 및 효율적인 디커플드 헤드를 도입한다. 산업용 응용과 YOLOv6-Seg를 지원한다. | Li et al., 2022 (Meituan) |
YOLOv7 (2022) | Extended ELAN (E-ELAN) 및 모델 재파라미터화 기법을 도입하며, 객체 추적 및 인스턴스 분할을 지원한다. | Wang et al., 2022 (ArXiv) |
YOLOv8 (2023) | 객체 검출, 인스턴스 분할, 포즈 추정, 분류를 단일 코드베이스로 지원한다. Decoupled Head와 C2f 모듈을 도입한다. | Ultralytics (2023) |
YOLOv9 (2024) | Programmable Gradient Information (PGI)와 Reversible CSP, GELAN을 도입하여 경량 모델의 성능을 개선한다. | Wang et al., 2024 (ArXiv) |
YOLOv10 (2024) | NMS-free 디자인과 대형 커널 컨볼루션, 부분 Attention을 적용하며, One-to-Many/One-to-One 헤드 구조를 도입한다. | Ao Wang et al., 2024 |
YOLOv11 (2024) | CSP와 Self-Attention을 결합한 C2PSA 모듈과 C3k2 병목 블록을 도입하며, 파라미터를 22% 절감하여 정확도와 효율성을 모두 개선한다. | Ultralytics (2024) |
YOLOv12 (2025) | Area Attention (A2) 모듈, Residual ELAN (R-ELAN) 백본, FlashAttention 등을 도입하여 CNN과 Transformer의 장점을 결합한다. | Tian, Ye, Doermann, 2025 (ArXiv) |
728x90
'NewTechs > Summary' 카테고리의 다른 글
[LLM] DeepSeek 관련 정보 정리 (1) | 2025.02.01 |
---|