현재 위치 - 법률 상담 무료 플랫폼 - 특허 조회 - 표적 탐지 진화 YOLO v 1-v5
표적 탐지 진화 YOLO v 1-v5
표적 탐지는 컴퓨터 시각 및 이미지 처리와 관련된 컴퓨터 기술로, 한 사진에서 특정 대상의 유형을 식별하고 대상의 위치를 표시해야 합니다. 표적 탐지는 얼굴 검출, 자동운전, 영상 감시 등 영상 분야에서 광범위하게 응용되고 있다.

목표 탐지에서 일반적으로 사용되는 방법은 1 단계 방법과 2 단계 방법으로 나눌 수 있습니다. 1 단계 방법은 먼저 그림을 입력하고, 경계 상자 (bbox) 와 분류 레이블을 출력하며, 네트워크에서 완성한다. YOLO 와 SSD 는이 방법의 주요 대표자입니다. 2 단계 방법은 f.a.s.t.-rcnn 으로 표시됩니다. 그림을 입력한 후 먼저 영역 제안을 생성한 다음 분류기에 입력하여 분류합니다. 이 두 가지 작업은 서로 다른 네트워크에 의해 수행됩니다.

그 중에서도 YOLO 표적 탐지는 뛰어난 알고리즘으로' 한 번만 보세요' 라는 줄임말로 한 번만 훑어보면 사진 속 물체의 범주와 위치를 식별할 수 있어 검출 속도와 정확도의 완벽한 균형을 이룬다는 뜻이다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), Northern Exposure (미국 TV 드라마), 성공명언) YOLO 도 최초 YOLO v 1 에서 최신 YOLO V5 로 발전했다.

20 15 년, YOLO v 1 1 판이 제시되었고, YOLO 는 구글넷을 참고하여 Darknet 네트워크를 제안했다. Darknet 은 C 언어와 CUDA 로 작성된 오픈 소스 신경망 프레임워크입니다. 1x 1 컨볼 루션 레이어 +3x3 컨볼 루션 레이어가 GoogleNet 의 Inception 모듈을 대체합니다. 네트워크는 그림 1 과 같이 24 개의 컨볼 루션 레이어와 2 개의 전체 연결로 구성됩니다.

YOLO v 1 의 프레임은 그림 2 와 같습니다. 먼저 이미지 크기를 448×448 로 조정한 다음 CNN 에 이미지를 입력하고 마지막으로 NMS 를 통해 최종 보정 프레임을 저장합니다.

YOLO v 1 의 핵심 아이디어는 대상 감지를 회귀 문제로 간주하고 화면을 SxS 개의 그리드로 나누고 대상 중심이 하나의 그리드 셀에 떨어지면 해당 그리드가 대상을 감지하는 것입니다. 각 그리드 셀은 B 경계 상자 (bbox) 및 범주 정보를 예측합니다. 또한 각 bbox 에는 예측 (x, y, w, h) 및 신뢰도 ***5 개 값이 필요합니다. 따라서 마지막으로 각 메시는 B bbox 와 C 클래스를 예측하고 마지막으로 S x S x (5*B+C) 의 텐서를 출력합니다.

이점:

YOLO v2 는 YOLO v 1 을 기반으로 일련의 개선을 통해 분류 정확도를 유지하면서 목표 포지셔닝의 정확도와 리콜률을 높였습니다. 첫째, YOLO v2 는 다양한 입력 크기에 적응할 수 있으며, 필요에 따라 감지 정확도와 감지 속도를 측정할 수 있습니다. 둘째, 계층 분류에 따라 단어 트리를 사용하여 테스트 데이터 세트와 분류 데이터 세트를 혼합합니다. 마지막으로 테스트 및 분류 데이터 세트에서 동시에 수행할 수 있는 공동 교육 방법을 제시했습니다. 테스트 데이터 세트는 모델 인식 부분을 교육하는 데 사용되고, 분류 데이터 세트는 모델 분류 부분을 교육하여 테스트 유형을 확장하는 데 사용됩니다.

YOLO v 1 보다 구체적인 개선 사항은 다음과 같습니다.

그러나 YOLO v2 는 여전히 같은 메쉬 내의 객체 겹침 문제를 해결하지 못합니다. YOLO v3 은 YOLO v2 를 기반으로 몇 가지 개선 사항을 계속했습니다.

2020 년 4 월 YOLO v4 가 발표되었습니다. MS COCO 데이터 세트의 정확도는 AP 43.5%, 속도는 65FPS 로 각각 YOLO v3 보다 10%, 12% 높습니다.

YOLO v4 는 먼저 관련 작업을 요약하고 대상 감지 프레임워크를 분할합니다.

물체 감지 = 척추+목+머리

또한 모든 조율 방식은' 경품 한 봉지' 와' 특가 한 봉지' 로 나뉜다.

YOLO v4 는 위의 튜닝 기술을 요약하여 최적의 조합을 찾습니다. 훈련 과정에서 무료 사은품과 전문 사은품이 YOLO v4 에 미치는 영향이 검증되었다.

YOLO v4 가 출시된 지 40 여 일 후 Ultralytics 는 PyTorch 를 기반으로 하는 비공식적인 YOLO V5 를 공개했다. 각 그림의 추리 시간은 140 FPS 이고, YOLOv5 의 가중치 파일 크기는 YOLOv4 의 1/9 에 불과하다는 점에 유의해야 합니다. YOLO V5 더 빠르고 작아요!

YOLO 의 상술한 발전 과정을 보면, YOLO 시리즈는 개발 후기에 응용 착지에 더 많은 관심을 기울이고, 매우 참신한 혁신을 제시하지 않았다는 것을 알 수 있다.