전체 글(327)
-
34. YOLO Algorithm
이때 각 class에 대해 독립적으로 non-max 적용 - 반복적으로 가장 큰 P(c)만 prediction으로, 나머지는 IOU에 따라 제거하는 방식으로 반복 = 같은 물체에 대해 여러개 판독 가능 - 이걸 각 class 마다 반복해서 결국 모든 class에 대해 image 내에 객체를 탐지 가능.
2023.09.17 -
33. Anchor Boxes
지금까지 살펴본 YOLO는 하나의 격자에 하나의 물체만 탐지 가능. 만약 한 격자에 car 뿐만 아니라 pedestrian도 있다면? - Anchor Boxes 를 이용. 각각 anchor box에 대한 결과를 concat하여 Y를 구성. ** 중요 : YOLO의 문제점 인지** 문제는 각 object의 anchor box가 동일 혹은 비슷하거나. anchor box 개수보다 탐지해야할 object 수가 많다면.... 해결할 수 없다.
2023.09.17 -
32. Non-max Suppression
이때 동일한 물체에 대해 P(c) = 1 인 여러 격자 중 P(c) 의 probability를 관찰하여 가장 큰 값을 기준으로 bounding box를 설정. - 이게 non-max suppression. (max만 출력하고 non-max 값들은 suppression 억제 할 것을 의미.) 1. 모든 격자에 대해 P(c) >= 0.6 만 남기고 제거 2. 남은 격자들 중 가장 큰 P(c)에 대해 output1으로 설정. 3. 이후 남은 격자들 중에 IOU를 계산하여 0.5이하 제거 4. 이후 남은 격자들 중에서 가장 큰 P(c)에 대해 output2으로 설정 5. 3-4단계 계속 반복 따라서 한 image에 car가 여러개더라도 반복문을 통해 여러 차의 bounding box를 구할 수 있다.
2023.09.17 -
31. Intersection Over Union
교집합 / 합집합 비율이 0.5 이상이라면 잘 예측한 것으로 판단. - 즉 localization의 결과를 평가할 수 있는 기준.
2023.09.17 -
30. Bounding Box Predictions
Solution : YOLO(You Only Look Once) algorithm 이때 YOLO는 9개의 이미지에 대해 각각 ImageNet을 돌리는게 아니라 Window Sliding(stride = window size)인 채로 한번에 학습을 진행한다. - 이때 Y.shape : (3,3,8)이 된다. 각 격자에 대해 ImageNet하나를 돌렸을때 softmax 결과가 8차원이므로. - Fully Connected layer가 아닌 Convolution 구현임으로 계산 비용이 낮아 실시간 탐지에도 사용될 수 있는 알고리즘이다. 의문인 것은.. 객체의 빨간색 테두리가 격자의 범위를 벗어났는데 bx,by,bh,bw를 어떻게 올바르게 설정할 수 있을까? 9개의 image에 대해서 각각 ImageNet을 수..
2023.09.17 -
29. Convolutional Implementation of Sliding Windows
기존 Sliding window의 문제점은 crop 마다 imageNet을 통한 output을 생성해야 하는 computation cost였다. - 그렇다면 하나씩 실행한 결과 softmax.shape : (4,1) 를 한번에 모아놓는건 안될까? 그럼 계산 한번만 하면 되는데.
2023.09.17