Google ML Bootcamp(181)
-
37. Transpose Convolutions
convolution은 기존 image에 filter를 올려놓았지만 반대로 작동하는 것. 이때 작은 차원을 고차원으로 만드는 여러가지 방법이 있겠지만 이런 transpose convolution을 이용하여 filter 의 weight를 학습시키는 것이 실제로 효과적임은 보여진다.
2023.09.17 -
36. Semantic Segmentation with U-Net
뭘 하고자 하는지 알겠지. input image를 주면 각 영역이 무엇을 의미하는지 나타내려고 하는 것. - Y는 image 크기의 matrix가 될 뿐이다.
2023.09.17 -
35. Region Proposals(Optional) 2023.09.17
-
34. YOLO Algorithm
이때 각 class에 대해 독립적으로 non-max 적용 - 반복적으로 가장 큰 P(c)만 prediction으로, 나머지는 IOU에 따라 제거하는 방식으로 반복 = 같은 물체에 대해 여러개 판독 가능 - 이걸 각 class 마다 반복해서 결국 모든 class에 대해 image 내에 객체를 탐지 가능.
2023.09.17 -
33. Anchor Boxes
지금까지 살펴본 YOLO는 하나의 격자에 하나의 물체만 탐지 가능. 만약 한 격자에 car 뿐만 아니라 pedestrian도 있다면? - Anchor Boxes 를 이용. 각각 anchor box에 대한 결과를 concat하여 Y를 구성. ** 중요 : YOLO의 문제점 인지** 문제는 각 object의 anchor box가 동일 혹은 비슷하거나. anchor box 개수보다 탐지해야할 object 수가 많다면.... 해결할 수 없다.
2023.09.17 -
32. Non-max Suppression
이때 동일한 물체에 대해 P(c) = 1 인 여러 격자 중 P(c) 의 probability를 관찰하여 가장 큰 값을 기준으로 bounding box를 설정. - 이게 non-max suppression. (max만 출력하고 non-max 값들은 suppression 억제 할 것을 의미.) 1. 모든 격자에 대해 P(c) >= 0.6 만 남기고 제거 2. 남은 격자들 중 가장 큰 P(c)에 대해 output1으로 설정. 3. 이후 남은 격자들 중에 IOU를 계산하여 0.5이하 제거 4. 이후 남은 격자들 중에서 가장 큰 P(c)에 대해 output2으로 설정 5. 3-4단계 계속 반복 따라서 한 image에 car가 여러개더라도 반복문을 통해 여러 차의 bounding box를 구할 수 있다.
2023.09.17