39. U-Net Architecture
2023. 9. 17. 23:46ㆍGoogle ML Bootcamp/4. Convolutional Neural Networks
그림에서 height = width인 image를 예시로. 직사각형에서 height 는 기존 이미지의 height,width를, width는 number of channels를 의미한다.
- 즉 convolution결과 직사각형이 두꺼워지면 number of channels 증가.
- pooling 결과 직사각형이 짧아지면 height, width 감소
Transpose Convolution(하늘색) + skip connection(파란색)
그래... segmentation 이미지를 생성한건 알겠고, YOLO를 통한 객체 탐지도 알았는데 중요한건...
- YOLO에 너무 고해상도 이미지가 들어가서 U-Net을 통해 Semantic Segmentation을 수행했다.
- 근데 이러면 모델을 두번 돌려야하는데 이게 계산비용이 더 크지 않나 모르겠네..
'Google ML Bootcamp > 4. Convolutional Neural Networks' 카테고리의 다른 글
41. One Shot Learning (0) | 2023.09.18 |
---|---|
40. What is Face Recognition? (0) | 2023.09.18 |
38. U-Net Architecture Intuition (0) | 2023.09.17 |
37. Transpose Convolutions (0) | 2023.09.17 |
36. Semantic Segmentation with U-Net (0) | 2023.09.17 |