Google ML Bootcamp/4. Convolutional Neural Networks
39. U-Net Architecture
코딩소비
2023. 9. 17. 23:46
그림에서 height = width인 image를 예시로. 직사각형에서 height 는 기존 이미지의 height,width를, width는 number of channels를 의미한다.
- 즉 convolution결과 직사각형이 두꺼워지면 number of channels 증가.
- pooling 결과 직사각형이 짧아지면 height, width 감소
Transpose Convolution(하늘색) + skip connection(파란색)
그래... segmentation 이미지를 생성한건 알겠고, YOLO를 통한 객체 탐지도 알았는데 중요한건...
- YOLO에 너무 고해상도 이미지가 들어가서 U-Net을 통해 Semantic Segmentation을 수행했다.
- 근데 이러면 모델을 두번 돌려야하는데 이게 계산비용이 더 크지 않나 모르겠네..