39. U-Net Architecture

코딩소비 2023. 9. 17. 23:46

그림에서 height = width인 image를 예시로. 직사각형에서 height 는 기존 이미지의 height,width를, width는 number of channels를 의미한다.

- 즉 convolution결과 직사각형이 두꺼워지면 number of channels 증가.

- pooling 결과 직사각형이 짧아지면 height, width 감소

Transpose Convolution(하늘색) + skip connection(파란색)

그래... segmentation 이미지를 생성한건 알겠고, YOLO를 통한 객체 탐지도 알았는데 중요한건...

- YOLO에 너무 고해상도 이미지가 들어가서 U-Net을 통해 Semantic Segmentation을 수행했다.

- 근데 이러면 모델을 두번 돌려야하는데 이게 계산비용이 더 크지 않나 모르겠네..