Google ML Bootcamp/4. Convolutional Neural Networks(49)
-
43. Triplet Loss
왜 triplet(삼중항)이냐면, database image(A), positive input image(P), negative input image(N)에 대한 loss를 측정하기 때문. - 세 image에 대해 고려하기 때문에 삼중항이라고 부른다. 목적식은 결국 d(A,P)가 작아지고, d(A,N)이 커지길 원한다. - 또는 적어도 d(A,P)
2023.09.18 -
42. Siamese Network
이때 Network의 최종 output은 input image를 endcoding한 결과라고 볼 수 있는 (128,1) shape의 vector. - 이를 image를 vector로 represent(표현) 했다고도 한다.
2023.09.18 -
41. One Shot Learning
One Shot Learning이란 한번 보고 바로 맞추는건데, 즉 새로운 직원이 들어왔을 때(데이터베이스에 추가) 기존 모델이 바로 input image를 보고 그 사람인지 맞출 수 있냐고 물어본다면 쉽지 않다. = 모델을 재 학습시켜야 하고, 새로운 직원에 대한 데이터도 많아야한다. 따라서 우리는 두 사진을 비교하여 비슷한지, 아닌지를 측정하는 함수가 있다면 이러한 문제를 해결할 수 있다. 따라서 데이터베이스에 새로운 직원의 사진이 추가되기만 한다면 카메라를 통한 input image와 비교하여 similarity를 계산할 수 있다. - 이때 d function은 distance를 의미하므로 두 이미지간 차이를 계산. 따라서 작을수록 similarity가 높은것이다.
2023.09.18 -
40. What is Face Recognition?
생체 감지도 가능..! Face verification vs Face recognition 1. verification - input : image, name, ID - output : whether the input image is that of the claimed person 2. recognition(assumption : has a database of K persons) - input : image - output : ID. if the image is any of the K persons
2023.09.18 -
39. U-Net Architecture
그림에서 height = width인 image를 예시로. 직사각형에서 height 는 기존 이미지의 height,width를, width는 number of channels를 의미한다. - 즉 convolution결과 직사각형이 두꺼워지면 number of channels 증가. - pooling 결과 직사각형이 짧아지면 height, width 감소 Transpose Convolution(하늘색) + skip connection(파란색) 그래... segmentation 이미지를 생성한건 알겠고, YOLO를 통한 객체 탐지도 알았는데 중요한건... - YOLO에 너무 고해상도 이미지가 들어가서 U-Net을 통해 Semantic Segmentation을 수행했다. - 근데 이러면 모델을 두번 돌려야하는..
2023.09.17 -
38. U-Net Architecture Intuition 2023.09.17