전체 글(327)
-
46. What are deep ConvNets learning?
Visualizing and Understanding Convolutional Networks, 2013, Zeiler and Fergus. - 각 convolution 단계에서 unit이 무엇을 학습하는지, 설명하는걸 되게 시각적으로 잘 표현함. 시간되면 읽어봐도 좋을 논문. 이때 9개의 Image patch라고 부르는 것이 filters인지는 모르겠다. 뉴런이라고 표현하는데 unit일지.. 하지만 각 layer에 존재하는 neuron이라고 한다면 unit일 것 같고,각 unit 마다 어느 한 종류의 패턴을 중점적으로 나타내려는 것으로 보인다. 그렇다면 unit=9인 에시를 드는건가? - 아니. layer에서 unit 하나를 pick - 이후 9가지의 image patch를 input으로 하여 해당 u..
2023.09.18 -
45. What is Neural Style Transfer? 2023.09.18
-
44. Face Verification and Binary Classification
k는 component index를 의미. 결국 output은 같은 사람 인지, 아닌지의 이중 분류 문제이므로 output layer : sigmoid activation function 사용. - 따라서 y hat은 그림과 같이 수식을 적을 수 있다. - 초록색 글씨는 카이제곱에서 온 수식인데 이는 DeepFace 논문에서 다루는 내용. 참고로 Siamese Network이므로 윗줄과 밑줄의 network parameter는 동일하다. Application 단계에서 x(j)는 database로 부터 온다고 가정했을 때, input x(i)가 주어질 때마다 x(i), x(j)에 대한 output을 생성하는 것이 아닌 x(i)에 대해서만 output을 생성하고 x(j)의 output은 미리 계산해놓고 불러..
2023.09.18 -
43. Triplet Loss
왜 triplet(삼중항)이냐면, database image(A), positive input image(P), negative input image(N)에 대한 loss를 측정하기 때문. - 세 image에 대해 고려하기 때문에 삼중항이라고 부른다. 목적식은 결국 d(A,P)가 작아지고, d(A,N)이 커지길 원한다. - 또는 적어도 d(A,P)
2023.09.18 -
42. Siamese Network
이때 Network의 최종 output은 input image를 endcoding한 결과라고 볼 수 있는 (128,1) shape의 vector. - 이를 image를 vector로 represent(표현) 했다고도 한다.
2023.09.18 -
41. One Shot Learning
One Shot Learning이란 한번 보고 바로 맞추는건데, 즉 새로운 직원이 들어왔을 때(데이터베이스에 추가) 기존 모델이 바로 input image를 보고 그 사람인지 맞출 수 있냐고 물어본다면 쉽지 않다. = 모델을 재 학습시켜야 하고, 새로운 직원에 대한 데이터도 많아야한다. 따라서 우리는 두 사진을 비교하여 비슷한지, 아닌지를 측정하는 함수가 있다면 이러한 문제를 해결할 수 있다. 따라서 데이터베이스에 새로운 직원의 사진이 추가되기만 한다면 카메라를 통한 input image와 비교하여 similarity를 계산할 수 있다. - 이때 d function은 distance를 의미하므로 두 이미지간 차이를 계산. 따라서 작을수록 similarity가 높은것이다.
2023.09.18