Google ML Bootcamp/5. Sequence Models

15. Properties of Word Embeddings

코딩소비 2023. 9. 27. 13:54

man, woman를 구분짓는 요소는 gender이다. 그렇다면 gender로 구분지어지는 다른 단어들은?

이때 featureized vector representation에서는 벡터끼리의 빼기를 통해 구분짓는 요소를 알 수 있고, 그렇게 만들어진 벡터끼리의 유사도를 통해 king과 queen 또한 gender가 구분짓는 요소이며 man과 woman을 구분짓는 요소와 같음을 알 수 있다.

 

 

 

 

man과 woman의 관계는 king과 무엇의 관계와 같나? 에 대한 식 세우기.(sim은 similarity로 유사도를 구하는 함수)

 

 

similarity function 소개. cosine 또는 L2(Euclidean) distance가 될 수 있다.

물론 cosine, distance 모두 작을수록 유사성이 높은거다.