15. Properties of Word Embeddings

2023. 9. 27. 13:54Google ML Bootcamp/5. Sequence Models

man, woman를 구분짓는 요소는 gender이다. 그렇다면 gender로 구분지어지는 다른 단어들은?

이때 featureized vector representation에서는 벡터끼리의 빼기를 통해 구분짓는 요소를 알 수 있고, 그렇게 만들어진 벡터끼리의 유사도를 통해 king과 queen 또한 gender가 구분짓는 요소이며 man과 woman을 구분짓는 요소와 같음을 알 수 있다.

 

 

 

 

man과 woman의 관계는 king과 무엇의 관계와 같나? 에 대한 식 세우기.(sim은 similarity로 유사도를 구하는 함수)

 

 

similarity function 소개. cosine 또는 L2(Euclidean) distance가 될 수 있다.

물론 cosine, distance 모두 작을수록 유사성이 높은거다.

'Google ML Bootcamp > 5. Sequence Models' 카테고리의 다른 글

17. Learning Word Embeddings  (0) 2023.09.27
16. Embedding Matrix  (0) 2023.09.27
14. Using Word Embeddings  (0) 2023.09.27
13. Word Representation  (0) 2023.09.27
12. Deep RNNs  (0) 2023.09.26