2023. 10. 24. 14:23ㆍGoogle ML Bootcamp/5. Sequence Models
query(질문)의 의미 : what is happening there?
- A<3> 을 생성하는데 각 word에 query를 날리는 것.
- 즉 k<1>은 person, k<2>는 action 등등 A<3>을 설명하기 위한 정보들이 나열된다.
- 이때 목적지인 I'Afrique에 대해 visite이 가지는 중요성이 매우 커지고, 따라서 오른쪽 위 수식에 따라 softmax값은 파란색 부분이 가장 클 것으로 예상할 수 있다.
**이 모든 정보들이 다시 각각 value와 곱해져서 sum되면 A<3>가 만들어지는데 이로써 얻는점
- I'Afrique라는 단어가 단순히 고정된 word embedding vector가 아니라 다양한 정보를 포함한 embedding vector가 된다는 점.
- 주변 query * key 값을 통해 I'Afrique가 목적지라는 정보를 포함하고 있다.
- 이런 연산을 통해 A를 생성하는 행위를 모든 word에 대해서 반복적으로 실행.
***결국 self-attention이라는 것은 word를 vector로 표현하기 위해 embedding하는 방식을 의미.
- 이때 기존의 word embedding 방식과는 다르게 query, key, value라는 3가지 input을 통해서 word embedding을 생성함.
- 기존의 고정된 word embedding보다는 풍부한 정보를 내재한 word embedding(=self attention) 생성.
'Google ML Bootcamp > 5. Sequence Models' 카테고리의 다른 글
36. Transformer Network (0) | 2023.10.24 |
---|---|
35. Multi-Head Attention (0) | 2023.10.24 |
33. Transformer Network Intuition (0) | 2023.10.24 |
32. Trigger Word Detection (0) | 2023.10.22 |
31. Speech Recognition (1) | 2023.10.22 |