Google ML Bootcamp/5. Sequence Models
35. Multi-Head Attention
코딩소비
2023. 10. 24. 14:52
즉 multi-head = multi-query.
- 즉 여러 질문에 대한 답으로 word를 다양하게 embedding한 matrix라고 이해하면 된다.
- 예를 들어 q1은 what is happening there, q2는 when? q3은 who? 등등. 여러 질문에 대한 답으로 word를 표현하게 된다.