26. Refinements to Beam Search
2023. 10. 22. 14:52ㆍGoogle ML Bootcamp/5. Sequence Models
따라서 곱해지는 숫자가 메모리에 저장하기에 너무 작은 값이 되기도 하는데, 이를 방지하기 위해서 log 변환을 취해준다.
- 실제로 해당 방법이 잘 먹힌다.
이때 log로 변환하더라도 실제 p는 1보다 작기 때문에 log 함수에서도 음수의 결과값을 가르키게 되는데 이는 output의 시퀀스를 짧게 만드는 경향을 주기도 한다.
- 따라서 해당 패널티를 줄이기 위해 우리는 normalize를 해줄 필요가 있다.
- 최종 output으로는 각 bean width를 통해 생성된 문장 중 가장 확률이 높은 것을 선택하면 된다.
- 그렇다면 bean width는 어떻게 정해야할까?
if bean width large, 많은 선택지 고려 = 더 나은 결과 but 메모리 사용량이 많고 시간이 느려진다.
응용 프로그램에 따라 다르지만 생성AI에서는 1000,3000을 설정하기도 한다.
- 기본적으로 3-10사이에서 수행한다.
'Google ML Bootcamp > 5. Sequence Models' 카테고리의 다른 글
28. Blue Score (0) | 2023.10.22 |
---|---|
27. Error Analysis in Beam Search (0) | 2023.10.22 |
25. Beam Search (0) | 2023.10.22 |
24. Picking the Most Likely Sentence (0) | 2023.10.22 |
23. Basci Models (0) | 2023.10.22 |