28. Blue Score

2023. 10. 22. 15:28Google ML Bootcamp/5. Sequence Models

기계번역에 대한 정확성은 어떻게 평가할까. 

classification과 달리 참조할 수 있는 정답이 여러개 일 수 있다.

 

따라서 BLUE : max(number of represent word in reference) / number of represent word in output

 

수정된 Precision 구하는 예시.

 

 

 

unigram 뿐만아니라 N-grams로도 확장해서 볼 수 있다.

 

 

최종적으로 BLUE score는 N-grams에 대한 평균값으로 계산된다. 이때 BP라는 패널티가 있는데 번역의 문장 길이가 짧으면 약간의 패널티를 주는 방식이 도입된다.

'Google ML Bootcamp > 5. Sequence Models' 카테고리의 다른 글

30. Attention Model  (0) 2023.10.22
29. Attention Model Intuition  (0) 2023.10.22
27. Error Analysis in Beam Search  (0) 2023.10.22
26. Refinements to Beam Search  (0) 2023.10.22
25. Beam Search  (0) 2023.10.22