[evaluation] Rouge-N / Rouge-L


[evaluation] Rouge-N / Rouge-L

논문에서 많이 언급되는 평가 지표를 설명한다. ROUGE v. BLEU 차이 ROUGE : 얼마나 많은 Reference sentence token이 Generated sentence token 에 포함되는지 BLEU : 얼마나 많은 Generated sentence token이 Reference sentence token 에 포함되는지 gold standard the cat was under the bed machine inference output the cat was found under the bed Rouge-N Rouge-N은 n-gram 방법을 사용하는데, n에 따라서 이름이 달라진다. 주로 Rouge-1, Rouge-2 이런 식으로 표현한다. 또한, recall과 precision 같이 사용되며 다음과 같이 표기한다. 위의 예시를 토대로 Rouge-1의 recall과 precision을 구하면 다음과 같다. 이렇게 계산하는 것을 기반으로 Rouge-2를 구해보면 아래와...


#nlp #rouge #기계번역 #평가지표

원문링크 : [evaluation] Rouge-N / Rouge-L