BLEU: Bilingual Evaluation Understudy 机器翻译与文本生成中最常用的自动评价指标之一,用来衡量模型生成的句子与参考答案(人类写的正确句子)之间的相似度。