基于人机交互的统计翻译方法.ppt
《基于人机交互的统计翻译方法.ppt》由会员分享,可在线阅读,更多相关《基于人机交互的统计翻译方法.ppt(24页珍藏版)》请在第壹文秘上搜索。
1、1基于人机交互的统计翻译方法2提纲n1.简介n2.基于人机交互的统计翻译方法n3.实验结果及分析n4.结论3提纲n1.简介n2.基于人机交互的统计翻译方法n3.实验结果及分析n4.结论4简介n问题的提出qPhrase-based SMT采用短语精确匹配的策略1.数据稀疏问题严重,特别是长短语2.短语表中的大量短语无法得到充分利用n我们的目标通过短语模糊匹配和人机交互,利用更多的短语,通过短语模糊匹配和人机交互,利用更多的短语,提高系统的翻译质量。提高系统的翻译质量。5简介Are you here meal-time or out?Do you eat here or to go?(1)(2)6
2、提纲n1.简介n2.基于人机交互的统计翻译方法n3.实验结果及分析n4.结论7短语模糊匹配n短语模糊匹配qDice系数系数q编辑距离编辑距离s源语言句子源语言句子n扩展句子生成1 21immss sfss,1 21i ppmmss sgss 原始句子:原始句子:扩展句子:扩展句子:1If未登录短语未登录短语8扩展句子生成两个问题:a)找到的相似短语是否能够提高句子的翻译质量?b)生成的新句子是否与原句语义相同?人机交互人机交互组合分类器组合分类器9组合分类器设计特征选择(1)原则:a)扩展句子应该与原始句子非常接近,保证扩展句子的语义不会发生太大的变化。b)扩展句子的翻译应该与参考答案非常相似
3、,与参考答案越接近,译文的BLEU得分就越高。if未登录短语未登录短语pg相似短语相似短语s原始句子原始句子,i ps扩展句子扩展句子t参考译文参考译文,i pt扩展句子译文扩展句子译文10组合分类器设计特征选择(2)特征特征说明说明解码器打分比值扩展句子译文与原始译文之间的解码器打分的比值未登录短语与相似短语的相似度相似程度包括:1.Dice系数2.编辑距离3.Overlap系数4.Jaccard系数5.长度比值扩展句子与原始句子的词性序列相似度扩展句子译文与参考译文的相似度11组合分类器设计分类器训练nSVM工具:LIBSVMn核函数:径向基函数(Radial Basis Function
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 人机交互 统计 翻译 方法