全文预览

有关“机器翻译”的文献综述[1]

上传者:学习一点 |  格式:doc  |  页数:17 |  大小:30KB

文档介绍
方面, 在后面加入的规则通常都是一些粒度非常小的规则, 只能处理非常个别的语言现象, 对系统整体性能的改进很小, 整个系统的性能提升极为缓慢, 而这个时期一些大型的机器翻译研究项目也都以失败而告终。基于规则的机器翻译方法似乎走到了尽头。 2 .异军突起的基于统计的方法基于统计的机器翻译方法把机器翻译看成是一个信息传输的过程,用一种信道模型对机器翻译进行解释。这种思想认为, 源语言句子到目标语言句子的翻译是一个概率问题, 任何一个目标语言句子都有可能是任何一个源语言句子的译文, 只是概率不同, 机器翻译的任务就是找到概率最大的句子。因此统计机器翻译又可以分为以下几个问题: 模型问题、训练问题、解码问题。所谓模型问题, 就是为机器翻译建立概率模型, 也就是要定义源语言句子到目标语言句子的翻译概率的计算方法。而训练问题,是要利用语料库来得到这个模型的所有参数。所谓解码问题, 则是在已知模型和参数的基础上, 对于任何一个输入的源语言句子, 去查找概率最大的译文。实际上, 用统计学方法解决机器翻译问题的想法并非是 20 世纪 90年代的全新思想, 1949 年 W. Weaver 就已经提出使用这种方法, 只是由于乔姆斯基( Chomsky )等人的批判,这种方法很快就被放弃了。批判的理由主要是一点: 语言是无限的, 基于经验主义的统计描述无法满足语言的实际要求。另外, 限于当时的计算机速度, 统计的价值也无从谈起。而现在, 计算机不论从速度还是从容量方面都有了大幅度的提高, 昔日大型计算机才能完成的工作,今日小型工作站或个人计算机就可以完成了。此外,统计方法在语音识别、文字识别、词典编纂等领域的成功应用也表明这一方法在语言自动处理领域还是很有成效的。统计机器翻译方法的数学模型是由国际商业机器公司( IBM )的研究人员提出的。统计机器翻译的基本思想是: 从理论上说, 这种模型只考虑

收藏

分享

举报
下载此文档