型相同的实体,根据相应的答案排序Р 算法对候选答案进行排序,返回与查询最相关的若干个答案给用户[12]。Р 3 Р万方数据Р第一章绪论Р 规则Р 问题分类Р 问题关键词提取Р 答案抽取Р 关键词扩展Р 查找候选答案Р 问题理解Р 答案Р 相关文档根据权重排序Р 信息检索Р 返回最佳答案Р 文档库、FAQР 库和网络Р Р 图 1-1 问答系统框架Р Fig.1-1 Framework of QA System Р 1.3.3 问答系统中的主要技术Р 问答系统的主要技术分为信息检索、模式匹配、自然语言处理和统计翻译模型四种。Р 问答系统中的信息检索是指直接根据检索算法搜索问题的答案,这类技术的核心是Р 依据提问处理模块生成的查询关键词和某种特定算法对候选答案进行排序。由于不同的Р 关键词在反映句子语义时的贡献不同,排序算法中也应该予以区分。一般把查询所需的Р 关键词分为几类:一般关键词、扩展之后关键词、专有名词短语和其它关键词等[13]。Р 模式匹配技术是指在抽取答案前,先识别出问句的句型模式,再依据模式来抽取答Р 案。虽然该方法对于询问定义、时间等类型的问题时效果较好,但模板数量始终是有限Р 的,无法涵盖所有的类型,不能处理结构较复杂类型的句子,同样也无法进行推理[14]。Р 以上两种技术都存在缺陷,有专家提出,在自动问答系统中引入自然语言处理技术Р 能够推动问答系统的发展,从而不断提高系统的性能。因此,很多系统将自然语言处理Р 的相关技术引入问答系统,如句法分析技术、语义分析技术等,不过由于现阶段的自然Р 语言处理的相关技术还不成熟,目前的句法、语义分析技术在实际应用中的效果还不理Р 想。因此,目前的大多数系统使用的还是对句子进行浅层分析的方法,在前两种方法上Р 进行补充和改进。Р 使用自然语言处理技术的目的是对提问和候选答案进行句法、语义方面的分析,并Р 4 Р万方数据