同策略,提出中文简历信息抽取模型,特别针对最难处理的复杂信息的处理。量的文本分类技术;阈值的确定;自动文本分类系统的结构框架。本文的主要研究工作是在现有文本识别技术的基础上,结合半结构化文本的本文主要研究对象是带格式的简历话ㄇ笾靶爬嘈偷募蚶,主要工作任务是分析简历特点,恰当分割简历中各个项,区分目标信息和额外信息,然后本论文各项具体内容主要围绕“智能简历分析系统毕钅展开,以简历文本作为切入点,给出信息抽取模型。在对简历分析的基础上,针对不同部分采取不同的策略,最终提出信息抽取模型。从本文的内容结构上看,全文共分为五个部分。现概括如下:第一章,介绍了课题的背景和意义。介绍了信息抽取的相关技术;论文研究的主要内容;介绍了论文的结构安排。第二章,给出了半结构化文本的定义以及课题中关键词的定义。第三者,介绍了自动文本分类技术。介绍了自动文本分类的定义;传统公式及其缺点,参考文献中介绍了改进的—剑惶卣飨畹某槿》法及步骤;训练方法与分类方法,本文的简历信息抽取系统采用的是基于简单向第四章,总结简历文本特征,给出信息抽取模型。简历信息抽取系统的研究目标;中文简历的格式、内容特点;简历信息抽取模型介绍:问题描述及简历信息抽取模型的工作流程;简历文本的粗切分,粗切分将整个中文简历分为两部分;简历文本中基本信息的抽取技术;简历文本中复杂信息类集合的分类;简历文本中复杂信息类中信息的抽取技术。第五章,给出实验结果并分析讨论。实验数据及评价方法,实验数据由中华英才网提供,本实验采用准确率作为基本测试指标;实验结果与讨论,给出实验数据的测试结果,并讨论所得结果高低的可能原因。第六章,对所作工作的总结并提出存在的问题。同时对半结构化文本中的信北京邮电大学硕貉芯可宦畚智能简历解析系统的研究与实现息抽取研究进行了展望,并确定了进一步研究的方向。北京邮电人学硕:十:研究生学位论文智能简历解析系统的研究与实现