三个环节就是知识单元的抽取、知识单元间关系的识别,以及知识图谱的存储与使用。其中尤以知识单元抽取和知识单元间关系的识别最为关键。?知识图谱主要有自顶向下(top-down)与自底向上(bottom-up)两种构建方式。自顶向下指的是先为知识图谱定义好本体与数据模式,再将实体加入到知识库。该构建方式需要利用一些现有的结构化知识库作为其基础知识库,例如Freebase项目就是采用这种方式,它的绝大部分数据是从维基百科中得到的。?自底向上指的是从一些开放链接数据中提取出实体,选择其中置信度较高的加入到知识库,再构建顶层的本体模式。目前,大多数知识图谱都采用自底向上的方式进行构建,其中最典型就是Google的Knowledge Vault。РRDF是一种资源描述框架,可以形式化地表示结构信息,?它一般用来描述网络资源,例如某个Web 页面的内容、作者等。?采RDF 可以对知识进行结构化组织,进而采用图形化的方式展示?出来。?在知识图谱的存储研究中,目前主要是RDF 数据库和图数据库,从顶向下设计的RDF 数据库没有从底向上设计的图数据库成功, 图形数据库在存储知识图谱的知识单元和单元关系上效果最佳。?目前,图形数据库并没有一套完整的标准, 但是大部分图形数据库都包含了节点、关系、属性这三个元素。节点可以用来存储知识单元, 关系可以用来展示知识单元之间的联系, 属性可以表征知识单元的相关特性。Р大规模知识库的构建与应用需要多种智能信息处理技术的支持。通过知识抽取技术,可以从一些公开的半结构化、非结构化的数据中提取出实体、关系、属性等知识要素。通过知识融合,可消除实体、关系、属性等指称项与事实对象之间的歧义,形成高质量的知识库。Р知识推理则是在已有的知识库基础上进一步挖掘隐含的知识,从而丰富、扩展知识库。分布式的知识表示形成的综合向量对知识库的构建、推理、融合以及应用均具有重要的意义。