全文预览

自然语言处理与Web知识工程

上传者:学习一点 |  格式:ppt  |  页数:59 |  大小:0KB

文档介绍
能系统; ?知识的表示、知识的获取和知识的运用构成知识工程的三大要素。知识工程的 bottleneck ——知识获取?传统知识工程往往依赖于人工构建-需要耗费大量的人力和时间-构建的知识库通常规模不大,难以支撑实际应用系统-难以实时更新,通常大大落后于实际发展? CYC -从1984 年开始, 25年时间-10万概念,百万关系?中国大百科全书-从1978 年开始, 30年时间-66个学科, 8万个条目, 1.264 亿汉字需要研发自动获取知识的技术 Web 时代的知识工程?海量的数据–Google 索引网页数突破 1万亿( 2008 年) ?用户协作式构建的大规模百科知识–维基百科: 2001 年开始,目前近 300 万条目(英文), 26万(中文) –百度百科: 2006 年开始, 170 万条目–由全球 100 多万网民共同编写而成?这些知识源,为大规模建立知识库提供了重要的知识来源。但是,它们都还是面向人的知识库,计算机难以利用。如何把它们转化为计算机能理解和使用的知识库, 是一个重要的问题。 Web 知识工程——机遇与挑战?海量性与开放性?知识需求精细化?不确定性?多源异构性 Web 知识工程——机遇与挑战?冗余性?半结构化?网络百科?用户日志?搜索引擎 API Web 知识工程——机遇与挑战?在 Web 知识提取中,如何充分利用 Web 资源特有的各种优势,从多源异构、海量、开放的网络文本中准确地提取各种知识组成要素,是实现 Web 知识获取的一个关键问题。从 NLP 的角度看知识工程?知识获取技术研究:利用 NLP 技术进行文本挖掘——分析自然语言文本,发现知识点以及知识点之间的概念关系,辅助进行知识获取; ?知识型系统工具的建立:在知识系统的开发环境中,集成基于 NLP 的知识获取技术,利用自然语言处理技术将领域专家的劳动降到最低,解决知识获取的瓶颈问题。

收藏

分享

举报
下载此文档