全文预览

互联网舆情信息采集与分析系统的设计和实现-软件工程专业论文

上传者:业精于勤 |  格式:docx  |  页数:82 |  大小:4775KB

文档介绍
过程和结果的种种认识和评价。群体性突发事件舆情信息汇集与分析机制,是指汇集和分析突发性群体事件中舆情信息的特殊工作方式,这种方式常常具有环节清晰完整、运行稳定和自觉调整等特点,因而形成了一种机制。面对群体性突发事件的挑战,健全相关的舆情信息汇集分析机制十分重要。1.2.2国外研究概况近几年,世界各国都加速开展了舆情安全与社会安全方面的关键技术研究,主要集中在以下六方面:(1)Web文档内容的挖掘从Web文档内容及其描述中获取有用的知识,是对网页上真正的数据进行挖掘,包括网页内容挖掘和搜索结果挖掘[16]。Web文档通常包括文本、图像、音频、视频、元数据和超链接等数据类型,也有些如HTML文档所含的半结构化数据,但大多数还是无结构的文本数据。对超文本内容的挖掘是Web内容挖掘的重点,近年来作为内容挖掘一部分的多媒体数据挖掘也成了许多研究人员关注的焦点。(2)Web结构挖掘Web结构挖掘是挖掘Web潜在的链接结构模式,通过分析一个网页链接和被链接数量以及对象,来建立Web自身的链接结构模式,即可用于网页归类[16]。并且可以由此获得有关不同网页间相似度以及关联度的信息,这有助于用户找到相关主题的权威站点。Web结构挖掘是针对链接信息这一重要的Web数据,试图发现文档间超链接的链接结构。Web结构挖掘和内容挖掘有着紧密的联系,二者都是对Web上第一类数据即真正的原始数据进行挖掘。(3)Web使用记录的挖掘Web使用记录的挖掘是从用户存取模式中获取有价值的信息,是对Web上第二类数据及Web日志数据和相关数据的挖掘[17]。这些数据包括:网络服务器访问记录、代理服务器日志记录、浏览器日志记录、用户简介、注册信息、用户对话或交易信息、用户搜索表达式等。(4)舆情感情色彩分析?该技术通过自动分辨语法成分,例如名词、动词和形容词,并确定动词的主语和宾语,因此可以去除一些与文章主要内容无关

收藏

分享

举报
下载此文档