元搜索技术在涉藏舆情监控系统中的应用研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:q43372958
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
涉藏舆情是社会管理部门了解藏区民众对社会政治态度等更为直接途径,同时也是制定舆情管控策略、引导舆情导向的重要依据。随着互联网尤其是境外网站中所包含大量的涉藏舆情信息呈几何级数子增长时,涉藏舆情信息收集、筛选的难度和复杂度也随之增加,同时涉藏舆情信息采集具有时效性和针对性的特殊要求,导致互联网涉藏舆情管控工作显得较为被动。涉藏舆情监控作为对我省藏区互联网信息导向的重要监管方式,其搜集信息的时效性和准确性成为了当前研究的热点。如何全面、高效地从这些海量信息中搜集到需要的涉藏舆情信息并加以分析和研判,已经成为了“涉藏舆情监控系统”所要面临的首要问题。论文从实际工程化的角度出发,将元搜索技术应用于“涉藏舆情监控系统”之中,实现对互联网中涉藏舆情信息采集的可行性。论文结合甘肃省甘南维稳工程中的“涉藏舆情监控系统”,对研究的相关技术进行了概要描述,对元搜索技术和文本聚类、向量空间模型等技术进行了研究分析,设计了完整的涉藏舆情信息采集系统。同时,探讨了通过对元搜索引擎结果的聚类方法,以便为更加准确、高效地采集到符合主题的涉藏舆情信息。主要研究内容有:(1)对现有的舆情采集技术、元搜索引擎进行了全面系统的研究;(2)针对当前元搜索引擎方法在搜索结果去重时忽略了文本内容等问题,分析研究了元搜索引擎查询结果的聚类方法,提出通过对搜索页面摘要、标题的向量空间模型VSM(Vector Space Model)的表示来计算文本相似度,并采用凝聚层次聚类对网页文档进行聚类,来达到去重的目的;(3)设计并实现了一个基于B/S架构的元搜索引擎结果聚类系统涉藏舆情采集器,给出了系统模块设计原理、构架以及各模块的实际功能,并通过实测证明了系统运行的效果和有效性;实践表明该采集器具有较好的动态适应性,能够对涉藏舆情信息进行全面的采集。论文中研究的成果在实际工作中得到了初步验证,最后对课题中研究的不足和未来研究的方向进行了展望。
其他文献
随着微型传感器技术的发展,压阻传感器成为传感器技术研究的热点之一。高集成度、高精度、微型化、轻型化的压阻传感器成为传感器市场重要的需求产品。传统压阻式传感器的信
软件仓库挖掘领域可以分析软件仓库中的数据以便促进软件的开发过程。虽然版本控制系统、缺陷跟踪系统、通信档案、设计要求和文档中存在大量数据,但是由于其高度非结构化性
基于巨磁阻抗效应(Giant Magnetoimpedance Effect,GMI)的磁敏传感器具有灵敏度高、快速响应、功耗低和体积小等突出优势,成为第三代磁敏传感器的典型代表之一。本文分析了电流
现代直线运动装置的应用较为广泛,可以将电能转化为机械能实现直线运动,相比于旋转运动装置具有结构简单,能耗小等优点,可以应用于各类直线运动场合。为实现更好的换挡控制效
在导航电子地图行业的主流产品愈发同质情形下,多数用户属于双边平台,而且产品之间的转换成本较小。此时,增值服务是提升用户粘性,增加产品区分度的有效途径。本文从数字生态
目标跟踪是计算机视觉领域的重要研究方向。因为目标跟踪技术在多个领域都具有举要重要应用价值,所以目标跟踪是目前计算机视觉研究的热点。本文通过近几年的目标跟踪方法进
研究背景和目的:心衰(heart failure,HF)是一种心脏泵血功能障碍与代偿性激活的神经体液因子相互作用为特征的临床综合征。心梗后心室重构及交感神经系统过度激活可加剧心功
脑-机接口(Brain-Computer Interface,BCI)通过解析输入的脑电信号,将用户的意图解码为控制指令来控制输出设备,实现人脑与外部设备的交互。脑-机接口技术的核心是脑电信号的
近年来,随着科技的发展,复杂动态网络广泛渗透于各行各业,在人类社会生活中占据着十分重要的地位。例如在互联网、交通、通信、生物医疗、智能制造、社交网络等领域得到了广
我国是世界能源生产和消费大国,随着经济社会的不断发展,我能源需求将持续增长。增加能源供应,保障能源安全、保护生态环境、促进经济和社会的可持续发展,是我国经济和社会发