【摘 要】
:
随着互联网的迅猛发展,网络成为产生舆情的重要场所,而Web新闻作为互联网的一个十分重要的应用,已成为影响网络舆情的一个重要因素。对网站发布的Web新闻内容进行必要的、合
论文部分内容阅读
随着互联网的迅猛发展,网络成为产生舆情的重要场所,而Web新闻作为互联网的一个十分重要的应用,已成为影响网络舆情的一个重要因素。对网站发布的Web新闻内容进行必要的、合理的监督管理,采用计算机技术自动地对其进行分析整理,从而进一步进行舆情分析,保障网络的内容安全,是网络监管部门的一项重要研究内容。本文以网络中的Web新闻为舆情分析语料,主要研究了在互联网新闻话题的识别与跟踪的过程中,如何建立更为适用的文本表示模型的问题。在借鉴国内外相关先进技术的同时,本文对Web新闻语料自身的特点进行了分析,发现将现有的文本表示模型应用于Web新闻会导致文本表示的稀疏性问题和话题跟踪过程中的主题词漂移问题。鉴于此,在理论分析和实验验证的基础上,本文结合向量空间模型(VSM),利用特征项在文档集中协同出现,构造了特征项的容错粗糙集。最后用特征项容错粗糙集生成文档的容错粗糙模型,来扩充原先的文档表示模型。实验证明,文档的容错粗糙模型能够改进话题检测的效果。在此基础上,本文构建了一个热点话题发现与话题跟踪及趋势分析原型系统,实现了预期的功能。
其他文献
它对我很重要,它消失了。 “我拥有的都是侥幸啊,我失去的,都是人生。” (一) 我匆忙地走在沥青道上,抬头看了看天空,连星星也稀稀落落,眼前逐渐泛起雾水,模糊了来时的路,我来不及看见它,它已经消失在了这个夜晚里。 我第一次在漫天尘土里看见它时,空气混浊,我们相隔一条马路。它戴着粉色的帽子,手里的冰淇淋在融化,坐在对面的秋千上,一晃一晃的,偶尔踮踮脚,荡动的弧度,谱出了一首小诗。像极了孩子们
干扰对齐技术能够很好地克服传统干扰处理方法上的不足,提升系统自由度,成为了应用于干扰信道的一种出色的干扰处理方法。对于无中继的多用户干扰信道,干扰对齐算法要求各发
混沌系统是一类对初始条件极其敏感的非线性系统,其生成的混沌序列具有非线性、非周期性和类噪声特性,是一类性能优良的新噪声源模型,比传统的物理噪声源易于控制和实现,具有广阔的应用前景。本文重点研究了Chua电路系统及混沌噪声源理论,并在此基础上以Chua电路为噪声源,设计实现了一种新型的混沌噪声源实随机数发生器模型。首先,针对理想电感难以集成的缺点,本文提出了一种利用模拟电感改进Chua?电路的方法,
从2004年eSTREAM项目启动以来,Trivium算法依靠着简单的构造和极强的抗攻击能力得到了最多的好评,成功进入最终入选的算法之列。2009年9月,ePrint上刊登的论文《On The Desig
移动通信技术飞速发展,随着移动通信这种先进的通信方式的普及,它在人们的社会生活中占有重要地位,如:通过无处不在的移动通信进行电子商务和电子银行服务。随着移动通信技术
在2015年,中國科幻作家刘慈欣的作品《三体》获得了“雨果奖”,这一事在中国引起了很大的反响,人们为“中国科幻文学迎来了春天”而高兴喝彩,刘慈欣本人却认为文学正在加速衰落,中国的科幻文学其实与世界还差很远。 中国作家获得“雨果奖”自然值得高兴,但这一次获奖并不能说明“中国科幻文学迎来了春天”,世界文学正在快速地发展,中国的科幻文学与之还差得很远。科幻作品考验作家对科学自然、社会运作、道德伦理等多
作者简介:梁冬鑫(1993-),女,汉,河南洛阳人,河南大学本科在读。 前有竹,后有苇,中间一股山泉水。这就是我美丽的家乡,也是大人们对家乡的赞美。 我的家鄉是一个座落于三面环山的小山沟,沟后有各种杏树、芦苇和山底流出的小清泉。春天来了,粉白的杏花香溢满整个山村。早春的晨光里,耕牛声和着百鸟鸣令人神清气爽。夏天,人们在门前的绿荫下吃饭歇息,静听悠扬的蝉鸣,农作的伯伯们总爱舀上一壶清澈香甜的山泉
随着互联网的发展,网络的应用日益广泛,网络管理和流量监测的难度也在不断增加,为了达到有效监控网络流量和合理配置网络资源,必须实现对流量中的协议类型准确区分。随着网络
作者简介:周丽莉(1980.7-),女,汉,吉林省农安县人,学士,长春汽车经济技术开发区第三中学中教一级教师,研究方向:语文。 日头东升西落,季节春夏秋冬,生命开始结束,似乎这一切都不用什么原因去解释。可是仔细去想想,似乎每个中的“后者”的出现总是以前者的“殒命”为代价。 曾听说这样一个故事,那是关于一种名为大马哈鱼的。母鱼产子,小鱼孵出。想不到的是小鱼竟是靠啮噬它们的母亲而长大的。母鱼痛苦地