面向web社区的观点挖掘关键技术研究与实现

来源 :浙江大学 | 被引量 : 0次 | 上传用户:btly540205390
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的发展以及科技的进步,Web社区的影响力日渐增大,社区强大的用户网使得重要信息能迅速得到社会关注,用户针对产品、话题、政策等发表的观点和建议也为企业营销、政府网络问政等提供了巨大的价值,因此,对社区中用户所发表的信息包含的观点进行挖掘具有重大的研究与应用意义。   本文对贝叶斯分类算法进行改进,然后基于改进后的算法对话题进行监测,目的是监测后续数据流中表述同一话题的帖子或信息,充实观点挖掘的数据源,本方法改善了分类过程中训练样本分布不均以及样本稀少所带来的影响,实验表明该改进提高了话题监测的性能。   另外,用户所发表的信息包括话题信息以及其他用户对该话题的评论信息。针对指定话题的评论信息,本文对基于词典的观点挖掘方法进行了改进,判断评论信息中所包含的观点是属于positive还是negative,该方法结合了观点词的词频、观点词的位置以及语法等特征对观点进行挖掘,最后我们对微博中的评论信息进行实验,实验表明本方法能对评论信息中的观点进行有效的提取;针对话题信息,本文提出了一种基于用户模型的观点挖掘方法,对话题所含观点的权威性进行判断,该方法使用用户领域知识以及用户之间的社交关系构造用户模型,计算用户的重要性,然后结合该话题的评论信息的观点挖掘结果来判断话题的权威性;最后通过实验表明用户信息对于观点权威性的判断确有重要影响。
其他文献
活体肝移植是治疗重症肝病的有效手段,活体肝移植的手术统规划、术中引导和质量评估离不开对病灶部位的精确建模。传统建模方法由放射师对CT断层图像进行人工分析,过程繁琐费时
随着互联网的发展,网络上的数据日益增长,其中带有地理信息的互联网数据越来越多,传统的主题建模算法只能利用文档的单词信息,丢弃掉了文档地点信息。因此完善的地理相关文档
随着互联网的迅速发展,数据规模不断扩大,数据形式趋于多样化,共享范围愈加宽广,各行各业逐渐形成庞大、复杂和异构的数据环境。这些数据环境中的数据可能是由原始采集得到,也可能
空间数据查询处理技术是数据管理的关键技术,一直受到学术界和工业界的大量关注。作为空间数据的一类重要查询,反向最近邻查询(RNN)及其变种在决策支持、资源分配等重要领域
随着移动通信、互联网通信技术的不断推陈出新,用户移动业务需求的日渐提升,移动互联网时代悄然到来。新时代对嵌入式技术、微系统技术和无线接入技术的标准都提出了新的挑战
随着计算机网络技术的飞速发展,越来越多传统的商业模式被转化至电子商务系统中实现,这些电子商务系统对身份认证提出了强大的需求。公钥基础设施(Public Key Infrastructure
随着票据数字化管理模式的推广,票据图像成为了信息管理的主要载体。而在图像采集设备分辨率不断提高的影响下,图像包含的数据量呈海量增长。巨大的信息量对存储容量和信道带
21世纪经济全球化,人才争夺日益激烈,各国纷纷把人才培养上升为立国战略。学生评估模型作为检验和帮助学生成长的关键因素之一,却一直存在着主观性强、公平性低、全面性不足等问
随着现代传感技术与现代信息处理技术的高速发展,现代遥感技术在社会生活的诸多方面得到了广泛的应用和发展。由于不同传感器获得的遥感图像具有地物场景不同的影像特征,高空间
随着各种交通车辆的增多,以及人们出行增多,使得交通压力日益增大,为了改善高速公路路网的交通性能,一方面需要增加道路、拓宽路面、增添交通设施等硬件投入,另一方面更需要