面向读者的博客情感分类及检索

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:cardio
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络的发展,Web应用变得丰富多彩。相应地,越来越多的人们通过博客、空间及微博等网络文本“对话”的形式来进行个人情感的表达和生活需求、兴趣的交流。   情感计算主要是针对文本中的评论信息进行分析、计算,挖掘人们对海量信息的评价观点和意见。通常我们所见到的博客大多是主观性文本,而主观性文本中又包含了不同的情感内容,这些情感内容分属不同的类别,正是人们所关注的。如果采用传统的文本分类方法进行分类,则会忽略文本中包含的情感语义信息,造成语义的缺失。如何弥补这项不足,正是本文的立意所在。   本文针对博客情感分类和检索进行了较为深入的探讨,所做的工作主要包含以下几个方面:   首先,采用了最大熵模型的方法从读者检索语句中抽取情感特征向量。我们对读者输入的检索语句进行带词性标注的分词,然后采用基于最大熵理论的方法针对不同的词性进行情感特征表现能力的测试,建立起读者的情感特征向量。   其次,设计了一种基于博客语料建立的情感数据库模型。我们给出了该情感数据库的模型定义,对该数据库做了一个总体的描述;接下来计算了情感数据库中各个文本的整体情感强度;最后将这些文本、情感类别以及情感等级强度值综合起来,形成结构化的情感数据库。   最后,实现了面向读者的博客情感分类及检索系统。我们定义了读者情感特征向量和博客文本的情感数据集合在数据库中的存储表示,然后建立了二者之间的混合映射关系同时确立其存储表示;最后对读者如何检索博客文本的过程进行了细致的讨论,建立起博客情感的检索系统。   总体而言,我们针对博客情感分类和检索的初步研究,取得了一定的成果,为情感计算的研究打下了基础。  
其他文献
面对心电图的计算机辅助诊断问题,本文首先主要介绍了四种分类模型,即改进的独立成分分析法和支持向量机模型、线性预测和主成分分析模型、基于专家系统的可信度模型、隐马尔
阴影存在于现实世界中,只要有光和物体的地方就会有阴影的存在,它是现实世界中不可缺少的一部分。阴影的真实感和实时性绘制技术在计算机图形图像处理、三维动画影视、三维游戏
近几年来,网络用户的数量成直线增长。网络已成为人们学习、工作、交流的重要平台,这使得数字图像、音频、视频等多媒体产品在网络的应用日益广泛。但是数字产品在网络传输过
如今,Internet在生活中的作用愈来愈大,电子邮件技术逐渐成为其不可分割的一个网络服务之一。正是因为电子邮件有着方便,快捷等特性,所以Internet上多数用户都会选择用电子邮
库存控制是供应链管理的一个关键因素,库存控制策略的优化可以极大地优化整个供应链的成本和利润水平。因此,研究库存控制的模型和优化算法对整体优化供应链系统具有重要的理论
随着多媒体会议、远程教学、分布式交互仿真等Internet应用的广泛使用,大规模可靠组播协议的研究成为了学术界的热点问题之一。组播与传统的单播、广播相比更适合一对多以及
近年来,将复杂网络技术用于研究分析软件系统已经成为热点。针对软件系统的复杂性,将复杂软件拓扑结构抽象映射为复杂软件网络模型,能够简单有效的挖掘复杂网络中重要节点,依
传感器节点由于体积和处理能力的限制,节能成为无线传感器网络技术研究的关键点。据研究发现,在网络工作过程中节点之间的信息的收发消耗了网络的大量能耗,而节点信息的处理
传统无公害农产品的认证方式,以人工处理为主,效率不高、工作琐碎、信息又无法回溯。随着电子政务技术的完善、网络的普及以及农业信息化平台的建设,较为落后的农产品认证方式也
稀疏移动自组网是一种不需要源节点与目标节点存在路径,利用节点的移动带来的相遇机会实现数据传输的自组织网络。由于节点对网络信息知之甚少,为了提高传输成功率,传统的路