基于产品评论的跨语言情感分类技术研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:go2mx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的飞速发展,互联网上随处可见的是用户对商品或者服务的评论,其中最有价值的信息莫过于人们对商品评论中带有的情感信息,这些信息对情感分类的研究具有很大的价值。但是,由于不同语言的情感资源在质量和数量上的分布不均匀,无法更好的对情感资源不足的语言进行情感分类。为解决此问题,研究者通常利用情感资源丰富的语言来解决资源缺乏语言的跨语言情感分类问题。传统的跨语言情感分类主要是使用机器翻译系统将一种语言翻译到另一种语言,然后在该语言下进行情感分类,但是机器翻译质量严重影响着分类的准确率。目前的跨语言情感分类问题是如何更好的减少不同语言之间的间隙,针对这一问题,本文对跨语言情感分类所面临的问题进行详细地分析,找到两种不同语言之间的映射表示关系,通过该映射来进行跨语言情感分类,主要研究内容如下。1)利用拉普拉斯映射对基于结构对应学习的跨语言情感分类算法(CLSCL)进行改进,提出了改进的算法(M-CLSCL),根据源语言和目标语言之间潜在的关系,选出轴心特征词对,最后借助选出来的轴心特征词对,学习一个映射函数,借助该函数来进行跨语言的情感分类。2)提出了一种基于Autoencoder的跨语言情感分类方法,该方法将两种语言(源语言和目标语言)通过Autoencoder学习一种共享表示(BLSR)。通过Autoencoder对两种不同语言进行学习处理得到其共享表示空间,学习到该空间后,将训练数据(源语言)映射到该空间中并训练分类器,测试数据(目标语言)同样映射到该空间进行测试。3)选取NLP&CC 2013跨语言情感分类数据集中的DVD和书籍评论的数据对提出的两种算法分别进行实验,通过实验结果得出:本文提出改进的基于结构对应学习的跨语言情感分类算法与原有算法在同一数据集上进行实验对比具有较高的准确率;第二种方法在同一数据集上情感分类的准确率较高于目前前沿算法如BSWE等算法。
其他文献
在线教育发展迅速,尤其是MOOC的兴起,极大地推动了在线教育,但MOOC有自己的不足,于是产生了SPOC,本文首先分析了MOOC特征、分类、优点和不足,然后介绍了SPOC的特点、教学流程、探索
微波技术的主要研究和应用的趋势是向更高的频率发展。微波具有以下一些基本特性。微波频段较宽,频率从300 MHz覆盖到300 GHz,可以满足高速数据传输与大容量通信的相关要求。
“四不贪”机制,是反腐败成功的国家在长期的反腐败实践中摸索出的一整套行之有效的治理腐败的机制和措施的总和。它对于当代中国正在进行的反腐败斗争很有借鉴之处。研究“
《春秋穀梁传》所记载之葵丘之会天子禁令是现存最早的也是最可信的关于葵丘之会天子禁令之记载,《孟子》所载之葵丘之会天子禁令是在《春秋穀梁传》关于葵丘之会天子禁令之
信息技术的发展和互联网的普及对音乐产业变革和人们获取音乐信息的方式带来了巨大的影响。在音乐历经存储介质、传播方式、付费模式的诸多变化后,在线音乐平台出现在人们的
目的:观察高压氧联合柳氮磺胺吡啶对溃疡性结肠炎的疗效。方法:将60例溃疡性结肠炎患者随机分为两组:高压氧组30例和对照组30例,高压氧组即高压氧联合柳氮磺胺吡啶(SASP)治疗
日前全国人-机-环境系统工程学术会议在昆明召开。钱学森为本次会议发来的贺信指出:“20年来,你们在人-机-环境系统工程这一新兴科学领域进行了积极的开拓和探索,并取得了非
会议
网络发展到达高峰期,网络信息主体在这个在线社交浪潮中便越来越多。其个人信息极易被滥用,同时网络个人信息也在互联网背景下因为全球性数字网络技术和宽带连接的发展而趋于
为验证烟草漂浮育苗单粒播种的可行性,选用烤烟‘云烟87’催芽包衣种,设计试验方案T1压穴、播种、盖种一体化手工播种器;T2为压穴、播种、盖种分离式手工播种器;CK为自动播种
本文运用微分平移和微分回转变换概念,按照概率方法分析机器人关节误差对装配机器人位姿误差的影响。给出了计算最大位姿误差的关系式和手部位姿误差的模型。 In this paper