中文文本情感分类研究

被引量 : 0次 | 上传用户:liongliong574
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近几年微博,电子商务网站兴起,用户及网络评论的数量呈爆炸性的增长。这些评论中包含对产品,热点事件等的评判和分析,对于商家的产品改进和政府的舆情监控及政策制定有着重要的价值和意义。其中文本的情感倾向分类就是近几年兴起的一个研究热点。文本情感倾向分类是一个二元分类,即判断文本是含褒义色彩还是贬义色彩。由于情感表达的复杂性,究竟哪些词性的词语含有更多的情感色彩,对分类帮助更大,本文对此将进行详细的探讨。对于跨领域的文本情感分类研究,本文也改进了一种情感词典和特征学习结合的算法,主要的研究成果包括以下几个方面:①研究了不同词性构成的停用词表对文本情感分类的影响,采用了7种停用词表,在三个语料库上,分别对无监督的基于情感词典的分类方法和有监督的特征学习方法进行了详细的实验及分析,结果表明对于基于情感词典的分类方法,采用形容词,动词,副词除外的词性的词语作为停用词分类结果较好,传统的文本主题停用词对分类结果基本无影响,而对于有监督的特征学习方法,形容词,动词,副词,名词对分类结果的帮助最大,不使用任何停用词时取得的分类效果较好。②改进了一种情感词典和特征学习相结合的跨领域文本情感分类算法,文本情感分类方法主要分为两种:无监督的基于情感知识的方法和有监督的特征学习的分类方法。前者不需要已标注文本,简单易实现,分类精度低;后者分类精度高,但需要大量标注数据,不利于跨领域。Tan等人提出了一种将情感词典和特征学习结合起来的算法,本文将其算法中使用的台湾大学NTU情感词典用PM(IPointMutual Information,点互信息)算法构建的情感词典代替,发现分类结果更好,其后详细的分析了结果产生的原因以及算法中参数变化对分类结果的影响。
其他文献
目的:建立肾炎康胶囊原料药材(三七、黄芪、益母草、决明子、接骨木)的质量标准。方法采用薄层色谱法(TCL)对肾炎康胶囊中原料药材进行定性鉴别,采用高效液相色谱法测定三七药材中
本文就思维导图法在中职英语阅读教学的篇章结构分析的运用模式及具体操作进行详细的论述。实验证明:该操作模式不仅降低中职生的阅读难度,更符合中职生的认知发展规律,即由
新刑诉法对监视居住进行了重大修改和重新定位,并对监视居住的具体适用作了明确规定,但能否利用监视居住措施来为侦查破案服务却备受争议。对经济犯罪案件嫌疑人积极适用监视
玉米/大豆带状套作可以充分利用光环境,提高单位土地面积物质产出。为探明玉米/大豆带状复合种植模式下不同空间配置对大豆冠层光环境、形态、产量及系统效益的影响,进而为大
针对Web研发领域一直面临前后端耦合问题,在充分分析传统的互联网前后端Web软件开发的基础上,提出了引入Node.js作为中间层来解除前、后端之间耦合关系的新解决方案。设计了
本文通过实证研究的方法,对当前农村初中英语语法的教学现状进行了调查分析,并结合教学实践,探讨了实行交际—语法教学法的应对策略。
<正>胡士云先生从语言方言的角度把父亲称谓分为六类,其中一类为"大"类,包括"达、大大、达达"等①;郭熙先生则从社会语言学的角度,采用语言传播的方式,对汉语中的父亲称谓系
地域特征是特定区域土地上自然和文化的特征。它包括在这块土地上天然的、由自然成因构成的景观,也包括由于人类生产、生活对自然改造形成的大地景观。这些景观不仅是历史上
对汽车用机械液压助力转向系统、电子液压助力转向系统和电动助力转向系统的原理、优点、缺点及相关标准进行了阐述和分析。
针对空战中目标威胁评估系统非线性、评估难度大且富含不确定信息的问题,研究了基于遗传算法优化模糊递归小波神经网络(single-hidden-layerfuzzy recurrent wavelet neural