面向金融舆情分析技术的研究与应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:wildboar2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的飞速发展与金融行业的不断发展,网络舆情已逐渐成为影响我国企业稳定发展的一个重要因素。网络舆情的社会影响力极强、传播速度极快,对金融类的舆情报道进行舆情分析,有利于相关机构便捷地了解事件的舆情并做出正确的引导和管控,也有助于金融市场的可持续发展。本文利用主题模型,情感词典构建,舆情分析等技术,对金融相关的网络舆情进行详细研究,设计了一个金融舆情分析系统。该系统从改进的主题模型中有效地识别出文本中的情感词,并将情感词与更全面、更完善的金融领域情感词典相匹配,计算该情感词的情感倾向值,以更准确地对金融文本进行舆情分类。本文研究的内容具体如下:1.改进的WHDP模型。传统HDP主题模型基于“词袋”假设造成了文本语义上的混淆,针对此问题本文提出基于窗口的层次狄利克雷过程(Window-based hierarchical Dirichlet process,WHDP)主题模型,即在HDP模型中引入窗口机制,利用窗口把文档划分为较小的片段,通过移动窗口保证词与词之间的顺序关系,减少文本语义上的混淆。实验表明,WHDP模型有混淆度更小、泛化能力更强的优势。2.改进的CHDP模型。HDP主题模型将文档看作一个简单的词频向量的组合,造成文本语义信息的缺失,针对此问题本文提出基于中心词的层次狄利克雷过程(Centroid-word based hierarchical Dirichlet process,CHDP)主题模型,该模型以要计算的词为中心,前后各扩展若干个单词作为窗口,然后对每个窗口计算单词的主题概率。该方法确保了窗口之间的顺序性,从而确保了单词间的局部有序。实验结果表明,CHDP模型在混淆度上略低于WHDP模型。3.构建金融舆情分析模型。针对通用情感词典无法适用于特定领域舆情分析的问题,本文选取频数从高到底的前100个词汇作为种子词,利用SO-PMI算法计算候选词与种子词的情感相似度,构建了一个金融情感词典,然后将金融情感词典和基础情感词典合并为一个较为完善的金融领域情感词典。最后结合WHDP/CHDP模型和金融领域情感词典对金融文本进行舆情分类。实验表明,本方法的舆情分类准确率更高。最后,本文基于以上研究内容实现了一个基于金融领域的舆情分析系统,达到了实际应用的目的。
其他文献
壬辰战后援朝明军善后事宜主要分为撤兵、留兵和查勘功罪三个方面。壬辰战争后期,援朝明军在前线战场上的屡次失利、明朝日益加重的军事和经济负担、明鲜对于战场形势的不同认识,使得明朝内部出现了调整现有援朝方案、将明军主力撤归国内的呼声。但来自日军的直接威胁,使得明朝当时对于现有战略的调整并不具备可行性,最终明朝停止讨论,决意进剿。而战争结束后,随着明朝经济和军事压力的进一步增大,明军撤归势在必行。但战后防
作者简介:赵钟岷,1929年出生。历任幼儿教师,大学助教,幼儿园园长助理,幼儿园副园长,北京师范大学学前教育专业副教授。曾出版过《幼儿一日一课》《萤火虫》《培养聪明娃娃》等多部著作,获得过北京市“先进保教工作者”“烟台优良教师”等荣誉称号。  我进入幼儿园工作是很突然的事情。初中毕业后,我读的是烟台师范,后来学校外迁。我没有跟着走,自己找工作。先在一个小学当代课老师,后来到一个幼儿园当了幼儿教师,
新时代文明实践中心建设,是社会主义精神文明建设的延续,从马克思主义的文明观及精神生产和物质生产的方面入手,阐述中国特色社会主义精神文明建设的发展历程,梳理习近平总书
本文一方面通过对描述服务业发展水平的各种指标的回归分析,找出衡量服务业水平的指标间的联系,另一方面通过对综合评价服务业发展水平的指标进行因子和后续分析,旨在找出珠
为提高了车库的库存量,解决住宅小区停车难问题,依据先设计后校核的思路,用UG NX9.0设计了车库结构,建立了三维模型。在考虑车库自重及满载的约束条件下,应用ANSYS Workbench
本文采用两种实验方法测量了无氧铜在116~148GPa和12、18.5GPa压力下的等熵卸载路径,得到了部分高压和低压区的off-Hugouniot数据。 第一种方法:反射法(用于高压区卸载路径测
随着社会经济和信息化技术的不发展,信息化手段在各行各业中的应用也越发广泛。就医疗行业来说,到各大医院就诊的患者的类别和数量呈不断增长的趋势,这就为医院的病案管理工