【摘 要】
:
统计学习本质上是以数据为研究对象,借助计算机、数学、概率论等多个学科的综合知识来搭建模型,从中提取数据的特征最终回到对数据的分析。文本情感分析作为统计学习领域的一大研究内容,以用户在各种媒介上留下的非结构化文本数据为研究对象,对其进行统计分析并从中挖掘出有价值的结构化信息,目前已被广泛应用于舆情监控、金融分析和商品推荐等方面。 近年来,深度学习在处理词性标注、摘要抽取、文本分类等各项自然语言处理
论文部分内容阅读
统计学习本质上是以数据为研究对象,借助计算机、数学、概率论等多个学科的综合知识来搭建模型,从中提取数据的特征最终回到对数据的分析。文本情感分析作为统计学习领域的一大研究内容,以用户在各种媒介上留下的非结构化文本数据为研究对象,对其进行统计分析并从中挖掘出有价值的结构化信息,目前已被广泛应用于舆情监控、金融分析和商品推荐等方面。
近年来,深度学习在处理词性标注、摘要抽取、文本分类等各项自然语言处理任务中取得较好的成绩,深度学习将数据进行分布式表示,通过构建复杂的网络结构可以学习数据深层的抽象特征,避免了繁琐的特征构建工作,使模型具有良好的泛化能力。因此,本文主要研究深度学习模型,将其应用于网络评论的情感分析,具体研究内容如下:
(1)介绍了基于词典和基于机器学习的两种传统情感分析方法,详细分析了它们的算法流程和优缺点。
(2)阐述了卷积神经网络、长短时记忆网络等深度学习模型的基本原理,提出一种结合卷积神经网络和长短时记忆网络的情感分析模型,该模型将文本用训练好的词向量表示,采用并列的两层卷积网络来学习文本的局部特征,同时堆叠了长短时记忆网络用于学习文本中隐藏的序列特征。实验结果表明,和传统的机器学习方法以及几种深度学习模型对比,该模型表现出更好的情感判别性能。
(3)在(2)的基础上,本文又提出了一种新的情感分析模型,该模型主要利用多个子训练集和子模型来对单独类别的特征进行更细致化的提取,提取到的特征对于单独类别的判定具有较强的表征贡献。实验结果表明该模型在积极、消极、中性三种情感判别任务上表现出良好的性能。
其他文献
税收是国家公共财政最主要的收入形式和来源,而数量只占2.31%,税收收入却占了全国90%的大企业是我国国民经济的重要支柱,且是我国税收收入的主要来源。但大企业主要以集团的形式存在,具有跨行业、跨区域、多元化发展、集约式经营、规模化生产的特点,这种类型的企业自身潜在的税收风险会对其造成巨大的影响,可能会使企业遭受经济损失或者法律的惩罚。因此,税务部门应该重点关注大企业的税收风险,帮助大企业避免风险,
随着当今社会经济持续飞速发展,群众机动出行需求的不断提高,汽车市场潜力持续释放,保有量空前增加,交通压力逐渐从动态变为静态,“停车难”成为又一城市病。特别是城市中的老城区,因各方面条件所限,停车难问题显得尤为突出。由于建设时间、规划标准等历史客观原因,老城区普遍存在市政配套先天不足的问题,有效的停车资源与停车需求间的供需矛盾异常突出,侵占人行道、绿化带、消防通道、楼栋院坝等“见缝插针”停车现象非常
政府建设项目不仅是落实国家战略的重要载体,也是拉动地方投资增长的重要抓手,在地方经济社会发展中发挥着关键性作用。同时,政府建设项目具有利益相关者多、社会关注度高和影响力大等特点,其建设必须重视公民知情权、表达权和参与权。大数据和互联网时代,既为政府和公民提供了一个双向沟通渠道,也对政府治理能力提出了新要求。如何从浩瀚数据中挖掘有价值信息,并为政府决策提供民情民意参考和数据支撑,成为政府网络舆情治理
近年来,农村转移人口大规模向城市流动,从农业向第二、第三产业转移,推动了工业化和城镇化的发展,截至2018年,我国城镇化建设已经取得了不凡的成就和突破性的发展。伴随着城镇化进程,我国对城镇化质量的要求逐渐提高,要追求“人”的城镇化,实现农村转移人口的社会融合。然而,在社会融合的过程中,农村转移人口面临着诸多压力和阻碍,障碍之一便是缺乏城市生存的可靠保障,表现为基本权利未能完全得到保障、与城市居民未
政策执行是实现扶贫政策目标的关键,扶贫政策的执行对打赢脱贫攻坚战和兑现全面小康承诺具有重要影响。当前基层的扶贫工作面临着执行“失准”问题,导致政策效果式微,阻碍整个脱贫攻坚工作的推进。那么,基层扶贫政策执行“失准”的背后机理是什么?本研究连续 3 年追踪武陵山集中连片特困地区乡村扶贫的实践,总结扶贫经验,以M村扶贫实践为案例,借鉴组织社会学新制度主义理论,搭建了“合法性—理性”竞争的框架,系统分析
随着互联网技术发展和“互联网+政务”逐渐推广,政务微博取得了飞跃式的发展,政务微博信息发布和政民信息互动直接影响了民众对政府的信任。政务微博公信力是公众对政府部门在政务微博上发布信息的质量与互动的认知和体验。研究它及其对微博政治参与的影响,不仅有助于拓展政府治理相关内容,还有助于促进政府政务公开,提升政府形象。本研究在文献分析的基础上,编制了具有一定信效度的政务微博公信力问卷,考察了政务微博公信力
政府信任是社会信任体系的核心,也是政府获得政权合法性和提高政治效能的关键因素。但二十世纪中叶以来,世界各国政府和政治组织都面临着一个信任度不断恶化的境况,因而政府信任及其修复成为研究热点。现有修复策略研究多是基于归因理论,对不同策略下的修复效果使用情景模拟法来进行实证检验。其缺点在于只能停留在信任修复的沟通层面,容易造成政府信任修复的失效。 本文基于扎根理论研究方法,以政府信任受损机理作为研究对
社会组织作为当下我国治理体系重要的组成部分,在实现治理能力现代化起着至关重要的作用。在公共管理和公共服务方面社会组织发挥自身独有的优势,承接了部分政府职能,为整个社会提供不同的公共服务和公共产品。党的十九大报告中也强调了在加强社区治理体制的基础上鼓励更多社会组织积极参与其中。民政部也出台了相关大力培育社区社会组织的意见。成都市金牛区着力培育社会组织,在街道级单位建立社会组织孵化平台、社区内建立社会
脱贫攻坚进入决胜期,驻村扶贫制度作为运动式治理方式介入乡村扶贫场域,为全国脱贫带来了显著成效。但同时,驻村扶贫作为一种他治力量介入乡村,在乡村扶贫场域的工作中也存在着注重短期成效、驻村干部权力替代、外来扶贫场域和本地扶贫场域治理逻辑冲突等问题,不利于村民自治的良性发展。党的十九大报告提出要建立健全自治、法治、德治相三治结合的乡村治理体系,而自治是乡村治理体系的基础,因此,驻村扶贫工作中,他治的介入
近年来,我国进行了高等教育的改革,各高校采取了扩大招生的办法,2002年至2007年,我国普通高校毕业生人数不断增加,随之而来,就业形势也日益严峻。同时,随着社会的发展,网络的延伸,信息经济社会对人力资源的素质提出了更高的要求,不仅要求人才具有合理的知识结构,还需要具备相应的逻辑思维能力、社会活动能力和创新能力等综合能力。大学生作为我国人才的后备军,从自身和社会发展的要求都需要进行职业生涯规划。目