【摘 要】
:
随着互联网的不断发展,大量的用户在此类产品上都会留下评论以进行交流,这些文本的评论信息具有传播速度快、传播范围广、影响人数多等特点。那么对于这些评论文本信息进行深层次的挖掘无论在商业角度还是社会角度都十分有意义。学术界目前的研究重点是利用深度学习等机器学习技术将文本情感分为正向和负向两类。国内对于情感分析的研究发展比较缓慢,本文深入地研究了中文情感分析的相关技术之后,主要工作如下: 首先,提出了
论文部分内容阅读
随着互联网的不断发展,大量的用户在此类产品上都会留下评论以进行交流,这些文本的评论信息具有传播速度快、传播范围广、影响人数多等特点。那么对于这些评论文本信息进行深层次的挖掘无论在商业角度还是社会角度都十分有意义。学术界目前的研究重点是利用深度学习等机器学习技术将文本情感分为正向和负向两类。国内对于情感分析的研究发展比较缓慢,本文深入地研究了中文情感分析的相关技术之后,主要工作如下:
首先,提出了一种基于长短期记忆神经网络(Long Short Term Memory,LSTM)的改进方法。本文针对文本信息所蕴含的情感倾向不仅受到上文的影响,还受到下文的影响这一现象,通过将两个LSTM神经网络并行连接的方式,分别对文本数据进行正序和倒序处理,这样可以同时处理上下文的文本数据。随后本文利用第三方数据验证了该模型在处理文本序列上比传统的LSTM有着更好的表现。
其次,提出了一种基于改进分词算法的汉字向量化方法。本文主要讨论中文的文本情感分析方法,因此对于中文自然语言处理问题之中的分词技术进行了分析,在此基础上提出了一种基于词典的最大熵分词改进算法,通过比较该分词算法与传统词典分词方法,明确了该算法在中文分词领域的表现更胜于传统的词典分词方法。另外本文基于谷歌的Word2Vec模型提出了一种适用于中文的词向量化方式,并且利用收集到的文本数据验证了该方法对中文文本的词向量化的有效性。
最后,对提出的中文文本情感分析方法结果进行了验证。本文首先将手动截取得到的数据样本构建数据库,并将其分为样本集、交叉验证集和测试集,随后利用样本集和交叉验证集完成对两个神经网络模型的训练和参数调节过程,最终利用测试数据集对整个流程的情感分析的分类结果进行验证,并与第三方情感分析方法进行对比实验,进而证明了本文方法对中文文本情感分析的优越性。
其他文献
拜耳法是现代氧化铝生产工艺中广泛应用的生产方法。铝酸钠粗液的沉降分离是拜耳法生产氧化铝过程中非常重要的一部分。通过向沉降层添加絮凝剂来加速溶液沉降,为此,需要测量清液-沉降层的分界面、沉降层-底流的分界面位置来获得沉降层高度,计算沉降层溶液体积,以便确定絮凝剂的添加量。当前分界面位置测量的方法主要是以人工定时取样测量为主,测量间隔时间长、滞后大、次数少,不能保证成品质量。 针对目前铝酸钠溶液分界
血糖检测是人们日常健康管理的重要项目之一。近几年,无创血糖检测技术受到各界学者的广泛关注。一般通过测量人体空腹时唾液中的葡萄糖浓度来标定血糖浓度,其提取出来的组织液量较小需要稀释,所以传感器就需要对很低的葡萄糖浓度敏感。因此提出一种葡萄糖浓度测量灵敏度高并且能够同时监测温度变化的传感器非常必要。 光纤表面等离子共振(Surface Plasmon Resonance,SPR)作为一种高精度、免标
气固两相流广泛存在于工业生产过程,如电厂煤粉输送、炼钢厂高炉喷粉系统和粮食输送等,其中粉料速度是描述这些过程的一个重要参数。然而气固两相流的速度时空变化,分布不均,使得速度测量结果无法反映管道内颗粒的真实速度。所以,实现气固两相流速度测量、尤其是速度分布测量是一个难点问题。 静电传感器具有结构简单,价格低廉等优点,在测量气固两相流参数中有广阔的应用前景。本文利用静电感应原理,设计了两种阵列式静电
目标跟踪技术是计算机视觉应用研究的最基本的问题,迄今为止,有各种各样的跟踪算法被提出。近年来基于相关滤波和深度学习方法的提出,很大程度地提高了跟踪算法的性能。然而,目标跟踪技术依然具有很多问题,这主要是因为在跟踪过程中目标的外观会因运动模糊、背景杂乱、形态变化和目标遮挡等诸多挑战性场景而发生较大的改变。如何在这些复杂多变的跟踪场景下保持目标外观模型的准确性是目标跟踪技术急需解决的难题。目标跟踪技术
表面质量是带钢生产的一项重要指标,如何快速精确地检测出带钢表面缺陷,一直是带钢生产企业关心的问题。由于冷轧带钢生产现场环境恶劣、受外界干扰严重,现有检测算法存在复杂度高、计算时间长和非缺陷信息被误报为缺陷等问题。针对上述问题,本文的主要研究内容如下: (1)带钢缺陷检测系统设计。根据带钢生产现场特点选择具有合适参数的相机和光源,完成硬件平台设计和搭建;编写软件程序,实现带钢缺陷检测分类算法以及图
钢铁成品铁运装配包括集配和配载两个作业环节。集配计划是根据成品信息从库区中选择合适的成品组成运输计划;而配载计划是决策集配计划内成品在车皮上的空间位置。目前钢铁企业集配和配载计划是独立编制,缺乏系统性决策从而影响车皮装载效率。因此本文从实际铁运装配过程中提炼出集配—配载集成计划问题,研究其问题的建模和求解方法,有助于提高车皮利用率、降低物流运输成本。 本文以钢铁企业成品铁运装配物流过程为背景,研
随着“工业4.0”的推进,钢铁产品生产将朝着智能化、高效化、节能化的方向不断发展,高效的管理方式将成为企业提升核心竞争力的有效途径。合同计划编制是根据客户订单及工厂实际情况自动安排出符合工艺约束及生产要求的排程计划。此问题的合理解决,将帮助企业实现生产管理的高效化及定制化。 本文针对钢铁棒线材生产过程中的炼钢-连铸-轧钢三大核心工序进行合同计划优化问题研究,主要工作如下: 1)针对炼钢-连铸工
随着卖方市场向买方市场的转变,消费者需求不再是被动的而是主动的,对供应链的更高要求随之出现。供应链的实现,需要联系起由供应商、生产厂家、分销商、零售商组成的链路上的每一个环节,并进行优化,使生产资料迅速地通过生产、销售环节变成价值增值的产品,呈现到消费者面前。因此企业的竞争实力体现在供应链给消费者提供的价值的增加,以及供应链成本的减少。供应链优化问题成为所有企业追求发展与进步所关注的核心内容和重要
随着市场的快速发展和完善,作为资产配置的重要媒介,金融的重要性愈加突显,与此同时,人们对于金融理论的研究也愈加重视。作为金融研究的核心课题之一,投资组合优化问题主要研究如何在不确定情况下对金融资产进行合理配置与选择,从而实现收益率最大化与风险最小化间的均衡。这是所有投资者和投资机构都要面临的问题。然而,以往的研究者主要是假定投资的终止时间是固定的,并没有将投资的时间变动考虑到投资组合优化的范畴,而
钢管切割问题的任务是决策如何将原始钢管进行切割,形成符合合同订货长度的子管,从而满足合同的需求量。在实际生产中,钢管切割是一个两阶段的过程,第一阶段将原始钢管等距切割成为中间管,第二阶段根据合同的具体要求将中间管切割成符合需求的短管,因此钢管切割需要同时决策两个阶段的切割方案。钢管切割计划是钢管生产制造管理过程中的一个必要且重要的环节,对于提高材料利用率和提升企业的利润具有重要意义。 本文以钢管