【摘 要】
:
电商行业的兴起,各类货品的流通速度加快。既方便了消费者购买,又让人们对商品的品质产生更高的要求。基于电商平台的载体,一种评论导向的消费方式逐步在市场上扩充开来。消费者购物时候,会参考以前买过该商品用户提供的评价信息,从而调整自己的消费意愿。这意味着电商评论数据对商品销量、商家利益产生了直接的影响。当前,电商平台上存在着庞大的评论文本数据,其中涵盖着店家想要急切知道的用户观点等信息。这些信息可有效帮
论文部分内容阅读
电商行业的兴起,各类货品的流通速度加快。既方便了消费者购买,又让人们对商品的品质产生更高的要求。基于电商平台的载体,一种评论导向的消费方式逐步在市场上扩充开来。消费者购物时候,会参考以前买过该商品用户提供的评价信息,从而调整自己的消费意愿。这意味着电商评论数据对商品销量、商家利益产生了直接的影响。当前,电商平台上存在着庞大的评论文本数据,其中涵盖着店家想要急切知道的用户观点等信息。这些信息可有效帮助商家进行舆情分析、用户理解、产品优化和营销决策等,具有非常大的实用价值和应用前景。本文针对电商产品评论进行了方面级的观点挖掘,首先利用Bert预训练模型在Pytorch框架上使用监督学习的方法,训练出一个深度神经网络模型,并使用交叉验证的方法进行验证。实验结果证明,对于化妆品领域和笔记本电脑领域的精准率和召回率都可以达到70%以上,F1-score也因此达到了75%左右,这是一个十分理想的结果。但是化妆品领域的F1结果总是高于笔记本电脑领域,这是因为笔记本电脑的有标注数据集只有约900条,在数量上远小于14000条化妆品的有标注数据集。针对有标签的训练数据集数量小、训练效果欠佳的缺陷,提出一种基于深度迁移学习的改进方法,即基于不同的预训练模型,使用其他领域的数据重新对模型进行预训练,然后通过微调过程将模型迁移到目标领域,并通过集成学习的方法合并各模型,进一步改进了模型。实验结果表示,在精准率上,改进后的模型有5%-6%的提升,召回率有4%-7%的提升,F1-score值有5%左右的提升。无论是精准率、召回率还是F1-score值,经过再次预训练的模型的各项得分都远高于未经改进的Bert模型,特别地,经过集成学习以后,模型的F1-score值达到了82%,相较于改进前有8%的提升。本文最后设计并实现了一个B/S架构的基于Flask的电商评论观点挖掘系统,该系统包含注册登录、用户管理、观点挖掘、后台管理等模块,重点将改进后的深度神经网络模型部署到系统中,用户可以在友好的界面下与系统各模块进行交互,对商品评论数据进行观点挖掘,最终结果以图形化方式展现给用户。
其他文献
在攀钢高炉冶炼过程中,高价值的钛、钪等共生金属元素绝大部分进入渣相,形成含TiO2约24%的含钛高炉渣。攀钢含钛高炉渣是宝贵的二次资源,由于矿物相复杂,难以有效利用。针对攀钢含钛高炉渣利用难题,虽然许多学者进行了大量研究,甚至已建立了一些示范性产业化路线,但由于资源、环境及社会经济效益等多因素制约,目前距离有效解决含钛高炉渣高值资源化利用尚有很大差距。形成这种含钛高炉渣高值资源化利用困境的本质原因
目的:发展以牛羊为主的生态畜牧业,为当前我省12大优势特色产业之一。紫云县素有养殖黑山羊的传统。为摸清该县黑山羊消化道寄生虫感染状况,提出有效防制措施,降低疾病因素造成的经济损失,而开展本调查研究。方法:采集114份新鲜黑山羊粪便样品,通过传统的和新型的消化道寄生虫虫卵检查法,检出虫卵并进行鉴别判读,获得当前紫云县黑山羊消化道寄生虫主要感染种类、感染强度和优势虫种。结果:(1)114份粪便样品中,
基因组编辑技术的出现是各物种基因组测序逐步完成破译的必然结果。在这一探索与揭秘的过程中,更新了以ZFNs,TALEN,CRISPR/Cas系统为主的三代人工核酸酶基因编辑技术,无论是对普通细胞系,还是生命个体,在基因功能研究,新技术的开发,转基因作物与动物生产,人类基因组遗传病治疗等各方面均发挥了极大的推动作用。真核细胞基因组的复杂性,活体细胞环境的多样性,DSBs产生的潜在危害性均是基因组编辑难
我国领海面积广阔,占我国总领土面积的三分之一,且海面邻国较多。近年来,海上安全形势日趋复杂,别国窥视我国海洋资源,各国船只不断侵入我国领海;海上军事争端越演越烈,确保海域安全是我国现在以及今后军事战略的重点;因此,加强对我国海域的监控和对入侵舰船的实时探测是非常重要地任务。然而,传统舰船目标检测方法由于仅仅挖掘利用了目标的底层或浅层信息,导致舰船目标检测性能有限;因而需要进一步研究稳健的舰船目标检
目的:胆汁酸(bile acid,BA)作为一种多功能的信号分子,具有调节脂质、葡萄糖和能量代谢,是维持机体正常生理功能的重要物质。胆汁酸具有高效的肝肠循环特征,主要包括肝脏,胆囊,小肠,结肠和血浆五个部分组成。胆汁酸肝肠循环是维持机体胆酸稳态的关键因素,在正常生理状况下,胆汁酸肝肠维持恒定。然而,机体在药物和酒精等外源性物质的作用下会造成胆汁淤积,从而引发多中肝胆疾病。酒精性肝病患者时常伴有黄疸
组合导航技术是应用于移动机器人系统中,能保证机器人完成精准导航的一种重要技术。现有的研究中采用了多种方法来提高移动机器人GPS/INS组合导航的精度。然而,这些研究都忽视了机器人导航系统在复杂地带工作时,受到不确定噪声干扰的问题。同时,也忽视了移动机器人的GPS精度易受众多因素的干扰,导致数据传输出现时滞的现象。针对以上问题,本文以Summit-XL机器人为对象,研究了组合导航方法的鲁棒H∞滤波问
自动驾驶技术在汽车领域一直都是未来的一个重要发展方向,并且随着人工智能技术的高速发展,使无人驾驶的实现更近了一步。目前,无人驾驶决策是无人驾驶技术最需要突破的问题之一,尤其是在复杂未知的城市道路上进行驾驶决策,所以,针对这一问题需要采用一种能够自主学习并且在复杂多变的行驶环境下都能做出安全合理的决策方法,而根据深度强化学习具有自主学习能力和强泛化能力的特点,因此,本文采用深度强化学习的方法来研究城
经济的发展会不断推动社会的发展,而任何资源使用都应当适度适量,过度的索取会造成能源短缺的严重问题,同时对环境也会造成进一步的破坏。因此需要利用可再生能源进行探究与挖掘从而实现经济效益最大化。风能是清洁能源的一种,具有可再生的优势,同时风能的出现使得风力发电技术这项产业日趋走向成熟,然而风速受多种因素影响常伴随着随机性和不平稳性,从而给风电接入电网造成了相当大的困难,对电力系统的安全和维护造成了巨大