基于服装网购评论文本挖掘的情报研究

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:a_b_c_d
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着服装行业与电子商务的紧密融合,服装网购已成为人们日常生活中不可分割的一部分,与此同时也产生了大量蕴含消费者反馈信息、极具情报研究价值的服装网购评论文本。然而这些评论数据体量庞大且信息繁杂,同时相比于其它商品,服装网购评论受消费者个体差异影响较大,更易给出主观且感性化的表达,因此情报挖掘难度更大。基于此本文立足于服装网购评论文本,引入文本挖掘技术从商品属性情感分析和社会语义网络分析两个角度构建情报研究模型并进行具体实证分析。本文将从以下五个章节进行阐述:第一章绪论主要阐述本文研究背景与意义、国内外情报研究现状、文本挖掘技术及其应用现状分析、研究内容和框架以及研究难点和结构安排。第二章服装网购评论数据及文本挖掘技术概述。从服装网购评论数据研究与采集、预处理再到中文分词、文本表示模型以及特征选择对相关理论进行具体概述。第三章提出基于商品属性情感分析的服装网购评论情报研究模型,研究通过网络爬虫获取评论数据,经预处理后进行word2vec模型训练,选取属性种子词进行语义相似度计算扩充特征属性词典,然后制定规则利用依存句法抽取属性观点词组并进行情感强度值计算,最终以具体的分值表现出消费者对商品各属性的满意程度。研究还以某品牌真丝服装评论文本做具体实证分析,得到了该品牌消费者满意度结果,分析了该品牌服装各方面属性的优劣程度,并对消费者满意度最低的两种属性进行分析并提出专项整改意见。第四章提出基于社会语义网络分析的服装网购评论情报研究模型,研究引入Snownlp情感分类技术对评论语料进行情感分类以避免正负情感因语境表达方式和关注点的不同而影响后续的情报分析。同时在关键词抽取步骤结合了 TF-IDF计算机技术和GooSeeker软件新词识别两种方法,二者相互补足提高了关键词抽取的准确度。此外还在jieba分词词典的基础上添加了服装领域网购评论分词词典和停用词表以便提高TF-IDF关键词抽取的准确率。最后研究还进行了实证分析,更针对消极评论的情报结果进行分析讨论,并给出意见反馈。第五章结论与展望部分对全文进行总结并对进一步研究工作进行展望。
其他文献
本文研究了不同树龄、不同生长势、不同季节的情况下,古白皮松的超氧化物歧化酶活性及脂质过氧化产物两二醛的含量与植物衰老衰弱之间的关系。结果表明,在树龄较长的A级树中SOD活性
海洋立管是连接海底管道与海洋工程结构物生产设备之间的管道,当粘性流体流经大跨度立管时,会产生涡激振动的问题。当尾涡脱落频率接近圆柱自振频率时,会发生“锁定”现象致
<正> 超氧阴离子(O2-)是生物体内的主要自由基。自由基与很多大分子如脂质、蛋白质及核酸等反应,破坏细胞的结构,干扰细胞的功能,根据Harman 的自由基理论,最终导致有机体的衰
高校扩招,研究生规模大增,扩充了科研人才队伍。但随之而来的问题是难以保证研究生培养质量,这一直是研究生教育实践中需要不断探索的议题。在我国的研究生教育中,导师作为主
宗教工作是党的统战工作的重要组成部分.要做好新形势下的宗教统战工作,我们必须对国际、国内宗教问题的背景有一个基本的了解.
分析了赊销风险产生的原因和主要表现,提出了在赊销风险防范中的具体方法。
城市轨道交通在促进新型城市化建设中发挥着重要作用。本文以南京地铁3号线为例,运用特征价格模型,分析了地铁沿线周边房价的影响因素。以秦淮区和江宁区为例,进一步分析了轨
页岩气作为一种非常规天然气已成为全球油气资源勘探开发的新亮点,加快页岩气开发已经成为世界主要页岩气资源国的共同选择。我国2010年起开始进行页岩气的勘探开发,截至2014
中医学认为"心主神明",心神主导情志活动,情志失常以心为主、以肝为辅,主要责之于心神不明。心神不明,机体对外界环境应对能力减退,易出现情志失常,情志失常可直中脏腑,或引
目的探讨胎儿期鼻翼软骨的发育规律,为唇裂儿童鼻的整形提供理论基础。方法对46具正常流产胎儿标本,根据胎龄分组,解剖双侧鼻翼软骨,并于鼻翼软骨内侧脚1/2处、穹窿角、外侧脚1/2、