论文部分内容阅读
随着服装行业与电子商务的紧密融合,服装网购已成为人们日常生活中不可分割的一部分,与此同时也产生了大量蕴含消费者反馈信息、极具情报研究价值的服装网购评论文本。然而这些评论数据体量庞大且信息繁杂,同时相比于其它商品,服装网购评论受消费者个体差异影响较大,更易给出主观且感性化的表达,因此情报挖掘难度更大。基于此本文立足于服装网购评论文本,引入文本挖掘技术从商品属性情感分析和社会语义网络分析两个角度构建情报研究模型并进行具体实证分析。本文将从以下五个章节进行阐述:第一章绪论主要阐述本文研究背景与意义、国内外情报研究现状、文本挖掘技术及其应用现状分析、研究内容和框架以及研究难点和结构安排。第二章服装网购评论数据及文本挖掘技术概述。从服装网购评论数据研究与采集、预处理再到中文分词、文本表示模型以及特征选择对相关理论进行具体概述。第三章提出基于商品属性情感分析的服装网购评论情报研究模型,研究通过网络爬虫获取评论数据,经预处理后进行word2vec模型训练,选取属性种子词进行语义相似度计算扩充特征属性词典,然后制定规则利用依存句法抽取属性观点词组并进行情感强度值计算,最终以具体的分值表现出消费者对商品各属性的满意程度。研究还以某品牌真丝服装评论文本做具体实证分析,得到了该品牌消费者满意度结果,分析了该品牌服装各方面属性的优劣程度,并对消费者满意度最低的两种属性进行分析并提出专项整改意见。第四章提出基于社会语义网络分析的服装网购评论情报研究模型,研究引入Snownlp情感分类技术对评论语料进行情感分类以避免正负情感因语境表达方式和关注点的不同而影响后续的情报分析。同时在关键词抽取步骤结合了 TF-IDF计算机技术和GooSeeker软件新词识别两种方法,二者相互补足提高了关键词抽取的准确度。此外还在jieba分词词典的基础上添加了服装领域网购评论分词词典和停用词表以便提高TF-IDF关键词抽取的准确率。最后研究还进行了实证分析,更针对消极评论的情报结果进行分析讨论,并给出意见反馈。第五章结论与展望部分对全文进行总结并对进一步研究工作进行展望。