论文部分内容阅读
现有的主流在线零售网站普遍采用了一些简单的在线信誉系统来试图解决网络交易中信任缺失的问题,虽然起到了一定作用,但大多存在着不同商品共用同一评价维度、信誉评价模型维度区分度不高的情况,不能准确表达用户的真实选择意愿。针对上述问题,本文从用户的文本评论本身出发,使用客观的聚类方法发掘客户的真实感受,从定性的客户评论研究在线信誉系统,以期能够更加准确地给出用户所关注的信誉评价维度。本文在回顾前人的相关研究之后,采用文本聚类分析的方法对客户评论内容进行了分析。本研究编写了Asp.net程序抓取原始数据,使用Visual C++,Java,Matlab等语言对数据进行了分析、聚类。经过抓取文本评论数据,分词,生成特征项集合,编码标注,确定词义相似度计算方法,机器聚类,对聚类簇进行分析等步骤,得出了一个更加合理的信誉评价维度。其中,根据研究的具体情况,本文对TFIDF处理的具体步骤做出了改进,把词义相似度应用于聚类分析,并且在DBSCAN算法中加入了对聚类簇进行TFIDF过滤的内容。经过对原始的信誉评价维度和聚类分析得出的信誉评价维度进行对比,本文发现原有的信誉评价模型确实遗漏了一些比较重要的评价维度,而且有些评价维度不够全面、清晰,而使用聚类分析的方法分析文本评论数据,可以从用户评论中找出用户真正关心的信誉维度。研究结果证明,聚类分析做为一种新的信誉维度确立方法,可以尽量减少人为地干预,避免主观影响干扰分析结果,确保能够从用户评论本身出发,科学地、合理地得出客观的信誉评价维度。