论文部分内容阅读
推荐系统作为一个高效的信息过滤工具,已广泛应用于电子商务和社交网络等诸多领域。然而,当前一些称为“水军”的恶意用户为获取不正当利益,往往通过伪造用户行为影响推荐结果,给商家和用户的利益都造成了损害。这种行为被称作托攻击。当前托攻击大致可以分为两类,一类是“推攻击”,即为某些项目生成大量褒奖记录以推销该项目,另一类是“核攻击”,即为某些项目生成大量的差评记录来诋毁该项目。随着推荐系统的兴起,对托攻击的检测已然成为当前的研究热点,本文所关注的即是对“托攻击”中“核攻击”的检测。许多现有的研究方法主要从两个角度解决核攻击的问题,第一种注重检测独立的攻击者而忽略攻击者之间可能存在的团体合作性;第二种先分别找到“一组合作的攻击者”和被其攻击的“一组攻击项目”的候选者,再从中对攻击进行侦测,这样做既不直接也不高效,难以处理当前的海量数据。针对不能同时找出合作的“攻击者组”和“攻击项目组”的问题,本文从一个新的角度,提出算法MAB (Mining Attack-Block),该算法同时考虑“攻击者组”和“攻击项目组”,并采用频繁项集挖掘的思路,把攻击行为检测出来。此外,为应对较大数据量的挑战,本文进一步探究了针对MAB算法的剪枝策略以提高算法效率,并在数据集上对算法的有效性和高效性进行了检验。本文的主要工作可以概括如下:1.为检测“核攻击”内的“攻击者组”和“攻击项目组”,创新性地提出将“攻击者和攻击者”之间的关系以及“攻击者和攻击项”之间的关系作为特征引入攻击检测之中,并据此提出了“攻击块”的概念。2.提出两个用于评估“攻击块”的衡量标准,“块面积率”和“块打分率”,并据此提出攻击块检测算法MAB,该算法采用频繁项集挖掘的思想对“攻击块”进行检测。还探究了两个标准的上界以对检测范围进行剪枝,提高检测效率。3.在数据集上对MAB算法进行检验。实验结果表明,MAB算法能够准确地检测出攻击块,并且算法中采用的剪枝策略表现出了良好的性能,具有广泛的应用前景。