【摘 要】
:
俗话说“近朱者赤,近墨者黑”,这句话在互联网环境中同样适用。网页之间可以通过相互链接来提升自身的可信度,一些垃圾网页通过恶意欺骗来提升自身可信度,影响用户体验,给搜索引擎和其他合法网站带来巨大经济损失,污染互联网环境。介绍了常见的几种垃圾网页作弊手段,探究了相应的垃圾网页检测方法。垃圾网页通过内容作弊和链接作弊以提高自身的可信度。垃圾网页的检测可以参考网页的链接信息和内容特征,现有算法主要分为基于
论文部分内容阅读
俗话说“近朱者赤,近墨者黑”,这句话在互联网环境中同样适用。网页之间可以通过相互链接来提升自身的可信度,一些垃圾网页通过恶意欺骗来提升自身可信度,影响用户体验,给搜索引擎和其他合法网站带来巨大经济损失,污染互联网环境。介绍了常见的几种垃圾网页作弊手段,探究了相应的垃圾网页检测方法。垃圾网页通过内容作弊和链接作弊以提高自身的可信度。垃圾网页的检测可以参考网页的链接信息和内容特征,现有算法主要分为基于内容的检测算法和基于链接的检测算法。针对基于链接的垃圾网页作弊,提出了一种基于网页的链接关系和主题相关度的改进算法。首先对已提出的基于链接的算法中存在的不足之处进行剖析,发现现有算法在进行分数传递时将所有链接“平等”对待,未能有效检测链接农场、蜜罐等作弊手段中存在的“伪”高评分网页。针对上述问题,算法首先利用LDA主题模型获取网页的主题,再依据链接对象的可信度及两者的主题相关度适当调整链接权重来评估网页的可信度。根据不同链接情况:1)低评分网页主动链接到高评分网页,导致高评分网页分数降低;2)高评分网页主动链接到低评分网页,为低评分网页“背书”等情况,比较主题相关度,调整分数传递。最后,将提出的评价算法在公开数据集WEBSPAM-UK2007上进行了验证,通过不同的评价指标,与Page Rank和Trust Rank算法进行对比,实验结果显示该算法能够有效地降低垃圾网页的评分,从而抑制垃圾网页作弊。
其他文献
点击率(Click-Through-Rate,简写为CTR))预估是通过获取用户与待点击对象的特征及交互数据,分析用户是否会对这一点击对象产生点击行为。CTR预估的应用场景广泛,在电子商务、推荐系统等热门领域内均被视为核心问题,也展现出了巨大的商业价值。CTR预估的主要挑战来源于:在实际业务场景中,信息内容的特征具有高度稀疏和特征来源广泛的特点,这导致传统分类问题的解决策略在CTR预估问题上难以保
X射线CT利用X射线穿过物体后造成的衰减差异信息可重构出反映被测物体内部结构的灰度图像。传统XCT存在分辨力低、无法进行材料鉴别与分解等不足。能谱CT技术通过光子计数探测器(PCD)可以一次获取被测物体在多个不同能量段下的投影数据,具有分辨力高、组织对比度高、辐射剂量低和能进行材料鉴别和分解等优点。材料分解是能谱CT重要应用方向,如何提高材料分解精度是目前能谱CT研究热点之一。论文研究了基于图像域
采用传统的片式散热器的油浸式自冷变压器存在占地面积大、散热效率低等缺点,在迎峰度夏处于满负荷或超负荷运行时,其温升常超过国标要求。近年的研究表明三维肋管作为具有三维扩展表面、无源强化传热的代表之一,能有效破坏流动边界层,提升散热能力,因此在油浸式变压器散热领域具有很好的应用前景。然而,对竖直三维肋管油侧和空气侧的自然对流换热特性研究仍较为缺乏,管排方式及管间距对自冷变压器的油流量分配和换热性能的影
劳动教育既是一个教育问题,又是一个科学问题,构建劳动教育体系回应了劳动教育的双重诉求,也是新形势下加强和改进高职院校劳动教育的必然要求。通过对学校劳动教育的特点、高职人才培养目标及当代青年学生素质状况的分析,提出高职院校劳动教育的知识目标、能力目标与素质目标,并据此分析劳动教育的内容体系、路径体系与保障体系。劳动教育的内容应包括劳动观念教育、劳动素质教育、劳动精神教育三个主要方面;劳动教育的路径主
图像分类是图像处理的热点问题,很多研究工作都致力于提高图像分类的性能。然而如何快速、准确地对图像进行分类仍然是一项具有挑战性的任务。近年来,宽度学习系统(Broad Learning System,BLS)因其具有训练速度快、超参数少等优点,已被用于解决图像分类问题。然而在复杂的图像数据集(SVHN、CIFAR-10和CIFAR-100)上BLS的分类性能较差。本论文的研究目的便是提升BLS在复杂
活性氧(ROS)主要包括羟基自由基(·OH),超氧自由基(O2·-),单线态氧(~1O2)等。在正常水平下,ROS参与细胞内多种信号传导和调节,起着重要的生理调节作用,而ROS水平升高时会损伤细胞内核酸、蛋白质、脂质等重要大分子物质,导致细胞凋亡或者癌变。癌细胞内ROS水平升高的同时,ROS清除率也随之提高,以维持细胞内氧化还原处于平衡状态。因此,癌细胞对外源性ROS更加敏感。光动力治疗(PDT)
压铸镁合金开发是汽车轻量化技术的关键,也是目前汽车材料领域的研究热点。然而,由于压铸工艺成型特点,使得合金中存在不均匀微观组织和大量的缺陷。不均匀组织和缺陷对合金的力学性能,特别是塑性,有显著影响,这也限制了压铸镁合金在工业上的进一步运用。因此,深入理解压铸镁合金微观组织、缺陷和力学性能关系非常重要,是通过优化压铸工艺参数来改善合金力学性能的基础。本课题以压铸AE44和AM60合金为研究对象,探究
调查研究发现,大型滑坡在滑动过程中会表现出摩擦衰减体积效应和反粒序堆积的现象。摩擦衰减体积效应是指滑坡体滑动过程中的等效摩擦系数会随着滑坡体积的增大而减小,使大型滑坡在滑动过程中表现出超强的流动性的现象。反粒序堆积现象是指滑坡体在滑动过程中会发生颗粒分选过程,使大粒径颗粒向滑坡体上方移动、小粒径颗粒向滑坡体下方移动,最终在滑坡堆积体中形成反粒序堆积结构的现象。本文主要的研究内容和结论如下:(1)根
优化问题不仅在科技发展和工程应用等领域普遍存在,其复杂程度也随着各种各样的需求而日益提高。粒子群优化算法因其简单、高效的优点受到了广泛关注并被成功应用于解决实际的优化问题。然而,粒子群优化算法抵抗早熟陷阱的能力仍显不足,存在处理方法与应对策略单一、忽视粒子自身状态与更新策略之间关联等问题。针对上述问题,本文提出了基于综合学习策略的自适应分层更新粒子群优化算法(Adaptive Hierarchic
目的血影蛋白(Spectrin),最早发现存在于红细胞中,是由α亚基和β亚基组成的一种延伸灵活的细胞骨架蛋白,主要参与维持红细胞的力学稳定性和弹性以及细胞基本形态结构。随着对于血影蛋白的深入研究,除上述等作用外,它还参与细胞信号转导、细胞黏附、细胞极性和增殖等过程。Spectrin四聚体通过β-spectrin与肌动蛋白微丝结合,形成一个扩展的网络。越来越多的研究表明肌动蛋白骨架在T细胞免疫中发挥