基于超链接和内容相关度的综合爬行策略

来源 :微计算机信息 | 被引量 : 0次 | 上传用户:gaowufida
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
介绍了网页分析算法HITS算法,并对HITS算法进行改进,提出了一种基于超链接和内容相关度的网页排序算法VHITS算法。VHITS算法引入向量空间模型计算网页内容的主题相关度,并用来评价超链接的重要性,从而避免了HITS算法所产生的主题漂移现象,有效的引导主题挖掘。
其他文献
体温极限:0摄氏度 一旦体温降到36摄氏度,人的反应和判断能力都会削弱。当体温降到35摄氏度时,人们会感到难以行走。体温降到33摄氏度后,人们就会变得失去理智。体温降至30摄氏度
笔迹信息的采集是在线签名识别算法的基础。本系统是由触摸屏、触摸屏控制器ADS7846、单片机AT89C52构成的基于USB的在线签名数据采集系统.实现了对签名笔迹的坐标、速度及压
百菌清是一种高效、低毒、广谱性杀菌剂农药,主要用于保护蔬菜、作物和草皮免受真菌病原体的侵害。因为百菌清在环境中应用广泛、降解慢,且其代谢物4-羟基百菌清比其母体毒性更强的特点,引起了人们的广泛关注。为了安全且高效对水中百菌清降解,我们选取花青素和芬顿试剂对超纯水中的百菌清进行了光降解研究,旨在为农药企业废水、农田退水中百菌清的污染处理提供技术。实验结果主要如下:1.在太阳光、高压汞灯、紫外灯和氙灯
为了解决两足步行机器人的多节点通信和多轴协调控制问题,文章提出了应用CAN总线技术的设计方案,构成了有两台嵌入计算机PC/104和两条CAN总线控制网络.分别控制机器人的上肢和下