深层网络爬虫研究综述

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:qqiuhe123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的迅速发展,网络资源越来越丰富,人们如何从网络上抽取信息也变得至关重要,尤其是占网络资源80%的Deep Web信息检索更是人们应该倍加关注的难点问题。为了更好的研究Deep Web爬虫技术,本文对有关Deep Web爬虫的内容进行了全面、详细地介绍。首先对Deep Web爬虫的定义及研究目标进行了阐述,接着介绍了近年来国内外关于Deep Web爬虫的研究进展,并对其加以分析。在此基础上展望了Deep Web爬虫的研究趋势,为下一步的研究奠定了基础。 With the rapid development of Internet, network resources become more and more abundant. It becomes very important for people to extract information from the Internet. In particular, Deep Web information retrieval, which accounts for 80% of network resources, is a difficult problem that people should pay close attention to. In order to better study Deep Web crawler technology, this article on the Deep Web crawler content is fully and in detail. Firstly, the definition and research goal of Deep Web crawler are expounded. Then, the research progress of Deep Web crawler at home and abroad is introduced and analyzed. On this basis, the research trend of Deep Web crawler is prospected, which lays the foundation for further research.
其他文献
目的 探讨优质的护理对气管插管术后患者的重要性.方法 回顾分析我院在2009-2011年气管插管30例患者的临床资料,对呼吸机、吸痰、人工气道、气囊护理等分析.结果 26例患者通
目的 总结记忆合金肋骨环抱接骨板作为内固定材料治疗连枷胸,对手术方式、术后呼吸功能恢复、胸廓稳定性、优缺点,就如何更好地提高该项技术提出我院的方法,且总结及观察其效
自学考试的发展陷入困境的根源在于至今仍带有计划经济的色彩,存在明显的“普教化”倾向。新形势下,自学考试必须重新做好自身定位,坚定发展信心,把发展终身教育和开放教育作
目的:观察探讨老年结肠癌性梗阻的临床特点及诊治方法,总结其临床疗效及临床意义。方法:选取我院2009年5月至2011年5月38例年龄在60岁以上的结肠癌性梗阻的患者,对其临床诊治
文体活动是深受企业职工欢迎的活动,文体活动形式和方法不断改革和发展,是提升企业职工凝聚力的一个重要手段.在从事职工的多年文体活动中,笔者对文体活动有着几点心得体会.
BP网络是一种得到广泛应用的人工神经网络模型.本文简要介绍了BP算法的原理,并给出了其在VC++6.0中的实现方法。 BP network is a kind of widely used artificial neural n
随着信息化网络化的飞速发展和人们文化信息需求的日益增长,图书馆在人们的生活中扮演越来越重要的角色,然而随着电脑在图书馆领域的普及,图书馆电脑网络应用的维护成为图书
社会是不断向前发展进步的,企业文化建设也是一个与时俱进的过程,物质文化、精神文化、制度文化、环境文化等都是企业文化的重要组成部分,以执行文化为基础和突破口,以标准化
大学生就业问题日趋严峻,高校亟需建立职业化、专业化的高水平就业指导教师队伍,以提升就业指导的效用,帮助大学生实现高质量的就业,但目前,我国高校就业指导教师的选择、培
对河南省726名大学生进行问卷调查,以考察大学生的职业探索状况与其成就动机之间的关系以及择业效能感的中介作用.研究得出以下结论:在环境探索上,城市学生得分显著高于农村