超链分析相关论文
当前,互联网已经成为了人们获得信息的一个主要来源。而网页数量已经达到了百亿级,并且在以每日数百万网页的速度增长。由于其规模如......
该文的内容主要包括以下几个方面:(1)引入超链分析方面的研究.介绍WWW中的超链概念,及其在搜索引擎中引入的意义和前景,提出作为文......
Web上的信息资源呈爆炸式的增长,人们查找信息越来越难。搜索引擎是其信息利用的主要工具,然而当前搜索引擎存在不足:基于关键字匹......
在Web站点中,不同用户访问过的网页文档路径显然是不同的,但不同用户都访问过的网页文档路径却是非常重要的.对此,合理利用这一特......
分析当前主题爬虫策略的优点和不足,提出基于内容评价与超链分析的主题爬虫策略.实验结果表明,基于该策略的主题爬虫准确率和召回......
4月30日,中国工程院公布了2019年院士增选有效候选人名单,百度创始人、董事长兼首席执行官李彦宏位列其中。据中国科学技术协会介......
给出了为主题精选算法(如HITS)构造Web邻域图的方法和实用系统。该系统基于Web搜索引擎(AltaVista),使用额外的Visual C++软件模块......
分析了著名搜索引擎Google采用的PageRank算法,指出其偏重旧网页、忽视专业站点以及对网页中的超链接评估不恰当等不足之处.改进算......
文章分析了传统的基于文本处理的信息检索算法在处理WEB页面时遇到的问题,指出在处理WEB页面时,应分析页面中超链的意义,给出了超链分......
搜索引擎是目前最主要的WWW信息检索的工具,然而,用户对当前搜索引擎的检索效果并不满意.论文给出了基于文档文本内容和文档间超链......
随着互联网的普及和发展,网络上的信息资源越来越丰富,它需要高效智能的工具来完成信息资源的采集.介绍了智能化网页收集工具系统......
本文介绍超级链接(Hypertext Link)中超链文字的作用,探讨如何利用超链文字的信息自动获取网页文件的主题词描述,以及该算法在搜索......
论述了三代搜索引擎的发展,着重介绍了第三代搜索引擎的体系结构,详细讨论了该搜索引擎的几个核心技术--大规模搜集技术、超链分析......
爬虫是搜索引擎的关键组成部分,本文提出了一种可利用之前爬行数据自动改进其分析算法与种子URL集合的主题爬行算法,并讨论了其首次......
基于关键字匹配的搜索引擎排序网页时仅仅考虑评价网页的重要性,而忽视分类;基于分类目录的搜索引擎很难动态分析Web信息。本文在分......
作为一种相当成功的基于超链分析的算法,PageRank算法可以有效地衡量网页重要度权值,然而进一步的研究也表明,这种纯粹依赖于超链......
期刊
随着Internet的高速发展和快速普及,Web上可以获取的信息也在急剧增加。由于无法浏览全部的Web文档,所以人们往往求助于搜索引擎来......
本文首先分析了常见的三种搜索引擎:基于内容分析的搜索引擎、基于超链分析的搜索引擎、基于反馈分析的搜索引擎的弊端,提出了一种......
针对管道科技工作人员进行大量专业化信息检索的业务需要,在系统分析和研究专业搜索引擎实现技术的基础上,采用多线程编程技术,设计开......
由于目前搜索服务被越来越多的用户所认识和青睐,各样的搜索引擎也应运而生。文中阐述了搜索引擎的工作原理,并对搜索引擎按照不同的......
首先分析了查找相关网页的一些相关算法,然后在标准的HITS算法基础上,提出了基于修正的HITS的查找相关网页算法。最后,通过实验来分析......
从经典信息系统理论的角度剖析了搜索引擎,并将搜索引擎信息系统的核心--相关性测算的发展划分为三个阶段:布尔逻辑阶段、向量模型......
随着互联网上信息量爆炸性地增长,如何高效、低成本地利用Web信息资源就逐渐成为信息服务机构和最终信息用户所关注的问题。本论文......
介绍了搜索引擎百度与Google的现状,分析了搜索引擎的工作原理及其核心技术——超链分析技术,并比较了百度与Google搜索功能的异同......
爬虫是一类网络信息采集系统,它从一些给定的URL(称为种子URL集合)出发,通过下载URL对应的网页、分析页面内容、并跟随其中的链接来......
随着互联网的不断发展,网络已成为人们发布和获取信息的主要平台。由于互联网是一个高速增长、完全不受控制的异构信息集合,因而无......
搜索引擎是目前最主要的WWW信息检索的工具,然而,用户对当前搜索引擎的检索效果并不满意。这主要表现为: (1)搜索引擎返回的结果是......
论述一个面向主题的网页搜索系统(SATWP),该系统在智能代理的辅助下具有搜索、导航、以及信息反馈等功能.在判断网页与查询主题的......