智能化网页资源收集工具的设计与实现

来源 :计算机工程 | 被引量 : 0次 | 上传用户:bittercoffee456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及和发展,网络上的信息资源越来越丰富,它需要高效智能的工具来完成信息资源的采集.介绍了智能化网页收集工具系统的实现方法,它把抓取器与超链分析器、文本自动分类器相结合,完成对用户要求领域的网页的收集.避免对用户不感兴趣领域的抓取.这样可以节省硬件、网络资源和提高资源采集效率.
其他文献
提出的算法是利用凸函数共轭性质中的Young不等式构造优化目标函数,这个优化目标函数对于权值和隐层输出来说为凸函数,不存在局部最小.首先把隐层输出作为变量进行优化更新,
介绍了异构网络物理拓扑发现算法的相关定义和系统模型.在分析原有基于MAC地址转发表算法的基础上,提出一种新的基于生成树协议的拓扑发现算法.运用算法开发的工具能准确发现
介绍了上海市行政督查网络管理系统,它是一个覆盖全上海区县、委办局督查网络的政务信息化系统,在该系统的建设过程中对相对独立的业务系统互联进行了一定实践.从具体业务应