论文部分内容阅读
本文探讨了目前几种成熟的技术,如:Web爬虫、Web数据抽取、Web服务等,然后将它们整合后设计出一套针对软件更新管理的应用系统。本文首先主要是对整个系统的设计思想进行详尽地描述,然后再实现了搜索、数据库两个系统,最后还对本系统的发展提出相关的意见。本系统的结构包含了三大部分:搜索系统、数据库系统,以及前端系统。作者经过对WebSPHINX和DEByE做出了深入的研究后,决定将这两个系统进行整合来实现搜索系统,然后通过WebSPHINX和DEByE的部分功能用来对相关的网页进行捉取,以及将有关网页里的相关数据进行抽取,并储存为XML文件。由Access和作者自行开发的程序所组成的数据库系统,则负责将存有数据的XML文件进行转换、分析和检测。最后,还开发了让用户通过Web服务端口来搜索系统内的数据库搜索系统。
通过本系统,用户将能够很简单地就能获取软件的最新更新数据。而不需要到一个个不同的网站去搜索、查找等,既费心又耗时的工作。这除了能够简短了用户花在搜索和查找软件、网站的时间外,还让用户能够经常很方便地进行更新以提高用户电脑内的软件质量。