论文部分内容阅读
构建一个基于 RSS 的 P2P 分布式博客搜索引擎。利用 Pastry 协议,实现分布式博客采集系统的数据存储和传输。在各子采集系统上分别建立索引,分散了系统维护庞大索引的重负。实现分布式查询, 提高了查询响应速度。利用 RSS 文件的结构化特性,数据采集系统能很好地跟踪博客站点的更新,从而达到对更新频繁的博客站点的实时搜索。