论文部分内容阅读
随着无线通信技术的不断发展和移动终端的普及,用户希望随时随地能从互联网获得所需要的信息。移动搜索的出现,解决了用户的这一难题。而移动终端具有屏幕和键盘小、运算处理能力差、带宽窄以及流量收费等特点,现有的移动搜索引擎如Google不能满足用户精确、智能、高效等方面的要求。如何快速而高效地满足移动用户获取所需要的信息成为一个重大而迫切的研究课题。本文在综合分析移动搜索特点的基础上,结合互联网搜索引擎垂直搜索技术,采用无线通信中最具有代表的无线应用协议技术,提出了一种移动垂直搜索模型,将垂直搜索技术延伸到移动领域,满足移动用户准确而快速地获取所需要的信息,具有很强的研究价值和应用价值。本文的研究内容主要体现在:首先,本文介绍了移动搜索的相关知识,使对移动搜索技术有一个大体的认识,为后面的系统设计开发做铺垫。其次,研究主题相关度排序算法PageRank的原理和优缺点。PageRank算法存在“主题漂移”的弊端,通过分析,提出一种改进方法,综合运用基于内容和基于链接两大因素。分别应用于主题判定方法和搜索排序过程中,通过系统仿真实验,进行数据分析,改进后的PageRank算法既能够提高主题爬虫的回收率,又能够提高搜索的准确率,可以有效地克服算法本身的缺点。再次,在开源搜索工具Lucene的基础上,结合系统,实现了几个关键模块的开发:Lucene索引模块和检索模块,并且实现了服务器端搜索服务。最后,在开源手机平台Android上,利用MyEcilipse插件功能进行开发,模拟实现了一个移动垂直搜索引擎。通过系统测试,可以提高主题查询的准确率,能够很好地克服传统综合搜索引擎搜索结果冗余多、结果重叠等弊端,具有很高的研究价值和应用价值。它将对未来移动搜索技术的发展开辟了一条新的道路,更好地满足用户快速、便捷、准确地检索到所需要的信息。