论文部分内容阅读
随着Internet的快速发展,网络上现存的信息形成了一个分布于全球的混合信息空间。为了帮助用户检索和获得网络上的丰富信息,网络信息检索系统应运而生。Web信息检索现已成为一个新的研究、开发领域,其最新发展趋势是检索的智能化和垂直化。 本文介绍了网络信息检索的理论和检索中的数学模型,在对当前网页识别技术、分词技术、人机交互技术等相关技术进行分析和研究的基础上,设计了一个功能完备、结构合理、切实可行的个性化网络信息检索系统。系统利用元搜索引擎技术获取网络信息,采用黎曼空间模型(Riemann Space Model)实现了多级检索,并采用基于空间最短连线距离的差异度计算方法对网页进行评级排序,同时利用用户建模技术建立用户信息库,以实现检索的个性化。最后在实际的课题973预研项目“针刺与汉语认知神经信息学研究”中,设计并实现了个性化神经信息学网络信息检索系统。系统在Windows 2000 server环境下使用Java语言开发,后台采用Oracle 8i数据库用于保存专业词典、特征向量、用户日志。该系统已处于试运行阶段,并取得了令人满意的效果。 本文所研究的内容有效地解决了脑神经信息检索的实际问题,并对网络信息检索的设计与实现具有一定的参考价值。所设计的个性化网络信息检索系统是一种通用的垂直化信息检索系统的解决方案,具有较广泛的研究意义和应用价值。