论文部分内容阅读
本文简要介绍了光学发展史以及光学学科的发展对社会各个领域的重要贡献;参照有关光学学科分类标准提出了自己的光学学科分类方法,做出相应的光学分类;简单介绍了信息检索的相关概念,信息检索系统的结构和过程,Web信息搜索的特点,以及Web信息搜索系统的组成和工作过程。详细介绍了基于Web的光学专业数据库信息检索系统的建立和实现:原始光学信息经过分类后分为结构化光学数据和非结构化光学数据,经过对非结构化光学数据的预处理使其转化为结构化数据,然后将结构化分类光学数据导入光学专业数据库,建立人机交互检索界面,实现基于Web的光学数据信息的检索。 在非结构化光学数据的结构化处理中,本文提出了一种全新的中文全文汉语自动分词算法:引入上下文相关的词频,结合关键字词典,高效地完成中文汉语自动分词;另对光学文献的专业分类,也提出了一种新的计算机自动分类方法:即通过对增加光学类关键字的光学学科分类属性,计算光学文章中出现的各个所属光学学科类关键字的比例关系,定量地对光学文献进行分类。