论文部分内容阅读
目前互联网上出现了大量构件库和零散的构件资源,但是,这些构件资源呈现部分集中、总体分散的特点,以及各个构件库对构件信息的描述存在差异,导致用户很难快速准确的检索到所需的构件。针对这一问题,利用本体知识标注构件,屏蔽不同构件库之间描述构件存在的差异,具有重大的现实意义。根据目前本体、领域本体和语义标注技术的研究发展,结合构件库的特点和应用需求,构建完善的构件本体知识库,并利用其中丰富的知识标注构件。针对构件描述信息的特性,将构件的标注分为两部分,即构件基本信息标注和构件功能描述信息标注,其中,本文对构件的标注侧重于对构件功能描述信息的标注。在构件标注的整个过程中,主要涉及到以下几个关键技术:①构建领域本体知识库;②基于自然语言处理的分词技术;③基于语义分类的关联词归并技术;④利用改进的编辑距离和Google距离计算概念和本体知识库中概念的语义相似度。针对构件库目前的现状,本文在领域本体知识的语义环境描述和构件库描述构件结构的基础上,提出了一种基于本体的构件库构件标注算法—OBSCA(Ontology-Based Software ComponentAnnotation,OBSCA)算法。通过利用构件本体知识库中丰富的语义知识对构件信息进行标注,不仅屏蔽构件库对构件信息描述的差异,而且方便用户快捷、高效地获取软件开发过程中所需的构件。文中利用完备的实验样本数据、设计完整的实验流程以及对实验结果的详细分析表明,OBSCA算法不仅保证了对构件标注的正确性、可行性和健壮性,而且,在实际应用中,该算法在用户检索构件时技术评价指标的平均查准率、平均查全率和平均综合指数都达到预期的目标。