论文部分内容阅读
随着信息化技术的更新和教育改革的推进,各种优质网络学习资源呈现指数级增加的态势,然而庞大而高质量的网络课程应用现状却不容乐观。其中一个很重要的原因就是目前的网络学习资源以单向知识传播为主,缺乏师生交流,并没有体现出网络的互动特征。在这种发展形势下,自动问答系统因其跨时空的特点,为改善资源的利用现状和实现学生的实时答疑提供了一种可行的解决方案。在自动问答系统的研究中,首要问题就是知识库的构建。本体作为一种机器可理解的语言,支持从语义理解的角度分析信息,同时具备知识产生所需的必要推理机制。因此本文在研究分析了本体相关理论和已有研究成果的基础之上,提出了一种基于互联网资源的本体自动构建技术,并随机选取五个学科,从时间复杂度和资源消耗的角度评定了自动构建技术的有效性。整个本体构建过程分为资源爬取、领域概念提取和本体关系建立三个主要部分。其中资源爬取部分重点完成了爬虫的准备工作和中文分词的改进工作。领域概念提取部分借助建立的关键词索引表,基于概率统计原理筛选出高频词汇作为备选的领域概念。本体关系建立部分,通过web挖掘技术,对所有网页做针对概念和实例的关联分析,最终完成了本体关系网络的建立。在此技术基础上,本文以《C程序设计》课程为例搭建实验平台。实验中以手工构建的本体为对照,采用定性分析和定量分析相结合的评价方式验证了所述技术在实际应用中的可行性。最后,将建立的课程本体应用于语义答疑系统,以弥补网络学习缺乏师生交流的不足。课程本体自动构建技术的设计和实现,一方面提供了一种新的知识库构建形式,为自动问答系统的发展提供了技术基础。另一方面也大大降低了手工构建本体知识库的工作周期,简化了本体构建的繁琐流程。这对于自动问答系统的发展和当前网络学习资源现状的改善有着切实意义。