论文部分内容阅读
随着Internet技术的广泛应用,人们对信息量的需求变的越来越大。同样在教学活动中,学生对信息量需求也在不断的加大,传统教学模式由于其资源库的局限性,已经无法满足当代学生的需求,因此网上教学应运而生。网上教学采用Internet技术,为学生打造了一个自主学习的环境,同时它还能够充分的利用网络资源,打破了传统教学资源库的局限性。答疑活动是教学过程中的重要的环节,也是学生获得知识最直接的途径之一。在网络教学中,网上答疑系统性能的高低直接影响网上教学的质量,但现有的答疑系统还存在着很大的缺陷,尤其是智能性方面比较差,因此一种高智能的答疑系统成了网上教学的迫切需求。中文分词是智能答疑系统的核心技术,也是决定答疑系统智能性的关键。基于中文分词在智能答疑系统中的关键性地位,本文主要做了如下工作:首先对现有答疑系统的优缺点进行分析,对中文分词技术进行简要的概述,然后本文针对智能答疑系统进行研究,设计了适合本系统的专业词典结构--双字hash词典存储结构。同时还设计了一种优化的最大匹配中文分词算法,改进的算法可以通过首次字索引动态的获取词的最大长度,并以此作为分割的依据,打破了传统最大匹配算法以固定词长作为分割依据的局限性,提高了分词效率。算法还结合基于统计的方法来处理分词结果的歧义现象,形成了词典与统计相结合的整体算法结构,本文还将改进的中文分词算法应用到了Lucene(当前最流行的全文检索工具包)当中,弥补了Lucene的自带分词器的不足。最后本文采用Lucene技术并结合java当前最流行的SSH(Struts2+Spring+Hibernate)三大开源框架实现了一个基于web的智能答疑系统,系统主要包括了智能答疑、BBS答疑和Email答疑三大功能模块,同时还实现了问题库管理、用户管理等模块,保证了系统功能的完整性。本文基于本地问题库中的大量课程资源对系统进行了检索测试,测试结果表明,系统具有良好的性能,能够满足用户的需求。