基于中文分词技术的智能答疑系统的研究

来源 :太原理工大学 | 被引量 : 7次 | 上传用户:l907603912
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术的广泛应用,人们对信息量的需求变的越来越大。同样在教学活动中,学生对信息量需求也在不断的加大,传统教学模式由于其资源库的局限性,已经无法满足当代学生的需求,因此网上教学应运而生。网上教学采用Internet技术,为学生打造了一个自主学习的环境,同时它还能够充分的利用网络资源,打破了传统教学资源库的局限性。答疑活动是教学过程中的重要的环节,也是学生获得知识最直接的途径之一。在网络教学中,网上答疑系统性能的高低直接影响网上教学的质量,但现有的答疑系统还存在着很大的缺陷,尤其是智能性方面比较差,因此一种高智能的答疑系统成了网上教学的迫切需求。中文分词是智能答疑系统的核心技术,也是决定答疑系统智能性的关键。基于中文分词在智能答疑系统中的关键性地位,本文主要做了如下工作:首先对现有答疑系统的优缺点进行分析,对中文分词技术进行简要的概述,然后本文针对智能答疑系统进行研究,设计了适合本系统的专业词典结构--双字hash词典存储结构。同时还设计了一种优化的最大匹配中文分词算法,改进的算法可以通过首次字索引动态的获取词的最大长度,并以此作为分割的依据,打破了传统最大匹配算法以固定词长作为分割依据的局限性,提高了分词效率。算法还结合基于统计的方法来处理分词结果的歧义现象,形成了词典与统计相结合的整体算法结构,本文还将改进的中文分词算法应用到了Lucene(当前最流行的全文检索工具包)当中,弥补了Lucene的自带分词器的不足。最后本文采用Lucene技术并结合java当前最流行的SSH(Struts2+Spring+Hibernate)三大开源框架实现了一个基于web的智能答疑系统,系统主要包括了智能答疑、BBS答疑和Email答疑三大功能模块,同时还实现了问题库管理、用户管理等模块,保证了系统功能的完整性。本文基于本地问题库中的大量课程资源对系统进行了检索测试,测试结果表明,系统具有良好的性能,能够满足用户的需求。
其他文献
随着虚拟环境(Virtual Environment,VE)技术研究的深入以及语义Web技术的广泛应用,语义虚拟环境(Semantic Virtual Environment)的研究已成为虚拟环境领域一个崭新的研究方向
无线传感器网络作为多学科相互交叉的新兴的研究领域,可以实时的监测和采集网络分布区域内各种监测对象的信息,并将这些信息发送给远方的观察者,来实现对目标对象的跟踪与监
随着计算机技术的高速发展,数字图像信息的应用面越来越广,数字图像处理技术也随之得到了空前的发展和更广泛的应用。图像缩放作为图像处理技术的一种,在实际应用中具有重要
目前,移动应用程序大多需要适配多个物理平台(Android&iOS)。由于各个平台在技术层面的差异性,同一应用必须针对不同平台进行定制,导致了软件设计与实现过程中的多遍重复式开
传统的关系数据库一般采用关系模型作为其信息数据的组织方式,而关系模型是以布尔逻辑和精确的数据工具为基础的,它不能够直接表示更不能够处理模糊的、具有不确定性的数据信息
随着互联网的迅速普及,互联网应用越来越简易,使得上网人数与日俱增。互联网生活呈现出多元化,复杂化的趋势,越来越多的人们开始关注互联网,开始通过互联网来发出自己的声音,
当前企业之间的竞争日益激烈,而企业之问的核心人才,无疑已经成为了现代企业最强有力的竞争力。但是,目前很多企业人才流失比较严重,原因有很多种,薪酬待遇,企业环境,职业发
语音情感识别是情感识别的一个重要分支,它利用计算机及其辅助设备提取说话人的情感特征,分析说话人的情感状态及其变化,进而确定说话人的心理情绪或思想活动,实现人机之间更
随着个人计算机上数据的海量增长,用户管理和使用这些数据变得越来越复杂。个人数据空间系统为用户数据管理提供了新的思路。如何方便快捷地获取用户所求信息,是当前数据空间
当前计算机视觉领域研究的热点之一就是人脸识别和行人检测,这一技术已经被广泛的应用在很多领域,比如智能电话、智能交通、无人驾驶等。由于算法的精度和速度等原因,很难应