基于人工智能的课程答疑系统的研究

来源 :大连海事大学 | 被引量 : 1次 | 上传用户:zjxtlgj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动问答系统结合了人工智能技术和自然语言处理技术,在正确理解用户语义的基础上,把答案精简的返回给用户,对自然语言正确的理解将成为炙手可热的研究方向之一。自动问答系统按照研究方向分为限定域和非限定域,而“软件测试”答疑系统作为自动问答系统限定域方向,在该方面的研究还存在很多空白,因此本论文针对软件测试课后的答疑进行研究,设计并实现了答疑系统。其主要研究内容如下:(1)构建软件测试课后答疑知识库。本论文收集数据的方式有两种,一种是使用免费且公开的爬虫软件爬取百度百科和论坛中的数据;另外一种是通过人工的方法收集,软件测试书籍和高校考试试卷中的数据,然后对收集的全部数据,使用Pandas进行清洗处理。(2)自然语言处理。在分词上,使用Jieba分词库,并结合自定义软件测试专业领域词典,以提高中文分词准确度;在去停用词上,使用哈工大去停用词表去掉对句子无意义的词;在关键词提取上,选择改进的TextRank算法实现关键词提取;在同义词处理上,使用哈工大同义词词林扩展。(3)语义相似度计算。在本软件测试答疑系统中,核心思想就是可以使用自然语言查询问题。本答疑系统先对自然语言处理,如对句子进行分词、去停用词、关键词提取、同义词处理等操作,然后使用Word2Vec中的CBOW模型训练词向量,构建词向量矩阵,最后用词向量矩阵作为卷积神经网络的输入层,在池化层为了提高特征使用max-pooling,最后输出的为相似度值,如果超过阈值,则倒序输出查询结果。(4)软件测试答疑系统的实现。系统使用Flask实现可视化,系统分两个角色:分别为教师和学生,教师端的功能有查询问题、查看全部知识库、热门问题、待解决的问题、我的回答和个人信息中心,学生端的功能有查询问题、查看全部知识库、添加未找到的问题、个人查询的问题集合和个人信息中心。
其他文献
后现代主义是20世纪末西方社会流行的一种哲学和文化思潮,其影响遍及各个领域。强调反思和批判精神、反中心和提升非理性、倡导多元化的方法论和提倡淡化价值判断是其显著特
国民体质健康是经济发展的重要基础,关乎国家繁荣昌盛、民族富强。学生作为国家后备人才重要力量,其体质健康问题应得到关注。面对当下学生体质健康所处窘迫局面与困境,将健
<正> §7—1 研究和处理制图领域中的模糊信息的战略意义在以上的章节中讲到模糊数学在地图制图中的多种应用,现代地图制图学的基本理论还包括有地图信息理论,地图模式理论、
信息通信技术是网络空间安全的基础和保障。文章首先简要回顾了党的十八大以来我国信息通信技术产业的发展成就,以芯片和操作系统面临的突出问题为例说明我国ICT技术发展面临的困难,分析了我国ICT技术发展面临的机遇和挑战,并从技术、产业发展、政策引导等方面提出了发展措施。