语句相似度计算在智能答疑系统中的应用

来源 :东南大学 | 被引量 : 0次 | 上传用户:lollipop1910
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
答疑解惑是教学过程中不可缺少的环节,如何在Internet环境下设计具有自动答疑功能的网络自动答疑系统,成为当前智能教学的研究热点。目前国内外在这方面做的工作,主要集中在如何提高系统的智能性,代表性的算法主要有关键词匹配算法、句子相似度算法等。这些算法具有一定的智能,但就返回答案的准确率以及系统的个性化服务等方面还存在很多问题。 笔者针对这些情况,根据智能答疑系统实现原理,结合远程教学的特点,从本单位的实际情况出发,构建一个特定领域的新型智能答疑系统。主要做了以下几方面的工作: 1.通过分析当前的几种语句相似度计算方法,并指出其存在的不足基础上,提出一种新的语句相似度计算方法,该算法可保证语句的一个分句或短语整体发生长距离移动后,仍与原来的语句很相似,智能性和准确性都很高,对系统具有实用性。 2.提出基于单字的倒排索引和语句长度索引的最相似语句查找算法。该算法不仅高效,克服了顺序查找算法速度慢、效率低的不足,而且答疑库的规模对查询平均时间影响很小,提高了系统查询的速度。
其他文献
当前,C2C电子商务发展潜力巨大,但在实际电子商务应用中,信用危机问题却日益突出,特别是在线信任相当匮乏,严重制约了C2C电子商务的发展。此外,由于电子商务的虚拟性,交易双
如今Internet应用如火如荼,IP宽带业务高速发展,网络流量不断的扩张,骨干网络中采用了流量工程技术来均衡负载,最大化的利用资源,减少拥塞的发生,以确保应用业务的IP QoS需求。MPLS
工作流是针对工作中具有固定程序的常规活动而提出的一个概念。通过将工作活动分解成定义良好的任务、角色、规则和过程来完成执行和监控,达到提高生产组织水平和工作效率的
图像编码是多媒体信息处理的核心技术。图像编码的目的是通过消除图像中象素间冗余、统计冗余和视觉冗余,以较少的比特数达到图像高视觉质量压缩的目的。压缩比和视觉质量是衡
随着网络的发展及企业规模的不断扩大,企业内部网的信息管理也越来越复杂,存储在系统上的敏感信息需要不同级别的保护,工作流技术的普遍应用也加大了对数据安全控制的复杂性。企
随着嵌入式技术的不断发展,各种嵌入式实时操作系统相继出现,给各个嵌入式应用产品开发商提供了多种选择,但是基于很多嵌入式操作系统建立系统平台软件的方便性和稳定性都不
随着海量数据的产生,对数据的存储和访问性能要求越来越高。在分布式文件系统中,元数据访问是数据访问的必经之路,并且在所有访问中,元数据的访问占了50%以上,因此提升元数据
随着半导体技术的飞速发展,闪存的生产成本随之下降,基于闪存的固态盘(SSD,Solid State Drive)技术在存储系统中的使用越来越广泛,相比于传统的机械式硬盘(HDD,Hard Disk Drive),SSD没
大数据时代对于应用多样性的需求和存储数据爆炸式的增长使得数据中心面临提高性能、降低能耗、增强扩展性和灵活性的挑战。以太网光纤通道(FCoE,Fibre Channel over Etherne
本论文是结合电力行业具体解决方案的研发而完成的。解决方案要求实现自动化综合监控系统,实时监控现有其它服务程序和系统资源的运行状态,并根据预先设定好的规则触发相应动作