【摘 要】
:
随着网络与信息技术的飞速发展,数据量呈现爆炸式的增长趋势。人们希望在大量数据信息中快速、准确地寻找出自己所需问题的答案。在此前提下,智能问答系统为了满足人们及时获取有用信息的需求而快速发展起来,具有巨大实际应用价值。语义相似度计算是智能问答系统中一个非常基础而关键的问题,长期以来一直是人们研究的热点和难点。但由于中文口语化以及词语组合灵活多变等特性导致语义相似度计算的结果一直很差,这极大的限制了问
【基金项目】
:
课题来源于与浙江达峰公司合作项目,合同名称为“智能家电云平台的关键技术与软件开发”,合同号为“2016-0-1-04127”;
论文部分内容阅读
随着网络与信息技术的飞速发展,数据量呈现爆炸式的增长趋势。人们希望在大量数据信息中快速、准确地寻找出自己所需问题的答案。在此前提下,智能问答系统为了满足人们及时获取有用信息的需求而快速发展起来,具有巨大实际应用价值。语义相似度计算是智能问答系统中一个非常基础而关键的问题,长期以来一直是人们研究的热点和难点。但由于中文口语化以及词语组合灵活多变等特性导致语义相似度计算的结果一直很差,这极大的限制了问答系统的发展。针对以上问题,本文进行了相关内容的研究,主要研究内容和创新点归纳如下:(1)针对智能问答系统中语义相似度计算准确率较低的问题,本文采用一种基于依存句法分析与向量空间模型的语义相似度算法。本算法首先建立以谓语动词为中心的依存句法树,获取句子的结构信息。然后结合向量空间模型,将句子分词获得的词序列映射到固定维数的向量空间中,最终使用余弦相似度计算公式获得两个句子间的语义相似度。实验结果表明,本文提出的方法能够对句子语义相似度计算起到一定的改进作用。(2)针对向量空间模型出现的维度灾难以及词语语义分裂问题,本文引入了Word2vec模型,并结合中文文本特点提出了一种基于Word2vec的字词向量融合语义相似度算法。该算法首先使用Word2vec训练获得固定维度的字向量与词向量,然后结合实际场景句子文本,将字向量与词向量进行浅层融合。实验结果表明,该算法可以有效提高语义相似度计算的准确率,进而提高问答系统的性能。(3)针对Word2vec无法获取句子层次语义信息的问题,提出了一种融合深度学习模型框架的语义相似度算法。首先,该算法利用Siamese Network框架建立两个相同且共享权值的网络结构对句子进行双向序列编码,融合句子包含词语的顺序信息。然后引入Google最新提出的自注意力机制,获取句子词语之间的语义信息关联。最后利用Compare-Aggregate框架提出的向量的运算,获得词语向量每一维度的语义差异性。经过实验测试,本方法在样本一中获得了高达82.35%的F值。(4)在智能问答系统的文本语义相似度算法研究的基础上,设计了一套面向家电客服的智能问答系统。涵盖了智能终端设计、通信协议设计、服务器端设计、数据库设计等内容。
其他文献
分数阶混沌系统是一类复杂的非线性系统。混沌具有对初值的极度敏感性及相轨道的内随机性,它的存在有时会让原系统不能按照预定结果输出,甚至使系统崩溃。但同时混沌所具有的不可预测性、隐蔽性以及复杂的动力学特性也使得其很适用于保密通信等研究领域,并且更能真实地描述实际系统。所以对分数阶混沌系统的分析与控制的研究具有重要的理论意义和实际研究价值。基于滑模控制,本文研究了分数阶Chen混沌系统的抑制以及同步控制
动作检测是依托于动作识别发展起来的一项技术,其目的是实现视频中人体动作的分类识别与时空定位,任务要求面向真实场景,在现实场景中具有较高的应用价值。由于面向视频的动作检测与面向图像的目标检测在任务模式上具有很大相似性,目前大多数时空动作检测算法会参考图像中目标检测的经典方法进行设计。但该类算法在处理视频时往往对多尺度的动作不能很好的检测,或者需要耗费大量的计算资源和时间,并且在进行实时的在线动作检测
电致变色是指材料的光学属性(反射率、透过率、吸收率等)在外加电场的作用下发生稳定、可逆的变化,在外观上表现为颜色和透明度的改变。电致变色材料在智能窗、汽车后视镜、大面积信息显示和电致变色镜子等较多方面应用前景广阔。低温、低成本制备具有出色电致变色性能的WO3薄膜的工艺探索是研究热点,超声喷涂法作为一种低温、低成本的镀膜方法,掀起了研究热潮。本文试图探究超声喷涂法制备WO3薄膜的工艺,通过溶胶和纳米
近年来,我国城市机动车保有量持续增长,道路交通压力逐渐恶化,交通拥堵日趋严重,这已经成为一个影响居民生活质量和工作效率的严重问题。城市公交具有载客量大、人均消耗油量低、节能环保等优点,因此大力发展公共交通和实施公交优先战略是缓解我国交通拥堵的有效手段。但在我国现行的公交运营体制下,日常的公交调度都是依照固定的时刻表进行发车,经常采用等间隔发车策略。这种一成不变的调度策略通常会产生一些问题,例如相邻
随着社会的不断进步,传统的第三方物流已经无法满足当今社会对物流行业的需求,因此,一种全新的物流管理模式——第四方物流应运而生。近年来第四方物流得到了快速的发展,它弥补了第三方物流的不足,通过整合外界信息资源,为客户提供一套完善的供应链解决方案。但第四方物流集成商只提供运输方案,不承担实际的运输任务,所以第四方物流集成商需要与第三方物流供应商进行合作,共同完成一项物流运输任务。本研究选择了多属性逆向
离心式压缩机是一种旋转机械设备,广泛应用于石油化工等行业,是工业过程重要的关键设备。压缩机在高速运行的过程中,如果部件异常演变为故障,压缩机往往会停机检查甚至损坏,造成生产的停滞和巨大的经济损失。如果在压缩机故障演变前预测关键变量,识别出故障,这对于保证设备的安全性,减少企业的维护成本和损失有着重要意义。故障预测的目的是利用设备历史数据的信息建模,输出未来时刻部件故障之前关键特征的变化。而基于循环
随着社会经济的飞速发展,黄金等稀有金属的需求量逐年升高,高品位矿产资源储量迅速减少。湿法冶金因其在处理低品位及复杂矿石上具有独特的优势而被广泛采用。随着湿法冶金生产规模的大型化,生产过程的复杂程度以及危险性也随之增高,连续的生产以及设备的长时间运行都会导致湿法冶金过程发生故障的几率升高。一旦有故障发生,将会造成巨大的经济损失甚至是安全事故等。因此,对湿法冶金生产过程进行准确的故障诊断至关重要。由于
冷轧作为钢铁产品生产的关键工序之一,在整个钢铁产品生产流程中处于最下游,对钢材的交货期起着至关重要的作用,其大规模、多工序、多机组的连续生产过程具有很大优化空间。每个工序设备的排程结果将对全局合同计划排程起着重要的优化作用。多工序多机组冷轧排程问题在组合优化研究领域类似于带时间窗的旅行商问题(Travelling Salesman Problem,TSP),实质是决策问题,决策材料所选设备以及生产
机器人的编程一直是国内外学术界和工业界探讨解决的问题。经典的编程方法有示教编程、离线编程、引导编程以及遥控编程。这些编程方法因其独有的优势在实际生产和研究中取得了很多应用。目前在装配领域新的应用需求越来越要求机器人的智能化,特别是在小批量、短周期产品需求上,应用领域也更加广泛,这对机器人编程、校正、认知能力都是新的挑战。因此演示编程成为其中的最大热点,然而很多的研究将人的演示直接转化为机器人程序。
随着智能泊车、仓储物流等行业的兴起,移动机器人的市场占有率逐年升高。机器人的定位问题作为机器人性能的关键衡量指标也愈发重要,本文基于多年机器人竞赛的经验,立足于赛场上电磁环境复杂、运动状态多样化的特点,从机器人定位的实际应用角度出发,设计了一款定位实时性高、抗干扰能力强、精度高的平面定位模块。并在此基础上持续改进,着眼于定位精度与定位稳定性的逐步提升,力求推广至商用机器人与工业级机器人的复杂应用场