【摘 要】
:
随着大数据时代到来,问答系统作为一种能够高效获取有效信息的手段,引起了各行各业的广泛关注。在军事装备领域,大量的装备类型、型号以及参数信息等对指挥作战人员非常有用,但这些信息却未能得到有效利用。主要原因是现有的搜索引擎给出的查询结果数目过于繁多,相关工作人员无法迅速找到自身所需的信息。针对传统搜索引擎在装备领域存在的问题,本文基于军事装备数据,构建了一个契合用户的个性化问答系统。该系统采用模块化方
论文部分内容阅读
随着大数据时代到来,问答系统作为一种能够高效获取有效信息的手段,引起了各行各业的广泛关注。在军事装备领域,大量的装备类型、型号以及参数信息等对指挥作战人员非常有用,但这些信息却未能得到有效利用。主要原因是现有的搜索引擎给出的查询结果数目过于繁多,相关工作人员无法迅速找到自身所需的信息。针对传统搜索引擎在装备领域存在的问题,本文基于军事装备数据,构建了一个契合用户的个性化问答系统。该系统采用模块化方式构建,主要包括数据获取模块、个性化模块、问答模块等。其中,数据获取模块主要通过爬虫技术实现;个性化模块采用多种推荐算法实现,并在特定的应用场景对推荐算法做出相应的调整和优化;问答模块构建了多种查询方式,并使用个性化模块对问答结果进行优化。最终构建出的个性化问答系统解决了用户的个性化查询需求。主要工作如下:(1)构建了基于爬虫网络的数据获取模块。通过对真实装备表头信息以及相关军事网站装备信息的研究,采用MongoDB数据库和MySQL数据库相结合的方式,构建了一套基于WebMagic爬虫框架的异步网络爬虫系统,为个性化问答系统的各个部分提供数据支撑。和传统基于Http协议获取数据的方式相比,该数据获取模块具有速度快、高并发等特点。(2)构建了基于推荐算法的个性化模块。在基于内存、内容和模型的推荐算法的基础上,首先结合知识图谱提出了一种基于路径(path-based)的可为新用户寻找可靠邻域用户的方法,有效解决了系统中新用户冷启动的问题;然后结合评分预测模型,提出了对初始推荐列表装备进行预测打分处理的方法,解决了传统算法生成初始推荐列表缺少全局评价指标的局限性;最后在生成动态推荐列表时加入用户历史权重因子、评分特性等衡量标准,解决了传统算法生成的动态推荐列表不够个性化的局限性。实验结果表明,本文提出的方法比之传统方法在各类评测指标上均体现出一定的优势。(3)构建了系统的问答模块。通过分析不同用户群体的实际需求,设计了基于问答模板和基于关键字的两类查询方法,并针对传统查询方法中回答结果繁多以及个性化不足的局限性,采用个性化模块对问答结果进行了优化。实验结果表明本文构建的问答模块回答结果简洁且极具个性化。(4)搭建了基于上述三个模块的装备个性化问答系统。后端业务逻辑基于java中的Spring Boot框架实现开发,前端界面基于html+css+js的方法实现开发。最终构成的问答系统不仅能为用户提供自然语言查询服务,还能针对不同用户,提供个性化服务。
其他文献
随着互联网和物联网的高速发展,新的业务场景层出不穷,云计算和边缘计算技术应运而生。一方面,云计算技术为用户访问互联网上海量计算资源提供了便利。普通用户不需要了解集群的内部原理,也不需要具备计算机专业背景知识,即可轻松获取大量云端资源。另一方面,云计算技术高延迟、高能耗的缺点限制了它的使用场景,而边缘计算将资源部署至更加靠近用户的边缘端,具有网络延迟低、宽带需求低等优势,可以适应智能家居、数字医疗、
深度模型性能提升的同时,模型参数增加、内存使用资源增加、训练时间过长、计算量过大等问题接踵而至。这些问题使得嵌入式设备、集成设备等资源受限机器无法正常使用,从而影响深度学习的应用推广。在此背景和市场需求下,针对模型压缩方法的研究具有重要意义,知识蒸馏是一种近几年来被广泛关注的模型轻量化方法,学生模型通过模仿教师模型进行训练。学生网络模型在教师网络模型的指导下,可以更好地学习数据集中的结构化知识。基
近年来,电力系统自动化、信息化及智能化发展水平显著提升,许多新技术应用到传统电力系统中。轨道交通电力数据采集与监视控制(Supervisory Control And Data Acquisition,SCADA)系统和其他电力系统类似,有着强烈的稳定性、容错性和可靠性需求。恰逢成都轨道交通电力SCADA系统智慧维保科研项目立项,本文借此契机以轨道交通电力SCADA系统的状态估计功能作为出发点,改
随着容器技术和Kubernetes的兴起,全球众多的云厂商纷纷推出属于自己的容器云服务。容器技术的浪潮从Docker的普及开始,直到Kubernetes的逐渐成熟才真正的落地,才开始真正实现从传统的应用部署管理模式向容器服务模式转变。2020双11期间,阿里已经将80%的核心业务部署到容器云平台当中,Google更是已经在生产环境当中积累了数十年的容器服务经验,而Kubernetes正是其开源的容
近年来,网络安全问题不断增加,这导致了网络的控制和管理面临越发严峻的形势。为了应对网络不安全因素的威胁,网络管理人员亟需一种有效的手段来加强对网络的安全控制和管理。网络脆弱性分析是预防网络攻击发生方法的重要一环,能够帮助网络管理人员建立完备有效的网络控制和管理机制,同时也是网络科学领域的研究热点问题之一。网络中的高风险节点指在网络中影响力高,但防御力低的节点,这些节点是造成网络脆弱的重要因素。现有
自21世纪以来,随着芯片制造与设计工艺的快速发展,计算机的算力有了质的飞跃,因此机器学习科学取得了空前的应用,尤其是深度神经网络在各领域的应用。在使用传统的最优控制理论处理机器人控制问题时存在两个主要难点,其一是需要清楚的知道被控系统的行为模型;另外一点是模型需要精确的输入输出,使用函数估计器带来的误差很大程度上会导致控制模型的失效。强化学习则需要对每个函数都进行近似估计,通过近似估计实现对实际的
我国拥有相对较为丰富的水能资源,但水能资源利用率相对不足,通过对径流时间序列进行可靠的丰枯性预测可以协助决策供电方案,优化发电资源调配,从而提高水资源的利用率,同时对于防洪抗旱方案的制定都具备一定的指导意义。近年来,对于径流丰枯性预测的研究也取得了一些辉煌的成果,但是仍存在着以下需要解决的问题:(1)径流序列不具备明显规律性,需要进行序列分解,但是传统分解方法受端点值影响较大(2)现实中水文数据的
与完全公开了通信规约的已知协议不同,当今的网络中有着许许多多的未知协议,个人或者一些软件厂商考量到有关安全问题、经济利益甚至个人隐私等各种各样的问题,他们并没有选择将协议的细节部分公之于众。由于未知协议在实现和实际应用过程中可能存在各种类型的安全威胁,且在实际网络环境中,目前的网络安全设备多基于已知的协议报文格式进行检测和防护,导致未知协议在实际通信应用过程中面临着极大的安全威胁。分析其存在的安全
分类、定位、检测、分割是计算机视觉领域最核心的任务。近年来,卷积神经网络(CNNs)技术取得了瞩目的成就,促进了目标检测技术飞速发展,越来越成为人类生活的便捷工具,在智能安防、智慧医疗、自动驾驶等领域广泛应用。尽管基于深度学习的目标检测取得长足进步,但在检测不同大小的物体存在相当大的性能差异。小目标物体由于自身尺度问题,存在被遮挡,特征不明显等问题,导致小目标难以检测。因此,小目标检测的研究也逐渐
域适应(Domain Adaptation,DA)是迁移学习的一个分支,其目的是将知识从带标记的源域迁移到缺乏标记但任务相关的目标域,为借助已有的数据知识和节约模型训练的资源成本提供了有效途径。根据目标域数据的获取形式,域适应方法可分为离线域适应和在线域适应。现有的域适应研究大多针对目标域数据全部提前收集的离线域适应场景,它们提出的方法大多从特征层面上关注如何减少两域数据分布的差异,在知识迁移的过