【摘 要】
:
大数据时代社交网络、移动互联网、物联网等领域每天都会产生海量数据,数据的爆炸式增长导致了信息过载,同时也改变了用户的信息需求,从原来的文本信息过渡到现在的实体信息,相应地产生了实体搜索。不同于文档搜索,实体搜索旨在从多源异构数据中找出特定实体对象,对搜索质量的要求更加严格。传统的查询扩展方法能够提高文档搜索质量,但存在扩展项来源有限、扩展效率低和查询漂移问题,影响了查询扩展性能,不完全适用于实体搜
论文部分内容阅读
大数据时代社交网络、移动互联网、物联网等领域每天都会产生海量数据,数据的爆炸式增长导致了信息过载,同时也改变了用户的信息需求,从原来的文本信息过渡到现在的实体信息,相应地产生了实体搜索。不同于文档搜索,实体搜索旨在从多源异构数据中找出特定实体对象,对搜索质量的要求更加严格。传统的查询扩展方法能够提高文档搜索质量,但存在扩展项来源有限、扩展效率低和查询漂移问题,影响了查询扩展性能,不完全适用于实体搜索。针对上述问题,提出了一种面向实体搜索的语义查询扩展方法。在索引阶段,该方法通过构建分层的语义索引来存储异构信息并支持关联项的快速获取;在查询扩展阶段,基于建立的语义索引采用不同的扩展项生成方法和选取策略来获取结构化和非结构化扩展项,然后利用扩展项之间的关联性进行扩展项优化;最后,针对不同类型的扩展查询结果使用组合概率模型进行合并排序得到最终结果。该方法结合扩展项的特征并充分利用语义索引的高效性和不同查询扩展方法的优点,在保证查询扩展效率的同时提高了查询扩展效果,并且有效避免了查询漂移问题。为了验证语义查询扩展方法的性能,在ClueWeb09 Category B采样得到的数据集上进行了性能测试。实验结果表明提出的语义查询扩展方法在保证查询效率的前提下能够有效提高实体搜索的性能并缓解查询漂移问题。
其他文献
采用原位修饰的方法,在电活化处理后得到的片层石墨电极(SGE)表面分别原位负载Cu-MOF、MnO2和铜镍双氢氧化物(NiCu-LDH)等敏感材料,制备得到了原位修饰电极。采用SEM、XRD和XPS对
随着科学技术的进步,生产实际中被控系统规模越来越大,被控模型日益复杂,同时控制性能的要求也日益提高,关联非线性大系统的控制问题受到了国内外诸多学者的关注。虽然目前关于非线性系统,在分散控制、受限控制、事件触发控制及未知控制方向问题方面研究结果较多,但考虑多问题共存的研究结果极少。本文将采用反步设计的方法,基于Lyapunov稳定理论,针对下三角型关联非线性时滞系统的预定性能控制问题展开研究,并综合
国民经济的发展与自来水的生产有着密不可分的关系,它为我国人民的生活安定、身体健康奠定了坚实的基础。近几年,由于水资源短缺情况越来越严重、供水需求情况不断地增加、水
数字图像修复技术是对图像的破损区域进行填充的技术,能使修复后的图像不影响人的视觉感受。现今,该技术应用广泛,主要用于文物字画保护、老照片修复和字幕去除等。本论文根
社交媒体是当前我国社会各个圈层常用的交流工具。在目前的传播研究中,关注的重点是以公开表达为目标的大众传播和以趣缘及职业等条件建构的次级群体传播。但是对于社会学意
网络化控制系统(Networked Control Systems,NCSs)具备布线成本低,易于拓展和维护,可靠性较高等诸多优点,已在众多领域得到应用。通信网络的引入在提升系统性能和效率的同时,
空间技术的发展使得空间机器人的应用更加广泛,特别是作业时空间载体位姿无控的自由漂浮空间机器人(Free-Floating Space Robot)。本文以自由漂浮空间机器人为研究对象,对其仿真技术、基于采样的避障运动规划方法进行研究,论文主要研究工作如下:首先,本文基于Moveit!和开源运动规划库OMPL搭建了自由漂浮空间机器人的仿真平台。仿真平台中采用虚拟机械臂的方法设计了适用于任意结构的空间
随着制造业生产方式由大批量制造到小批量、多品种、更新快的转变,合理高效的生产调度对企业至关重要。作为连接计划和生产的关键活动,车间调度尤其是作业车间调度对企业生产
在轧机主传动系统中,单台电机拖动两个轧辊的控制系统会影响生产效率,需要引入多电机同步控制系统。在设计多电机同步控制系统时,选取交叉耦合同步控制结构,并设计负荷平衡控
国家经济发展质量的高低与国家贫困人口数量密切相关,贫困人口数量较多的情况下,不仅对国家的经济发展存在较大的负面影响,还会间接引发各种社会矛盾问题,造成社会动荡。我国