【摘 要】
:
软件众包因其开放式利用群体智慧解决问题的特点,在工业界和学术界受到众多关注。近年来,随着软件众包平台的不断发展,其用户量也呈现出高速增长的趋势,如何帮助用户挑选合适自己的服务商及服务,即构建一个优秀的众包服务搜索系统成为了各平台亟需解决的关键问题之一。为解决当前服务搜索系统未能充分利用包括用户评论在内的现有平台数据和未能对搜索结果精确排序的问题,本文提出了基于用户评论的软件众包智能搜索模型。通过对
论文部分内容阅读
软件众包因其开放式利用群体智慧解决问题的特点,在工业界和学术界受到众多关注。近年来,随着软件众包平台的不断发展,其用户量也呈现出高速增长的趋势,如何帮助用户挑选合适自己的服务商及服务,即构建一个优秀的众包服务搜索系统成为了各平台亟需解决的关键问题之一。为解决当前服务搜索系统未能充分利用包括用户评论在内的现有平台数据和未能对搜索结果精确排序的问题,本文提出了基于用户评论的软件众包智能搜索模型。通过对用户评论进行提炼,挖掘出其中可供服务建模使用的关键信息,并使用基于模型集成的学习排序方法对预过滤得到的服务列表进行精确排序。为了弥补搜索结果对于用户的解释性,本文提出了基于模板的推荐理由生成方法。本文的主要贡献如下:1)提出了基于深度学习和迁移学习的评论提炼模型。利用深度学习技术,通过先进行目标区域选择后进行区域内文本标注的神经网络方法,有效地去除评论中多余的文字,从评论中提取出核心内容。为将模型迁移到数据量较小的服务评论上,使用模型迁移学习方法,通过参数微调,构建了适合用于众包服务领域的评论提炼模型。实验结果表明,本文所提出的评论提炼模型在众包服务评论数据集上,相比以往模型,在ROUGE-L等指标上的提升均超过4%。2)提出了基于评论的服务建模方法和集成学习排序模型。针对提炼后评论文本中的每一分句,进行评论类别和评论色彩分类,并将其融入到服务特征向量的构建中。针对单一排序模型的缺陷,本文结合point-wise模型与pair-wise模型的优势,对多个先进模型进行集成处理。实验结果表明,基于评论的集成学习排序模型相比单一排序模型效果提升超过3%。3)提出了基于模板的推荐理由生成方法。针对服务搜索系统可解释性不足的缺陷,对排名靠前的搜索结果结合用户搜索请求文本、服务信息、评论信息通过模板匹配的方法进行推荐理由的生成,为用户提供了知情的权利,提升了平台的可信度。该推荐理由生成方法在语法性、准确性上取得了较高的专家评分,分别为4.78分和4.51分。
其他文献
随着制造业向数字化、智能化的转型升级,企业间的竞争日趋激烈。在这样的背景下,在产品生产的早期阶段进行快速准确的报价是必不可少的。在制造业转型升级的过程中,CAD模型已经成为了贯穿整个生产周期的信息载体,这些蕴含了丰富信息的CAD模型成为了可以利用的珍贵资源。针对这一背景,本文设计了一种以零件的中性格式(.stp)B-rep模型文件作为输入的报价系统,并利用python OCC作为几何内核完成了系统
随着时代的发展、大数据的普及,人类所掌握的数据量也日益增长,而数据结构作为计算机存储、组织数据的方式,也随着新时代的发展不断推陈出新,其中双向映射数据结构作为一类重要的数据结构,被广泛用于一类双向映射数据集的存储、检索应用场景,如数据重映射优化、DNS(Domain Name System)等应用场景。资源描述框架(RDF)作为新时代的数据模型,通常用于描述Web资源的特性、资源之间的关系,已经被
随着计算机视觉领域的快速发展,近年来,基于图片和视频的3D人体姿态估计吸引了越来越多人的注意。与2D人体骨架相比,3D人体骨架由于具有旋转不变性,在动作分类上可以取得更好的效果。因此,做好3D姿态估计将会极大的推动动作分类领域的发展。然而,据我们所知,大多数工作解决的是在控制环境下的单人3D姿态估计问题。因此,在自然条件下解决多人3D姿态估计问题有着重要的应用价值。我们提出了基于视频的多人3D姿态
随着近年来信息技术行业的快速发展,传统行业信息化已经被越来越多的企业列为企业的重要战略目标。第三方检验行业作为一个具有拥有悠久历史的行业,同样需要借助信息化手段,解决目前业务领域遇到的管理成本高,人员作业强度大,流程控制困难等问题。本文针对第三方检验机构的业务特点,设计并实现了一套基于微服务架构的检验报告系统,从目前的业务实践中所反映出的问题着手,分析并确立报告系统的功能性及非功能性需求。同时,对
近几年来,业界广泛使用Hadoop MapReduce、Spark等分布式并行计算框架进行大数据处理,这些框架大部分都遵从BSP模型,shuffle阶段在大数据处理中无法避免。随着处理的数据量爆炸性的增长,企业考量成本与容错性倾向于将shuffle阶段的中间数据储存于磁盘中,而不是内存中。因此,分布式计算任务的shuffle阶段中不仅有着密集的网络I/O,还有着密集的磁盘I/O。这两种密集的I/O
大面积农田具有交通不便、幅员广阔等监测难点,为农田建立时空模型能帮助管理者加强信息化、智能化生产管理。现有的时空建模方法多采用卫星遥感技术或定点高清摄像技术采集时空数据:卫星遥感技术以成本低、覆盖范围广的优势被广泛应用于土地覆被监控;定点高清摄像技术具有实时性强、分辨率高等特点,应用于小面积范围内的实时监控。但目前仍主要存在两大难题:其一,多源时空数据的异构性问题。遥感数据与定点摄影数据在成像条件
三维物体语义理解和旋转不变性特征研究一直是解决许多实际应用的关键性问题。由于现实场景中三维模型所处方位往往不确定,语义分析算法在实际当中的应用面临诸多挑战。同时,语义定义的模糊性导致很难有一个定义的标准能够符合所有人的认知,因此现有的语义相关数据集以及算法存在一定的局限。但是人对于不同物体之间的语义对应关系存在一定的共识,利用对应关系可以一定程度上避免语义定义带来的歧义,从而可以从一个全新的角度促
党的十八大以来,习近平总书记围绕加强国际传播能力建设、增强国际话语权、提升国家形象、提高国家文化软实力和中华文化影响力提出了一系列新理念新思想新战略,成为新时代文化"走出去"战略的理论指导和行动指南。中共中央统筹推动对外文化传播、文化交流和文化贸易,加快了中华文化发扬光大和走出去的历史进程。中国在国际传播能力建设、对外文化交流和对外文化贸易等领域都取得重大成就,大大提高了中国的国际话语权、中华文化
物联网的蓬勃发展和工业4.0的提出推动了现代工厂的智能化与自动化进程,而智能工厂对设备监控技术也提出了新的要求——非侵入式监测。射频识别(Radio Frequency Identification,RFID)技术作为工业中广泛应用的物联网技术,因其无源感知的优点也成为了普适计算领域中代表性的非侵入式感知技术,将其应用到工业新时代的设备监控系统中有着得天独厚的天然优势。为了解决机械设备异常或故障状
自改革开放以来,工业园区作为城市众多产业的空间物质载体,对于促进产业结构调整和产业集聚升级的承载作用显著;与此同时,工业园区也成了环境和安全风险事故的高发地。尤其是在环境保护作为国家重大战略的今天,对工业园区的环境管理问题日益突出,各级政府也陆续颁布了多项政策,推进工业园区的生态环境信息化建设以及工业园区的数字化智能化发展。但目前大多数的园区环境信息化建设与实际的环境管理需求是脱节的,系统仅针对水