基于交流平台QA系统的专家发现

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:heshang9994
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近二十年,伴随着互联网技术的发展,大量的社交网络不断涌现。其中,在线Question Answering (QA)系统是一种供用户提问与回答的网站,正以其独特的方式实现信息和知识的共享。因此,在在线交流平台QA系统中引入专家发现的研究是非常有必要的。现有关于专家发现的研究主要基于统计语言模型和链接分析,并且已有部分学者将在线问答网站作为研究对象,如Yahoo Answers!。本论文以专业编程问答网站Stack Overflow为研究对象,考虑主题分布和链接关系双重影响,分别建立主题模型和得分传播模型。目标是实现对一条以自然语言形式输入的问题,返回一系列适合回答该问题的专家。论文具体研究内容如下:1)总结了现有关于专家发现以及在线问答系统的研究,针对存在的不足以及研究需求,提出在专业编程问答网站Stack Overflow中实现专家发现的整体思路与方案。同时,介绍了数据采集过程,并且对数据进行了一些统计与分析,同时对数据进行了必要的清洗和预处理;2)建立主题聚类模型,实现相应主题和专家的定位。首先,以数据集中的问题作为训练集,实现对主题的划分。进一步地,衡量问题与主题之间的距离,依据距离最短实现对所有问题的聚类。对此利用测试问题进行了实验,实验证明我们提出的主题模型和聚类方法能够实现较好的结果。3)建立得分传播模型,实现对主题内的专家的排序。根据获得的数据集中的问答记录,通过用户之间Authority和Hub两种属性的得分的传播计算,实现对用户的专业能力进行排序。对此,我们同样利用测试问题进行了实验,实验证明我们提出的得分传播模型能够实现对主题内用户的排序,并且具有一定的准确率。4)专家发现的具体实现。首先,依据主题聚类模型实现主题的定位。然后,依据对输入问题与主题内的问题之间的相似度衡量,建立隐含链接,构建用户关系网络。进一步地,利用得分传播模型返回一系列的专家,并对结果进行了分析。5)图形用户界面GUI的实现过程。该GUI能够形象地体现专家发现的工作。用户在输入文本框中键入自己的问题,系统就可以返回一系列专家到界面供用户参考。
其他文献
学位
单体液压支柱是煤矿开采的重要支护设备,单体液压支柱密封质量的好坏,直接关系到煤矿的安全生产,因此对单体液压支柱密封质量的检测尤为重要。本文主要介绍了根据单体液压支
随着互联网时代的发展,人类迎来了网络信息化时代,网民数量急剧增加,网络媒体呈现几何形式增长,网络参与人员数量众多且良莠不分,在有心人的引导下,很容易对焦点事件快速形成网络舆
随着3G网络的快速建设,基于无线网络的视频通信技术越来越受重视。同时,随着Android系统日趋广泛的应用,开发基于Android平台的视频通信系统具有广泛的市场空间。H.323协议与SIP
近几年,对于证券交易拐点的预测,广泛应用的是基于分段线性表示(PLR)和反向传播人工神经网络(BPN)的方法(PLR-BPN)。然而,该方法具有一些缺陷,比如容易过拟合和陷入局部最优点,而
现代制造业对产品的性能要求愈来愈高,由单一材料构成的零件己经难以满足产品对零件的功能或性能需求。近年来,人们提出了“异质材料零件”的概念,是指零件内部由多种材料连续或非连续分布而构成的功能性零件。本论文针对异质材料零件的CAD模型进行材料与结构的并行设计,研究空间微四面体重构的算法,为异质材料零件的一体化设计与制造提供有效的方法,为其进一步的工业化应用奠定基础。基于快速成型技术领域的彩色STL模型
尾矿坝的牢固稳定是矿山企业安全运营的头等大事。如果监测不力一旦溃坝将给企业自身及下游人民群众的生命财产带来无法估量的损失!目前尾矿坝的监测主要集中在了位移、浸润
随着国际海洋局势发展的需要,有关无人水面艇控制技术的研究正日渐受到世界各国的普遍重视。无人水面艇作为一种智能化的海上运动平台被广泛的应用在水道测量,海洋环境监测、
随着计算机硬件和软件的不断进步和发展,计算机视觉已经得到越来越广泛的应用,在视频监控、机器人控制、自动驾驶、航空航天等领域有着非常重要的作用。在计算机视觉中,运动
当今社会,电子邮件已经成为人们日常生活中通信和交流的重要方式之一但是垃圾邮件也伴随着互联网信息技术的发展而严重泛滥,带来诸多危害。基于内容的垃圾邮件检测是目前最主