社会化问答社区答题者发现研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:cytunyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网在民众中的深入普及,网民数量不断增加,加之信息技术进一步发展,社会化问答社区已然成为人们快速搜寻、交换信息和知识的热门场所,它能够突破时空界限,满足了用户碎片化时间的知识获取需要及交流需要,适应了现代人快速的工作和生活节奏。但在志愿式参与的社会化问答社区中,如国外的Yahoo!Answers和Stack Overflow,国内的知乎社区、搜狗问问、百度知道等社区,仍然存在用户提出的问题长时间得不到回应,或问题得不到专业性、完整性、满意度较高答案的现象,久而久之,提问者有可能产生沮丧情绪,对问答社区的期望降低,甚至会选择离开,这显然不利于问答社区的持续健康发展。因此,如何从问答社区知识共享的层面留住用户,寻求回答问题可能性高的专家用户,使得社区中新问题得到有效、专业的回复,是本次课题的研究重点所在。寻找回答问题几率较高的专业答题用户,能够满足提问者得到快速、专业、且令人信服的答案的期望,缩短提问者得到答案反馈的等待时间,助力社会化问答社区的健康持续发展,具有一定的现实意义。此前,也有学者探讨了如何识别问答社区某话题领域内的专家用户,或研究用户在社区知识共享的影响因素,或对相关算法的改进等,实际上,若专家用户受各种条件限制,无法及时回答问题时,社区中问题得不到回复或得不到满意回复的现状仍难以改善。因此,本文借助动机理论和社会资本理论结合专家发现的相关研究,力求找到专业且具有较大答题可能性的回答者,以解决以上问题。此外,本文在一定程度上丰富了相关的学术研究,也能够为专家推荐、问题路由等课题的研究提供一定的参考,因而具有一定的理论和现实意义。本次研究根据网络爬虫在知乎社区医学话题下所抓取的用户个人信息及其相关的问答信息构建实验所需的数据集,结合社会资本理论和动机理论分析用户在社区回答问题的可能性构建研究模型,旨在解决以下三个问题:(1)如何识别网络问答社区中特定话题下的专业用户?(2)什么样的用户回答问题的可能性较大?(3)如何在专家用户中找到回答问题可能性较大的用户?本次研究采用机器学习的方法,依据用户的背景资料、用户在问答社区的交互信息行为、用户在问答社区的活跃度指标,借助一般的数学方法和TOPSIS法来评价用户的可信性;运用tf-idf、LDA主题模型及一般的数学方法对用户在社会化问答社区的历史回答及文章主题信息的挖掘来分析用户的专业性;基于用户在知乎社区所形成的社交网络关系数据,借助PeopleRank算法分析用户在社区中的重要程度,结合用户在社区的发言影响力,测量用户的权威性。研究中,依据实验数据对模型的相关参数进行调试和优化,力求取得较好的实验效果,此外本文还与经典算法PageRank、HITS进行了对比实验分析,最终得出的实验结果验证了本文研究方法及研究模型的有效性及优越性。
其他文献
研究背景卵巢癌是一个由不同临床病理和分子特征的异质性卵巢肿瘤组成的集合。在全球范围内,卵巢癌都是最致命的妇科恶性肿瘤。尽管有不少研究者对新型化学疗法、靶向疗法和
伴随着大数据时代的到来,数据量正呈现指数级增长,与此同时所带来的在数据分析和挖掘等方面的需求也不断激增,而聚类分析作为数据挖掘的重要工具,其研究热度一直很高,但是每
目的:研究表明过长或过短的睡眠时长均会引起全因死亡风险的增加。但行为危险因素和健康状况是否影响以及如何影响睡眠时长与全因死亡的关系,睡眠时长如何促进全因死亡风险的
声子晶体,基于其展现出的超常弹性波操控性能和丰富的动力学行为,正在基础物理研究与工程应用探索等方向蓬勃发展。例如,声子晶体所具有的弹性波带隙、局域缺陷态与负折射率
无论是要解决器件散热问题,还是要更好地设计热功能材料,都需要对纳米尺度导热规律有更深入的了解。纳米结构特征尺寸与平均自由程相当,此时傅里叶导热定律不再适用,热量以弹
高精度室内定位是众多领域的共性研究问题。本文将室内定位从实现机制上分为主动式与被动式定位,针对主被动定位各自的优缺点,本文拟选择智能手机惯性数据与普通单目监控视频
合约是双方合意的表示,能够促进合作剩余的产生,而合约形式选择能够对合作剩余的分配、双方预期与权益保障产生深刻影响。随着土地流转规模日益扩大,加强农户的土地流转合约
随着智能时代的到来,情感识别任务成为众多学者研究的热点问题之一。研究情感识别不仅能够优化人机交互的体验,而且在个性化推荐、健康监督、交互式游戏等等方面具有广泛的应
图像处理技术因深度学习的发展取得了革命性的进步,尤其在分类与识别领域,其表现已经接近甚至超越人类。然而这些成果主要体现在模式识别领域的成功,离真正的人工智能还任重
图像分类是计算机视觉领域的基础任务与研究热点,它是目标检测、语义分割、目标跟踪等视觉处理任务的重要组成部分。因此研究图像分类技术具有重要的理论意义和应用价值。近