【摘 要】
:
如今,在线社交网络已经成为我们日常信息传播的重要载体和渠道,有关社交网络的研究,对人类社会发展和商业推广等方面都有着实际的应用价值。社交网络应用分析的一个重要问题是对用户进行排名。现有的社交网络用户排名算法主要分为基于中心性的方法,基于超链接引导主题搜索算法以及基于PageRank算法。传统的排名算法无论是加权的还是未加权的,仅使用基于边的关系,一些排名算法考虑到结点参与的高阶结构,通过模式去获取
论文部分内容阅读
如今,在线社交网络已经成为我们日常信息传播的重要载体和渠道,有关社交网络的研究,对人类社会发展和商业推广等方面都有着实际的应用价值。社交网络应用分析的一个重要问题是对用户进行排名。现有的社交网络用户排名算法主要分为基于中心性的方法,基于超链接引导主题搜索算法以及基于PageRank算法。传统的排名算法无论是加权的还是未加权的,仅使用基于边的关系,一些排名算法考虑到结点参与的高阶结构,通过模式去获取结点之间的高阶关系,表现出较好的排名效果,但未对结点之间交互频率的特点进行有效设计。随着信息时代的高速发展,人们对信息加载速度要求越来越高。一个健壮的社交网络用户排名算法不仅能根据不同目的准确的返回用户列表,还应快速高效。基于以上问题,本文对基于模式的社交网络用户排名算法展开了研究,在考虑用户之间高阶关系基础上引入交互频率的概念,采用特殊稀疏矩阵存储方法降低了内存占用,多核CPU并行计算和GPU加速矩阵迭代的方法缩短了实验运行时间。本人完成了如下工作:(1)提出了基于模式的交互频率加权社交网络用户排名算法,用来处理用户之间交互频率的问题。本文介绍了根据用户之间交互频率对网络图和模式进行加权的原理,讨论了三种加权方法的排名效果,以确定最优的加权方法。为评价这些方法的性能,本文分别在学者网络和Twitter数据集上进行了实验,以接近中心性方法排名结果为理想化列表,计算基于模式的PageRank算法和三种加权方法的归一化折扣累积增益。分析了它们在不同系数下的实验效果,并比较了它们在3结点简单模式和anchor模式上的结果。实验表明,在加权社交网络图中引入模式的方法相较基于模式的PageRank算法而言,准确率有了较好的提升。(2)提出了基于模式的多进程与GPU加速社交网络用户排名算法,用于降低算法内存和运行时间。本文首先采用压缩稀疏行和嵌套列表的方法,降低了矩阵的占用内存,接着采用多进程方法,在多核CPU上进行连续性编码和矩阵归一化并行运算,其中在并行矩阵归一化的过程,针对稀疏矩阵中非零元素分布头重脚轻的问题,又提出了根据非零元素个数进行动态切片的方法,使多个进程在近似相同的时间结束,从而缩短矩阵并行化时间,最后使用GPU进行矩阵迭代。相较采用这些方法前,本文提出的算法不仅降低了内存占用,而且缩短了运行时间。
其他文献
近年来,重大传染病疫情因其持续时间长、扩散范围广、危害程度高、防控难度大等特点,给世界各国经济发展及人民生活带来了严重威胁,成为各国公共卫生安全防治的主要议题。而由于疫情的突发性和不确定性,人们往往无法预测疫情的发生时间与强度,因此在应急物资调度初期及应急高峰期由于物资生产与储备不足或调度不及时等原因,应急医疗物资短缺问题时有发生。同时,随着疫情强度和扩散范围的变化,传染病应急物资调度往往具有动态
避障路径规划问题在因其在移动机器人、无人机(Unmanned Aerial Vehicle,UAV)、通信路由等领域广泛应用,一直是学者们研究的热门方向。针对路径规划问题学者们提出的算法层出不穷,其中快速随机搜索树(Rapid-exploration Random Tree,RRT)算法因其规划效率高、动态环境适应性强、高维可用、概率完备等优点,在路径规划算法中占有重要地位。本文采用基于位姿空间概
本文聚焦居民日用消费品城市配送物流的长期预测,从城市发展的宏观经济环境出发,提出了能够与不同发展进程的城市相契合的居民日用消费品物流需求预测方法,可充分顺应我国地区经济发展不平衡的国情,因地制宜地为我国各城市商贸服务业物流规划提供科学可靠的思路方法和理论支撑。首先,结合物流学科理论和相关标准,严格规范地界定了“居民日用消费品物流需求”的概念,并从多方面分析相关影响因素,构建居民日用消费品物流需求预
迁移学习是指根据已有知识和新知识之间的相关性,运用已有的知识来学习新的知识。按照是否使用深度学习方法,迁移学习可以分为传统迁移学习和深度迁移学习。当迁移源域和目标域的特征空间相同且类别空间相同,但边缘分布和条件分布不同时,该问题称为域适配问题。迁移学习的目的是为了解决在样本不足、标签不全等情况下,机器学习任务如何借助外部数据进行有效学习的问题。因此,迁移学习具有重要的实际应用价值。本人独立完成了如
对遥感图像中的道路进行自动识别与分割在地理信息系统数据的更新、土地管理、城市规划、军事打击等不同应用领域都有着十分重要的应用价值。随着科学技术手段日新月异的发展,机器学习和人工智能技术在人们日常生活中的应用更加广泛,如何利用深度学习算法更加高效地解决遥感图像道路分割的难点,提高遥感图像道路分割的精度,简化神经网络训练过程中的难度已经成为各国学者们的重点研究方向。本课题基于深度学习理论并结合可见光遥
随着我国经济快速发展,人们的生活水平逐步提高,生活节奏逐渐加快,消费观念开始转变,越来越多的人选择搭乘出租车出行,出租车行业规模日渐庞大,车载GPS系统等采集设备也积累了海量的出租车行驶数据。与此同时,出现了出租车定价体系不够合理、评价与监管体系不够完善、出租车资源浪费等问题。目前行业内对出租车的经营状况的画像研究还远远不够,无法做到针对出租车的个性化分析从而采取更有效的管理措施。因此,本文尝试基
在信息爆炸的时代背景下,大量重复冗余的信息充斥人们的生活,如何从众多无结构或半结构的信息里提取出高质量且精准的信息是信息抽取任务快速发展的原因之一。信息抽取在问答系统、数字图书馆等任务中都有广泛应用,实体关系抽取是其重要的子任务之一。传统和基于深度学习的实体关系抽取方法已经在实际应用中取得了较高的准确率,但其主要集中在特定领域,在面对不容易获得大规模监督训练数据集的实体关系抽取任务时,传统方法逐渐
软件缺陷预测是一种以提高软件质量为目的通过预先识别可疑缺陷模块为软件测试资源分配提供决策支持的技术。但是软件缺陷预测模型的性能取决于所考虑的软件特征的质量。冗余和不相关特征可能会降低模型的性能,这就需要特征选择方法来识别和移除这类特征。本文针对软件缺陷预测中的特征选择进行深入研究,主要研究工作如下:(1)本文将软件缺陷预测特征选择问题转化为多目标优化问题。结合特征工程的实际意义,在综合分析模型运行
临床病历文本中所包含的信息资源极其丰富,却因其规范化程度有限而导致信息无法被有效地提取和利用。病人以往的病情、诊断和治疗记录,对辅助医生做出更好的医学决策具有重要意义。本文的研究任务是对中医临床病历文本进行事件抽取,以事件为单元对病人的病情发展进行呈现,同时抽取出每个事件的发生时间。事件抽取技术是从非结构化信息中抽取出用户感兴趣的事件,并以结构化表达方式呈现给用户。经过研究发现,不管是在研究任务上
由于各种不确定性和不可抗力的存在,导致众多产品的制造生产过程存在着很多风险源,这些风险源的存在会对产品的稳定性乃至项目的成败产生直接的影响。光纤传感器是以光纤为介质研发的一类传感产品,其理论技术的不断进步依托于光纤通信技术的飞速发展。对于光纤传感产品而言,其产品性能的优劣不仅取决于先进的理论算法,更取决于产品在制造过程中的各个工序的管控。分析产品生产环节存在的各种风险源并加以控制,可以降低设备故障