【摘 要】
:
学术领域信息,如学术文献信息和作者信息等,是学术研究者持续关注的重点信息。深入挖掘学术领域信息,构建相关学术网络,对学术研究工作和学科发展有很大的意义。现有的大型专
论文部分内容阅读
学术领域信息,如学术文献信息和作者信息等,是学术研究者持续关注的重点信息。深入挖掘学术领域信息,构建相关学术网络,对学术研究工作和学科发展有很大的意义。现有的大型专业数据库和搜索引擎提供的科技文献检索,对学术文献和作者的信息利用还远远不够,学术领域信息挖掘和利用存在着巨大的发展潜力。从海量学术文献中,挖掘出文献之间的内在结构和发展脉络,对科学研究者有很大的帮助,如可以帮助研究者了解领域发展历程、当前领域研究热点以及研究主题可能发展趋势等等。本文从学术文献之间的内在主题一致性和发展演化性等角度,来挖掘出文献之间的内在结构和脉络,最终构建基于主题的学术网络。具体说来,本文主要完成以下工作:1、本文提出一种构建学术网络的方法,即采用分而治之的策略,先将学术网络进行群体划分,并对群体之间的关系进行描述,然后对每一个群体构建详细的学术群体网络图。2、在学术群体划分中,引入张量分解的方法,该方法能够对海量复杂结构的超图进行分解,具有很强的扩展性,且时间复杂度低,适用于大规模数据的学术群体发现。同时,综合对比聚类、动态主题模型和张量分解三种不同的方法在群体划分过程中的效果和性能。三种方法采用学术领域不同的信息,取得不同的划分效果,能够适用于不同的应用场景。3、在构建学术群体网络时,采用关键文章和主题路径生成结合的方法,该方法易于实现,在实验中取得了一定的效果。其中基于主题的路径生成方法可以解决最短路径方法等生成路径主题不一致、存在局部相似性等问题,为生成学术网络提供了主题演化特性和脉络特征,同时对现有的学术文献索引方式提供了一种可行的主题特性。4、搭建了生成基于主题学术网络的系统,提供文章信息收集与整合、数据存储与访问、学术网络核心算法以及Web访问接口定义等功能,能够自动收集学术信息,并处理生成最终目标网络。
其他文献
在充分了解JSON序列化机制与数据传输效率研究现状的基础上,为使应用程序的开发能够选择更合适、数据传输效率更高的数据传输格式,也为数据格式的选择提供更有力的参考依据,
由于电子商务网站的成功发展,在线购物已经成为一种方便、快捷、廉价的购物方式,随之而来的是图像数据呈现几何级数增长,如何对如此超大规模的购物图像进行有效搜索成为近年
旅行商问题(Traveling Salesman Problem,简称TSP)是组合优化问题中的经典问题,也是一个NP完全问题。同时,它也是众多优化问题的简化形式,如基因组制图、行星探索、电路板钻
电子商务的普及使得利用电子商务进行购物的用户飞速增长,但随着网络上的商品信息越来越多,如何快速有效地从海量的商品信息中选择出用户需要的商品成为用户关心的重要问题。
图像匹配是数字图像图像处理研究领域的一个热点和难点,随着计算机技术和匹配理论的发展,其应用领域越来越广泛,已经从当初的军事领域逐渐发展到人们的日常生活和工业生产之中。
针对当前市场上的视频监控系统受网络带宽的限制、需要呈现高质量的视频图像等情况,提出了在有较好扩展性的实时流传输协议和H.264编码技术的基础上实现的视频监控系统,实现
在微波集成电路和高速数字电路中,平面传输线不连续性是一个普遍存在的问题,也是理论分析和工程应用中一个较为复杂的问题。常用的平面传输线有微带线、共面波导、带状线、槽线
数字全息术是一种可用于三维微结构非接触、准实时、高灵敏、高精度、高分辨且全场可视化测量与表征的新型全息方法。位相解包裹是实现数字全息三维重构中的一个重要环节,它
生物医学事件关注于生物医学分子的具体表现行为,对药物研制和疾病预防具有重要的意义。对生物医学事件精准地抽取,往往需要自动地综合分析生物医学文献中所描述的内容。现阶
截止到2018年,移动互联网用户达到15.5亿,网络应用日益融入人们的生活。移动互联网的加速发展产生了对信息安全的思考。口令是信息安全中使用最广泛的身份验证手段。口令的恢复与加密研究相辅相成,也得到了迅速的发展。研究发现口令恢复的重点在于字典的选取。但是随着移动互联网用户越来越多,口令空间在爆发式增长,字典文件越来越大,文件中的候选口令数量急剧增加。因此,研究口令恢复中高效字典的生成具有重要意义。