基于LSTM和LDA的可再生能源领域主题分类研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:tnngx123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,各学科的科研文献数量都呈现快速增长的趋势,并且学科之间日益深化交叉,呈现出研究主题分支众多,发展不平衡的状态,这种情况加重了科研人员精准搜索信息的难度,也不利于科研人员理清学科的研究进展和跟踪领域前沿。本文以研究电气电子学科可再生能源领域的文献为例,作为这个重要领域的一个新尝试,将隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)和长短期记忆网络(Long Short-Term Memory,LSTM)方法运用到该领域的主题分布探测中,旨在为学术研究人员提供该领域最清晰的发展背景和组织结构。首先,本文通过应用统计分析,LDA主题模型和自回归整合移动平均模型(AutoRegressive Integrated Moving Average,ARIMA),将电气电子学科可再生能源领域文献划分为29个不同的主题,并在两个时间段内分析主题的增长特征。在此基础上,根据每个主题的发展轨迹,预测它们未来的发展热度,并分类为冷,热和稳定三种。本文还汇总了每个主题中最受欢迎的期刊和引文的统计数据,从而使研究人员和期刊编辑易于欣赏和应用,进而本文结合现有技术和文献分析了讨论度最高的主题、未来的热点主题和冷门主题,并对研究领域的发展进行了展望。其次,本文使用word2vec+LSTM模型对电气电子学科可再生能源领域进行再一次主题分类研究,在对训练数据进行人工主题标注和词向量映射基础上,基于LSTM模型分类研究领域的手段,将电气电子学科可再生能源领域文献划分为17个不同的主题,并利用LSTM对该领域的学术研究趋势进行了预测。最后,本文从多个角度对LDA和LSTM在电气电子学科可再生能源领域的主题分类研究工作进行了对比,对比结果可作为所有学科领域的参考。在此基础上,本文基于学科领域文献集的增长快、包含主题复杂等特性,提出一种适用于学科主题分类研究的LDA和LSTM融合主题分类模型,并基于融合模型对研究领域2019年的数据进行了主题分类研究。
其他文献
<正>杨炯,"初唐四杰"之一。然而,在他已经迈入大唐官场的时候,却发出了"宁为百夫长,胜作一书生"(《从军行》)的呼喊。要知道,从古自今,投身军旅,都是一件风险很大的事业,生活
期刊
作为一种集高效、环保等优势于一身的先进运输组织形式,公铁联运通过充分发挥铁路与公路各自的运输优势,实现整个运输系统效率的提升。基于博弈理论,分析目前我国多式联运行
“有机水溶肥料”具有提高作物产量、品质的作用。为验证“有机水溶肥料”在豫西丹参生产上的应用效果,河南省渑池县农业农村局于2019年在豫西安排了丹参施用“有机水溶肥料
如何做好酒店人力资源管理,培育高素质的团队,提供高档次的服务,事关酒店的生存与发展。本文通过对我国酒店业人员管理状况的研究,分析我国酒店业人力资源管理中存在的普遍性