基于WEW-LDA模型的专利挖掘方法及应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:nooneknow7
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当下社会进入了前所未有的高速发展期,科技创新活动开始呈井喷趋势增长,成为了推动国家经济增长和提升国家竞争力的第一推动力。同时,随着技术迭代速度的不断提高,各个行业内的竞争也愈演愈烈,创新也成为了企业生存发展、保持市场竞争力的决定性因素。专利文献囊括了全世界每年90%~95%的最新科研成果,从海量的专利数据中挖掘出与技术发展相关的情报信息,以此来梳理技术体系发展状况并合理预测出未来走势,可以为企业和国家制定创新发展战略提供帮助。传统的专利研究多围绕计量统计进行,忽略了文本中隐藏的重要信息,而近些年兴起的专利文本挖掘研究中,存在专利文本特征提取维数大、未充分考虑文本中语义关联等问题,不能对专利文献进行深度、系统地分析。本文在对专利外部结构化信息进行定量分析的基础上,针对专利的文本非结构化数据,构建了面向主题的中级层面和面向异常专利微观层面的专利挖掘方法。首先,引入无监督机器学习的LDA模型,再结合专利文本的独有特征对传统模型进行了一定程度的改进,提出了WEW-LDA模型,以实现对海量专利文本中技术主题的自动识别,并通过实验证明了该模型在提高主题可读性及划分合理性上的优势。然后,基于WEW-LDA模型输出的主题数据构建出了主题网络和专利地图等可视化知识图谱。其中,主题网络能够从全局的文本语义信息出发,分析各技术主题间的外部关联关系,通过主题网络可清晰地展现领域内技术体系的结构,同时将网络在生命周期的时间维度上展开后,结合社会网络分析及链路预测算法可挖掘出高影响力重点主题转移过程、技术的整体演化过程及未来技术主题间的关联可能性;专利地图可用来侦测蕴含新技术的异常专利,通过对异常专利的筛选、梳理和总结,可对技术未来的发展做出合理的预见。最后,将本文提出的方法体系运用到了AGV领域,对该领域中的核心主题转移过程、技术演化、技术组合机遇及未来发展趋势做了系统的分析,研究结果可以为AGV相关企业及国家政府的创新发展规划作出指导。
其他文献
氨基酸作为蛋白质的基本组成单元,在食品、化妆品、农业及医药行业有广泛的应用。大多数氨基酸都具有手性,其两个手性对映异构体往往具有不同的生理活性、毒理和药理作用,因
随着油气田开采逐渐向超深井等钻井条件复杂地层发展,钻头的粘滑振动现象严重的降低了机械钻速与钻具寿命,大量的研究与现场实验表明扭力冲击器能够有效减轻PDC钻头的粘滑振
蒸散发是全球水文循环和能量收支的重要组成部分,它对气候变化的响应在区域降水和干湿变化中起着重要的作用。Priestley-Taylor(简称P-T)模型因其所需参数较少,在估算蒸散发中得到广泛应用。基于半经验半理论的P-T模型估算蒸散发时,其核心方法是确定模型中的α参数,通过准确计算该参数在这一区域中的最适值来估算蒸散发。本研究以中国西北半干旱地区毛乌素沙地南缘油蒿灌木生态系统为研究对象,应用20
陆域冻土区的天然气水合物跟永久冻土层厚度密切相关。与常规储层相比,水合物形成和保存的决定因素是温度、围压和储集空间。而羌塘盆地东北部地区发育大规模的永久性冻土,完
行人再识别作为智能视频监控分析的关键任务之一,可以自动的对来自多个摄像头视角下的行人图像进行匹配。行人再识别已经被广泛的用于安全监控、行人追踪和犯罪侦查等。正是
随着控制技术和微电子技术的快速发展,工业机械臂凭借着它的灵活性与准确性在很多领域得到了越来越广泛的应用。对工业机器人运动学进行研究,有助于改善机器人的性能。对机械
南极假丝酵母脂肪酶B(Candida antarctica lipase B,CALB)是具有α/β水解酶折叠的丝氨酸水解酶。因其出色的催化性能,在食品、化工、能源等行业具有广泛的应用。然而野生型CAL
环糊精(Cyclodextrin,CD)具有独特的空腔结构,能够与油分子形成包合物并吸附到油水界面用于稳定乳液,在食品、医药等领域有广泛的应用前景。然而,CD乳液液滴容易絮凝导致体系发
管道悬索跨越结构是油气管道运输中常采用的一种形式,被称之为油气长输管道的“咽喉”,主要由主缆、吊杆、风索系统、桁架桥体、塔架以及锚固系统组成。悬索管桥不仅具有传统
叶黄素是存在于人类血清中的六大类胡萝卜素之一,具有抗氧化、增强人体免疫系统、延缓与年龄相关的黄斑变性等功能,是人类重要的膳食补充剂。然而,由于叶黄素富含不饱和键,在