深度学习下新型专利检索方法研究

来源 :武汉大学 | 被引量 : 1次 | 上传用户:a5s2h114n9g
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识产权是一个法治概念,是指人们就其智力劳动成果所依法享有的专有权利,通常是国家赋予创造者对其智力成果在一定时期内享有的专有权或独占权(Exclusive Right)[1]。以专利为重要组成部分的知识产权已经成为企业与企业、国家与国家之间竞争的焦点,专利承载着最核心的技术点,无论是对国家还是对企业,都是值得研究和抢占的技术资源。引自中国国家知识产权局权威发布的数据,截至2017年3月,世界五大局发明专利申请量已经达到260万件,其中专利授权数量也已经达到110万件[2],这表明人们越来越重视保护自身的知识产权。面对如此庞大的专利数据,如何有效地加以利用越来越成为相关企业和学者一直致力于解决的问题。对于专利授权单位,需要在海量的专利数据文本中查找有否与当前申请专利相同或类似的技术点的专利,这关系着是否能为当前申请专利进行授权。对于企业,需要查找与相关领域专利集合,避免技术侵权。而对于专利撰写单位或个人,则是要避免所写专利与当前存在的专利产生重合,增加专利授权的可能性。由此可见,专利检索贯穿于专利应用的所有场合。当前已经有不少关于专利检索方面的研究,许多有影响力的国际组织和会议,例如 SIGIR(Special Interest Group on Information Retrieval),ACL(The Association for Computational Linguistics)和 NTCIR(The Japanese National Institute of Informatics Testeds and Community for Information access Research project)等等,都组建了相应的workshop进行专利文献的分析和研究,也出现了不少优秀的算法模型。但是,专利检索的查询性能不佳,召回率和准确率仍然有待提升。针对当前专利检索的研究现状,本文提出一种深度学习下新型专利检索方法模型,利用深度学习对海量的数据的处理能力和自动学习的能力,旨在进一步提高专利检索的召回率,同时保证专利检索的准确率。通过深度学习模型将专利文本集合训练成词向量的表现形式,赋予每一个关键词一个唯一的向量,将关键词相关性计算转换成向量之间的计算。然后将关键词映射为图中的一个结点,结点与结点之间的边用向量之间计算出的值来表示,提出稠密子图算法来获取扩展词集合。原始查询词集合和获得的扩展词集合进行专利检索,并最终利用专利文档排序模型对查询到的专利结果集合进行排序。
其他文献
当今社会城市规模不断扩大,交通作为城市系统中的重要组成部分,在发挥其日常功能的同时,也带来了居民交通需求量急剧增加,城市活动效率急剧下降,环境污染日趋严重等沉重的现
随着移动互联网的兴起与发展,智能手机等智能终端设备已经遍布在生活的方方面面。基于移动终端的位置服务也成为移动互联网业务中不可或缺的一部分。智能终端设备与人的活动
三维探地雷达(3D GPR,3-Dimensional Ground Penetrating Radar)是一种全方位、高分辨率的无损探测前沿方法。使用3D GPR对道路下方介质进行动态监测,在城市道路下方隐伏病害的监测和排查工作中具有巨大潜力。本文针对3D GPR在城市道路中的数据采集、处理、时移数据比对等方面展开研究,主要内容及创新点如下:第一,结合城市道路特点及3D GPR数据采集系统结构特
自08年Android智能操作系统发布以来,已迭代多个版本,并得到广泛使用。随着市场对智能手机需求的不断提升,手机传感器IC也在持续发展。其中,气压传感器可提供较为准确的高程
本研究关注的是80后、90后新生代员工在工作场所中的职业适应过程,基于生涯建构理论与职业适应过程模型,旨在探讨与分析处在职业适应过程中的新生代员工职业适应力表现及过程
网约工,即互联网平台提供劳动力的劳动者群体,是“互联网+”经济这一新型经济模式的产物,其灵活工作的特点与传统的用工模式截然不同。世界在步入互联网+时代后,由于互联网平
地下综合管廊是建设于城市内部,集供热、给排水、通信、电力、燃气等市政管线于一体,实施统一规划、统一管理、统一检修的地下结构物。各类管线掌握着城市发展的命脉,是城市高效运转的动力源泉。地下综合管廊一旦遭到地震破坏,会造成难以估量的损失。因此,以沈阳市浑南区某地下综合管廊为工程背景,建立土体与管廊结构相互作用的三维有限元计算模型,运用动力分析理论,对地下综合管廊进行了下列分析和研究工作:(1)根据场地
忍冬属植物部分种具有较高的观赏价值,对其在西安地区引种栽培、生长发育、扦插繁殖、种子发芽等进行了初步研究.共收集栽培藤本类忍冬27种(包括园艺栽培种),建立了忍冬属种
现阶段,企业创新越来越成为经济发展的重要因素,国家大力支持创新驱动发展,提升企业与国家竞争力。企业进行正常生产经营活动必须与上下游行业发生经济联系,在此过程中,上游
近些年由于原油的产量少,我国石油开采多数采用注水的方式,随着采油年限的增加,油田采出水的含水率逐年增高,致使油田采出水的不仅使产量只增不减更是增加了处理难度。一直以来,油田采出水的处理问题都是科研学者们倍加关注的焦点,其COD含量高、油溶于有机废水中难以降解。处理油田采出水的方法有很多,其中吸附法作为简单高效的方法被广泛应用。如今关于吸附剂的研究大部分还是集中于改性与复合的研究,但使用吸附剂处理废