【摘 要】
:
在申请专利时,专利审查员需要确定申请专利的现有技术,以确定该专利的新颖性。对于专利组织来说,如何高效准确地为给定专利推荐引文是一件非常重要的事。传统的专利引文推荐需要大量的人工审查,十分耗时。为减少人工以及节省时间,有研究人员利用计算机技术自动为专利推荐引文。然而,许多研究仅考虑专利的文本信息,忽略专利文档所具有的丰富的结构信息,而这些结构信息在进行专利引文推荐时也非常重要。此外,大多数研究工作仅
论文部分内容阅读
在申请专利时,专利审查员需要确定申请专利的现有技术,以确定该专利的新颖性。对于专利组织来说,如何高效准确地为给定专利推荐引文是一件非常重要的事。传统的专利引文推荐需要大量的人工审查,十分耗时。为减少人工以及节省时间,有研究人员利用计算机技术自动为专利推荐引文。然而,许多研究仅考虑专利的文本信息,忽略专利文档所具有的丰富的结构信息,而这些结构信息在进行专利引文推荐时也非常重要。此外,大多数研究工作仅着眼于为专利推荐专利文献,对于非专利文献关注较少。论文作为一种主要的非专利文献,如果能找到专利发明人作为论文作者时所撰写的论文,对审查员理解专利内容,进行更高效地专利检索十分有帮助。本文主要针对专利引文推荐的相关问题进行研究。首先提出一种两段式的基于排序学习的专利引文推荐方法,考虑专利文档的多维特征,并综合考虑这些特征对相关专利进行排序,提升专利推荐的效果。其次,本文提出一种在专利网络和论文网络中进行发明人和作者对齐的方法,将论文数据引入专利网络,提升专利推荐的效果。最后,本文设计并实现一个专利引文推荐的系统,在提供基本的专利检索功能的同时,利用本文提出的两种方法,提供专利引文推荐功能和发明人-作者对齐功能。本文的主要研究工作包括:1.本文首先对专利引文推荐的背景知识做出简洁的介绍,充分调研国内外有关专利引文推荐问题的研究现状以及基本的方法理论。另外重点分析专利引文推荐问题主要面临的难点与挑战,并针对这些挑战,提出对应的研究方法。2.针对难以充分利用专利文本和结构特征并考虑专利多样化信息进行专利引文推荐的问题,本文提出一种两段式的基于排序学习的专利引文推荐方法。在第一阶段,该方法首先在专利库中进行初筛,在不损失很多相关专利的前提下尽量缩小专利引文推荐的范围,选出专利候选集。在第二阶段,以专利分类为监督,通过监督学习的方式训练专利的语义向量,通过向量距离计算专利相似度,然后利用排序学习综合考虑所提出的多种相似度特征训练排序模型,最后利用排序模型对候选集专利进行排序,完成专利引文推荐。在两个真实的专利数据集上的实验结果表明,该方法在专利引文推荐问题上具有一定的适用性。3.论文作为一种重要的非专利文献,对于确认专利的新颖性、创造性,专利价值和发明人价值等具有重要的作用,如果能融合论文网络和专利网络,对专利引文推荐有重要的指导作用。本研究基于文本内容和网络结构,提出一种在论文网络和专利网络之间进行论文作者和专利发明人对齐的方法。为在两个多源异构网络间进行作者实体的对齐,首先需要选出可能是同一实体的锚点,该方法根据规则选出可能与给定论文作者是同一人的专利发明人候选集。为判断候选集中的发明人与给定的论文作者是否为同一人,该方法对每位候选人从合作者网络、文本内容和作者单位等角度进行判断,并将全部置信度大于给定阈值的候选人作为对齐结果。在构造的数据集上进行实验,结果表明本研究可以对论文作者与专利发明人进行对齐。最后,利用本方法对一批选定的高指标学者在美国专利商标局的专利网络中进行对齐。4.结合上述方法,本文设计并实现一个专利引文推荐系统。该系统具备基本的专利全文检索、字段检索功能以及专利引文推荐模块和论文作者与专利发明人对齐模块。专利引文推荐模块以一篇专利的全文作为输入,通过模型排序推荐与其相关的专利引文。论文作者与专利发明人对齐模块可以从一个特定的作者出发,获取他全部的论文和专利。
其他文献
基于半导体材料的光催化制氢可将太阳能转换成氢气,是一种清洁、可持续的太阳能利用技术。最近,一种以MAPbI3为代表的有机无机钙钛矿材料由于其合适的带隙结构、高的光吸收系
管理层与分析师的信息来源和信息处理方式的不同,导致了二者的盈利预测也存在差异。管理层的业绩预告因包含公司业绩的前瞻性信息,这些信息通常与公司现实的经营状况和未来的发展规划紧密相关,更契合分析师预测的需要,可以成为分析师进行盈利预测的重要信息来源。由于管理层和分析师在信息方面具有不同的优势,管理层的业绩预告是分析师盈利预测的重要补充,尤其是当二者的盈利预测出现分歧时,管理层预测与分析师预测之间的差异
碳酸盐岩储层是富源-果勒地区最为重要的一种储层类型,然而其储集空间类型复杂多变,且在钻完井过程中经常发生放空、漏失等事故,极易导致外来流体和固相颗粒进入储层造成储层
3μm波段光纤激光器在基础科学研究、环境检测、生物医疗以及国防安全等领域有着重要应用。利用稀土离子掺杂ZBLAN(ZrF_4-BaF_2-LaF_3-AlF_3-NaF)玻璃光纤作为增益介质,已实现数十瓦量级3μm波段激光输出。然而稀土离子在该波段发光效率较低,探索提高稀土离子发光效率的方法有助于进一步提升3μm波段光纤激光器的性能。本论文选取具有较低声子能量的氟化铟基玻璃作为基质材料,围绕Ho3
金字塔股权结构广泛存在于我国上市公司中,作为资本市场的重要特征之一,其对我国资本市场运作及公司治理均产生着显著的影响。因此,对金字塔股权结构的成因及后果进行研究具有重要意义。在金字塔股权结构的成因方面,学术界主流的观点为“控制权私利论”及“融资优势论”,但有学者提出,我国地方国有企业金字塔股权结构的形成是地方政府权力下放所致。由于我国独特的政治及经济制度,政府可通过行政手段对地方国有企业施加重要影
多项式优化问题是非线性规划中的一类重要问题,近二十年来其理论与算法已得到深入发展.本文利用多项式优化中已有的经典理论和算法,研究了无约束多项式局部鞍点值排序问题和
石墨相氮化碳(g-C3N4)是一种非金属聚合物半导体材料,具有合适的能带位置、可见光活性以及稳定的物理化学性质,这些特性使其成为光催化领域的研究热点。然而,块状的g-C3N4存
经过二三十年的发展,我国的公益慈善事业进入了一个快速发展的新时期,它在推进中国社会转型与改革、构建和谐社会的过程中发挥着越来越重要的作用。随着互联网公益的发展,我国公民的公益慈善意识逐步觉醒,但总体来说普及率还比较低,民众的公益文化价值观和参与意识还有待提高。作为一个相对特殊的报道领域,公益报道因为处在比较边缘的位置,所以受重视的程度较低,报道内容比较有限,媒体公益报道的社会功能没有得到充分发挥。
非刚性运动恢复结构(Non-Rigid Structure From Motion,NRSFM)技术,通过利用二维图像序列中的特征点,能够估计出物体的三维结构及相应的运动参数,是实现物体三维重构的一种重要途径。当图像序列中的样本较少时,即小尺寸图像序列,目前已有的NRSFM算法,性能会显著下降。这是因为少量数据只能建立起来有限的方程组数,而自变量数目相对多,难以求解最优解。此外,当NRSFM用于单
随着人们生活水平的提高,医疗科学的不断发展,人类越来越长寿。老龄人口的增长数量和速度都不容忽视,持续的人口老龄化是不可避免的趋势。我国人口基数大,虽然现在仍有人口红利使各种矛盾没有凸显的很严重,但也需要引起我们国家的重视。老年人占人口比重的提高给社会带来了养老压力、劳动力不足、养老金缺口等一系列问题。如何将老龄化的负面影响转化为正面影响是我们亟需解决的问题。鼓励老年人再就业,发挥自己的余热,是其中