论文部分内容阅读
引用在科学论文撰写中是必不可少的要素,引用是对前人所做研究的一种肯定或批判。一篇被引文献可能在正文中不止一个位置上被引用,而一个引用中也可包含多篇被引文献。本文按照一个引用中包含的被引文献数量将引用分为单项引用(Unitary Reference Citation)和多项引用(Multiply References Citation)。本论文意在研究鲜有人关注的多项引用,找到其在科技论文中的分布与特征,增加人们对多项引用的理解,为其近一步应用于科技评价打下基础。本文通过Elsevier Scopus数据库提供的Scopus Search API获取了Journal of Informetrics 2007-2019年所发表的797研究型论文的XML结构化全文数据,利用Python语言开发出可以提取每篇施引文献中每一个引用的具体信息,然后再对提取到的引用信息做进一步的统计与分析。结果表明:第一,施引文献中约25%的引用是多项引用,同时多项引用多分布在文章的开头和结尾部分,在文章中间分布的相对较少。第二,大约60%的多项引用仅包含两篇引文,包含引文数超过5篇的多项引用比例不足4%。第三,随着施引文献中引文的数量的增加,多项引用呈现增多的趋势,两者之间呈现弱相关关系。第四,施引文献的被引次数与其文章中多项引用的数量没有明显的相关关系。第五,大约21.4%的多项引用是作者自引用,而单项引用中只有13.9%是作者自引用。第六,大约19.1%的多项引用是期刊自引用,而单项引用中只有9.6%是期刊自引用。第七,单项引用引用中引用年龄为1的比例最高(约为12.2%),而多项引用中引用年龄为4的比例最高(约为9%)。通过对科技论文中多项引用的分布与特征研究,可以加深科研工作者对多项引用的认识与理解,可以推动全文引用分析的近一步发展,可以促进引用评价朝着更合理的方向发展。