论文部分内容阅读
科学学是研究科学的科学,它旨在理解、量化和预测科学研究及其产生的结果和影响。科学学揭示了科学和科学活动发展规律,并将这些规律应用于促进科学的发展,辅助科学发展战略、规划、政策制定,使得科学研究有效进行,是科学研究组织管理的重要工具。大数据时代的到来,为科学学的研究提供了丰富的数据源和数据分析手段。开展数据驱动的科学研究相关性与影响分析,对科学学领域研究具有重要的理论意义与实践价值。本文以国家自然科学基金数据分析为例,结合Selenium进行网络爬虫程序的编写以成功得到研究所需的科学基金及其成果数据,编写正则表达式提取科研成果中的基金信息进行科学基金和成果数据的关联;分析基金项目数据和成果数据特点,基于数据分析需求下对于蕴含大量关系的科学基金成果数据寻求科学高效的数据管理方法,采用以关系为核心的图数据库Neo4j数据管理方法;应用科学计量学、社会经济学和相关性分析等方法分析探讨数据背后潜在的规律:采用社会经济学指标对科研经费在科研机构之间的分配不均衡进行定量评估,表明科研经费在机构间分配上均存在较大差距;从单项科研经费投入和机构科研经费投入两个层面上研究了科学基金投入与成果产出数量的相关性,显示单项目成果数量与该项目立项金额无明显相关性,机构科研经费和项目成果数量存在强相关关系;4)构建了机构合作网络和国家(或区域)合作网络,基于复杂网络分析方法、多属性决策方法对科研合作网络演化过程及合作模式进行分析,科研投入对这两种网络规模和密度均有着不同的促进作用,机构的经费水平对机构在合作网络中的“地位”有着明显的影响。本研究提出了科学研究数据获取与图数据库相结合科学研究数据管理方法;探索分析了科学研究经费分配不均衡与成果相关性;开展了基于复杂网络模型的科学基金合作关系及影响分析。本研究提出的方法,为科学研究数据获取及管理提供技术支持,为科学学提供了科学基金-论文数据分析方法,研究结果为科学基金管理部门提供决策支持,推动了科学学领域研究发展。