论文部分内容阅读
随着我国政府开放数据平台数量日益增多,如何有效提升政府开放数据服务水平已成为研究的热点问题。公众获取政府开放数据并进行利用是数据资源影响社会与经济发展的重要方式之一。因此,对政府开放数据的数据使用状态进行描述与预测具有现实意义。运用科学的方法合理预测政府开放数据后数据的使用情况,有利于把握公众的数据需求以及需求的变化情况,有利于提升政府数据开放平台对数据资源的整合能力,有利于提高政府开放数据的综合服务水平。本文旨在通过文献法、定性与定量相结合分析法以及实证分析法等研究方法,在分析与研究政府目前已开放的数据资源使用情况的基础上,构建政府开放数据的数据使用状态预测模型,并验证其可行性与有效性。主要研究内容分为以下三个部分:首先,提出了表示数据使用状态的两个维度。通过研究国内外相关文献,综合相关研究的特点与不足,从数据用户使用行为的角度提出政府开放数据的公众关注程度与公众利用程度两个维度,以此来表示数据资源在开放之后的使用状态。其次,构建了数据使用状态的预测模型。本文从数据属性与数据管理两个层面着手分析政府开放数据的特征,提出了使用数据领域、数据格式、数据来源、主题分类、开放条件以及更新频率等六项指标作为变量,对数据的使用状态进行预测。通过综合分析常用预测方法的优缺点,利用遗传算法优化BP神经网络模型的方法,构建政府开放数据的数据使用状态预测模型。最后,对构建的预测模型进行了实证分析。本文以上海市政府数据服务网的数据作为样本,通过实证分析对本文提出的数据使用状态表示方法以及预测模型进行了验证。实证结果表明,本文构建的政府开放数据的数据使用状态预测模型具备一定的可行性,同时从定量的角度客观的反映了上述方法与模型的有效性。本文的研究为政府更好把握政府数据资源的使用情况提供了可行的预测分析方法,有助于提升政府开放数据综合服务水平,同时也为今后在政府开放数据预测方面的研究提供理论与实践依据。