数据开放中的症结问题研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:bbdzj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断进步,数据的产生、采集和存储量在政府,企业和个人的参与下不断增加。在这样的背景下,数据开放的概念应运而生。数据开放是指任何组织和个人能够较方便地获取他人的数据,并对其使用和分享。数据开放增强了社会各部门之间的信息交换,降低了有用经验传播和重复使用的难度,对经济发展、社会进步具有促进作用。数据开放在我国的推行相对于英美等发达国家仍然进展缓慢,数据在开放进程中受到各种各样问题的阻碍,只有解决这些问题,才能使数据进一步得到开放。但究竟有哪些问题,由何人、如何来解决,正是本文拟解决的问题。数据开放的目的是更好地利用数据,我们可以认为它是一个生态系统,数据不仅需要公开,还需要在生产、采集、分析、应用各个环节的顺畅流动,同时又不断产生。任何一个环节存在问题,都会阻碍数据的流通传播和分析利用。因此需要对数据开放的问题进行分类,从系统的角度分析这些问题。经过数据开放文献的查阅和分析,我们发现很多研究包含着数据开放问题方面的讨论,但这些讨论比较分散,需要进行归纳与整合。为了对大量数据开放文献进行比较系统的问题和挑战方面的研究,本文提出了从文献中提取数据开放领域问题的提取框架,该框架应用了词表构建、word2vec模型、点互信息计算方法等自然语言处理相关技术。最终,我们通过实验验证了该框架的有效性,并在此的基础上,根据该框架实现了数据开放文献的问题句提取。本研究是在管理领域进行的技术应用研究,在研究过程中所提出的问题句提取流程框架和将word2vec与PMI相结合的问题句提取算法,能够应用到其他领域的问题相关研究中。问题句提取的结果可以应用到数据开放问题的理论研究中,从而达到完善数据开放制度和提升管理实践的目的。
其他文献
中国纺织经济论坛是中国纺织工业联合会每年举办的经济类大型学术活动。2012年,我国纺织工业将继续落实《纺织工业“十二五”发展规划》、《纺织科技发展纲要》和《建设纺织强
本次上海纺织工业展上,同春科技携多款新机盛装登台,向行业与客户昭示自身在产品技术领先战略下打造的强大竞争力。  在同春的站台上,多款新机型吸引着业界的眼球。其中TC730和TC780A两款喷气织机是最受广大用户欢迎的两款产品。TC780A由同春在充分调研市场需求的情况下自行研制开发,将电子多臂技术、电子提花技术与高速喷气织机有机地结合起来,织造品种范围更为宽广,机电一体化程度极高。  此外,同春科
9月13日,为期四天的2013年“岱银杯”山东省棉纺行业并条工职业技能大赛在山东岱银集团胜利闭幕。  本次大赛由山东省人社厅、山东省纺织工业协会、山东省轻工纺织工委联合主办,岱银集团承办。山东省纺织工业协会会长夏志林、山东省人社厅副厅长夏鲁青、泰安市副市长展宝卫、省轻工纺织工会委员会主袁宗贵、岱银集团董事长赵焕臣等领导出席了闭幕式。  来自山东省各大棉纺企业的33支代表队、72名选手通过初赛选拔,
为了更好地实施“全国农技推广示范项目”计划,提高养殖经济效益、大力推广黄颡鱼的养殖,我站于2012年在邵武市沿山镇百樵村的一个闲置鳗场进行饲养黄颡鱼的高产试验,获亩产黄颡
随着现代计算机技术、通信技术的不断发展,矿山测量领域的数字化建设也是各矿山企业必然的发展趋势.矿山测量是关系到矿山安全的重要工作,是矿山建设与生产的重要环节,是为矿
天竹纤维已经由原来的一种概念,一个点缀,真正地发展成了一个品类的纺织原料并在快速发展。天竹纤维系统化、客户化、专业技术化已经成熟。“十一五”期间,天竹纤维以年增30%的速