【摘 要】
:
随着我国城市化的发展,伴随而来的是大规模的城市建设,建筑垃圾的产量也逐年递增。为了更好地实现建筑垃圾减量化、资源化和无害化的目标,住建部开展了全国建筑垃圾治理试点工作。受住建部委托,项目团队研发了全国建筑垃圾管理平台信息上报系统,以支撑住建部与试点城市之间信息收集和交互。但是,在系统运行过程中,我们发现各试点城市的上报数据质量各异,一定程度上存在不准确、重复、缺失等情况,已影响到住建部试点工作的统
论文部分内容阅读
随着我国城市化的发展,伴随而来的是大规模的城市建设,建筑垃圾的产量也逐年递增。为了更好地实现建筑垃圾减量化、资源化和无害化的目标,住建部开展了全国建筑垃圾治理试点工作。受住建部委托,项目团队研发了全国建筑垃圾管理平台信息上报系统,以支撑住建部与试点城市之间信息收集和交互。但是,在系统运行过程中,我们发现各试点城市的上报数据质量各异,一定程度上存在不准确、重复、缺失等情况,已影响到住建部试点工作的统计分析。在此背景下,本研究针对试点城市上报的建筑垃圾时空数据开展清洗策略与质量控制方法研究。主要研究内容及结果如下:(1)针对建筑垃圾时空数据的属性特征,构建多约束组合模型,利用TOPPIS算法计算各类数据与清洗模型的匹配度,并据此进行最优清洗模型的选择。(2)针对上报系统中的“脏数据”类型,构建自然语言重复清洗模型、异常数据清洗模型和缺失数据填充模型,实现数据的一致性检查、无效值和缺失值的处理。(1)基于N-Gram算法构建了自然语言重复清洗模型,并与编辑距离算法与Smith—waterman算法进行对比实验。结果表明,在查准率方面,本文提出的清洗模型最低为87.5%,最高为96.1%,相比于其它两种算法的准确率更高;在查全率方面,本文提出的清洗模型查全率最低为87.42%,最高为93.2%,精度远高于其它两种算法。(2)基于拉依达准则构建了异常数据清洗模型,并针对多个试点城市存量排查数据进行异常值检测;分析不同城市异常值出现次数,采用忽略元组法进行异常值排除。(3)基于改进的LSTM清洗算法构建缺失数据填充模型,并与传统的LSTM算法对比实验。结果表明,本文提出的填充模型平均RMSE精度为11.708,传统的LSTM算法为22.653;本文提出的填充模型平均MAPE精度为9.064%,传统的LSTM算法为16.942%,故本文传统的LSTM算法精度更高。(3)为检验各试点城市上报数据的整体质量,构建建筑垃圾数据质量评估模型。依据准确性、唯一性、一致性、完整性等一级指标,采用AHP-熵组合权重法进行指标权重计算,并基于模糊综合评价法对数据等级进行划分,最后设计了相对合理的上报数据处置方案。针对35个试点城市2019年9月上报数据开展了数据质量评估实验,将实验结果与试点城市进行沟通反馈,各试点城市对于本文得出的数据质量等级无异议,证明本模型评估结果较为可靠。(4)为固化数据清洗模型与数据质量评估模型,研发了建筑垃圾上报数据清洗平台,实现了建筑垃圾上报数据清洗和质量评估的自动化。通过本平台,住建部可及时获取上报数据质量信息,向试点城市反馈数据质量分级结果,督促其进行数据整改。系统应用后表明其有效地提高了建筑垃圾上报数据的整体精度。综上,本研究针对建筑垃圾试点城市上报的时空数据,设计了一套数据清洗与质量评估相结合的处置体系和软件系统,实现了清洗模型的精确匹配,问题数据的自动填充,数据质量的科学评估。在敏感词检测,数据预填充等方面提出了改进方法,为上报数据的质量提升提供了可靠保障。实际应用结果表明,该处置体系和软件系统高效可用,有效支撑了建筑垃圾治理试点工作。
其他文献
<正>慢生活,是一种生活方式,也是生活境界。当美酒徐徐打开,闻着浓浓的醇香,轻啜慢饮,细细品味,享受美好生活……9月9日上午10:00,“古越龙山·慢酒馆”开馆仪式在绍兴古城举行,这是绍兴黄酒首家以“慢生活”为主题的酒馆,也是古越龙山首家以现代时尚风格开设的酒馆。在这里,你可以品鉴高端经典的绍兴酒,可以品味年轻时尚的“黄酒咖啡”,还可以品尝黄酒奶茶、黄酒冰淇淋……在这里,你可以感受到“黄酒正年轻”
针对海量时序数据集提出了一种相似重复数据检测算法。该算法以传统近邻排序算法SNM为基础,增加了对窗口大小的动态调整策略,新增了窗口跳跃滑动策略。新策略大大减少了相似重复数据清洗过程中的比对次数。该算法的提出,对时序数据集中的相似重复记录清洗效果带来了极大的提升,尤其是对于相似重复记录较稀疏的数据集,在理论和实验结果中均表明该算法在提高相似重复数据的检测性能上有显著效果。
电商背景下,农产品营销渠道日趋多元化,这为乡村振兴战略的实施创造了良好条件。然而,在农产品同质化现象普遍的情况下,如何借助有力的营销活动来实现销量和利润的增长,是需要重点研究和探索的内容。本文结合电商背景下农产品营销的现实情况,以概括营销内容和方式为基础,分析农产品营销过程中存在的问题,并提出农产品营销的优化策略,为电商背景下相关主体更好地开展农产品营销活动提供相关思路和方法参考。
数据质量问题是数据管理中最重要的问题之一,在大数据时代的今天,数据的影响力越来越大,政府和企业通过分析数据并根据结果指导决策,决定发展方向。由于在数据收集的过程中会产生各种各样的错误,因此现实生活中的数据往往是存在问题的脏数据,从而导致政府和企业做出不准确的分析结果和决策。为了防止脏数据造成的决策失误、经济损失,提升数据质量迫在眉睫,大数据时代对数据清洗技术提出了更高的要求。数据依赖关系通常被用于
本文以媒介融合发展为大背景,在此基础上首先搞明白何为媒介融合,进行媒介融合的相关理论阐述。其次,结合我国新闻传播的真实发展状况,详细具体地剖析其未来发展将要面临的挑战,进而明确媒介融合生态对于新闻传播人才设立的新要求及门槛。最后,针对性地给出一些人才培养的对策建议。
双馈风力发电机组出厂调试是产品出厂前的最后一道检验关口,能够检测机组各部件是否处于正常工作的状态。文章阐述了双馈风电机组出厂调试的作业流程以及调试作业要求,介绍了在出厂调试中实现快速动态调试作业方法。
英语与汉语具有不同的文化背景,两种语言之间存在着很大的差异性,因而英汉翻译会存在不对等性。自从翻译的文化转向这一概念被提出后,人们越来越重视英汉翻译过程中的文化内涵。本文将以电影《怦然心动》字幕为例,举例分析在字幕翻译过程中由于中西方风俗习惯、宗教信仰、历史典故以及思维方式等方面存在的差异导致出现的英汉翻译不对等性,并分析产生这种不对等时,译者为达到翻译的文化功能等值所需要采用的翻译策略。
范长江研究是中国新闻史领域的一门“显学”,但关于其对外传播方面的研究却几乎为空白。全面抗战时期,范长江领导创办“青记”、国际新闻社和《华商报》,并展开“媒体外交”,积极对外宣传中国共产党抗日民族统一战线主张。这为革命战争时期对外传播基础薄弱的中国共产党开辟了阵地、扩大了影响、培育了人才。本文对范长江的对外传播理念和新闻实践历程进行重新发掘和探讨,以期进一步丰富范长江新闻思想内涵和中国共产党百年对外