交管信息系统分布式数据迁移研究与实现

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:tiger5156
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着交管信息系统数据量增长,亟需从Oracle数据库切换到分布式数据库,切换过程中首先面临的是历史数据的迁移。由于系统允许的停机升级时间较短,待迁移的数据量大,主要面临以下两个问题:一是海量异构数据,历史数据和实时数据都要迁移,传统的迁移方案脚本执行失败高、传输时间非常长;二是数据安全性、一致性无法保障,数据传输时数据容易丢失,传输文件未加密。针对以上问题,本文提出了一种实现跨平台,整合异构数据的大数据在线迁移方法,主要研究内容有以下几点:首先,针对异构数据源之间数据迁移时结构转换复杂,本文设计开发了一个支持读取原数据库对象,自动生成对应分布式数据库对象的结构迁移子系统。然后针对非结构数据文件大、占用带宽大导致传输慢的问题,本文通过研究和设计一套压缩算法,对文件进行压缩,压缩后的文件减少了网络带宽提高传输效率;设计开发了实时数据迁移程序,实现了历史数据迁移的同时,增量数据也能同步迁移,保证数据的完整性。其次是针对数据传输过程中数据易丢失,数据易篡改的问题本文设计开发了数据加密功能,通过对文件、数据、字段进行MD5加密,确保数据传输过程中不丢失和不被篡改。然后针对传统数据迁移时无法追踪当前迁移进展,以及无法确定传输前后总量是否一致的问题,本文设计开发了迁移进展跟踪程序,通过计算传输的数据总量和传输速度和预计完成时间,提高了对数据迁移的进度把控。最后,完成了整个迁移系统的设计、编码实现与测试,并且开展Oracle数据库与分布式数据库的数据一致性验证。成功验证分布式数据库的数据一致性和准确性。通过本文研究,实现了短时间内迁移海量异构数据到大数据分布式系统,并保证了数据的一致性,研究成果已在广东省交管信息系统成功试运行并验证了可行性,研究内容可为剩余全国省份的分布式数据迁移提供借鉴,以及其他类似系统进行数据迁移提供参考。
其他文献
随着国内智能制造的发展,MES(Manufacturing Execution System)制造执行系统的要求越来越高,针对在一条复杂的离散型生产流水线上可能存在几十个工站和总成型号、不同工艺路径组合及数量庞大的原材料种类等问题,如何通过MES改进来提高生产效率,质量控制从而提升企业的竞争力具有相当大的实际运用价值。本文以X汽车零部件公司的生产业务为研究对象,介绍X公司的生产流程和MES概况,通
数据复制中心旨在解决企业面临的各类数据同步问题。常见的问题有:把线上数据同步到数据仓库供后续分析;实现变更数据捕获模式,订阅数据库变更以更新缓存、搜索引擎或是异步触发后续业务流程;在不同数据中心之间做双向同步以提供异地容灾能力等。业界也有一些解决这些问题的尝试,但公开的方案有些只是命令行工具,无法满足企业对可用性的要求;有些只支持特定的数据源,难以拓展到不同类型的数据源;大部分方案使用与源端相同的
S公司用SAP CRM系统处理产品信息、客户信息等主数据以及投诉、故障追踪单和报障单等业务数据。用户除了通过CRM网页客户端进行业务数据的操作,还通过外部应用及APIs与CRM中的业务数据作交互。由于CRM提供的业务数据搜索服务不能满足用户的需求,本文构建了一种新的搜索解决方案,关键是从底层将搜索由数据库搜索切换成SAP TREX搜索,形成一个新的SAP CRM搜索,通过该方案的实施改善企业内外部
当前对计算系统高效性和灵活性的需求日益增加。可重构处理器兼具专用集成电路的运算高效性与通用处理器的编程灵活性,近年来受到了广泛关注。细粒度可重构结构(Fine-Grained Reconfigurable Architecture,FGRA)在比特级进行配置,具有良好的配置灵活性。粗粒度可重构结构(Coarse-Grained Reconfigurable Architecture,CGRA)由大
目的研究肥胖型多囊卵巢综合征患者实施营养干预治疗的临床效果。方法选80例肥胖型多囊卵巢综合征患者,根据治疗方法的不同,将其分成对照组和治疗组。对照组40例患者采用二甲双胍联合达因-35进行治疗,治疗组40例患者在对照组基础上,采用低碳水化合物联合低能量饮食实施营养干预治疗。对比两组研究对象在治疗后顺利妊娠率、治疗前后血脂、血糖水平。结果治疗组患者在治疗后顺利妊娠率高于对照组;治疗前后血脂、血糖水平
随着网络论坛、贴吧等网络文化的兴起,用户越来越频繁地使用反讽——一种表达强烈情感的语言方式。反讽一般称反语,通常来说就是一种带有讽刺意味和反义内涵的语句,从字面上很难获取和理解语句真正要表达的意思,通常其真正的意思正好与字面上的意思相反,大部分时候需要从语境,甚至时事才能理解。这让网站管理者很难快速并且准确地了解用户的真实意图。给网络监管和舆情收集带来不小的阻碍。为了解决此问题,本文通过使用深度学
一些大型集团其业务涉及保险业务、银行业务、投资业务等,技术部门开发了上百个移动应用来支持业务开展,其通过移动应用的版本更新来发布一些新的功能或修复旧版本的一些问题。但应用版本升级率并不能得到有效保障,这样致使一些新版本的功能或问题修复无法触达旧版本用户。为了提升移动应用程序版本的升级率,很多技术部门采用的Hybrid模式开发手机应用。本文通过研究各种程序更新方法,在此基础上结合Hybrid模式的架
工作流技术是一种起源于办公自动化系统的技术。作为过程自动化与协同技术的一种,工作流技术已经在很多领域(如金融业、制造业、科学界等)得到广泛的应用。为了提高工作效率,许多业务过程都会采用工作流技术,其关键是应用计算机技术把业务过程抽象出来,建立对应的工作流模型来实现自动化处理。随着云计算的发展,服务架构从传统的平台即服务(Platform as a Service,Paa S)慢慢演变到无服务器(以
面对爆炸式增长的学科信息以及相关的文献资料,科研工作者亟需构建系统且完善的领域型学科知识图谱,从而高效应对海量数据,快速获取有效信息,精准快速把握核心知识点。目前学科知识图谱的构建多从文献计量学角度,分析学科知识的统计学特性,基于关键词完成信息挖掘。另一方面,自然语言处理技术(Natural language process,NLP)作为一种新兴的文本挖掘方法,能够快速提取学科文献中的核心内容。本
近年来,粗粒度可重构阵列由于其能够在特定应用领域实现高能效而受到广泛关注。粗粒度可重构阵列通过主核传递的任务信息进行配置,利用可重构的处理单元和互联实现不同应用所需的计算功能。随着领域和规模的不断扩展,应用的数据流图变得愈加复杂,导致在大规模阵列空间结构上的映射变得更加困难。在阵列执行过程中,数据流由于受到控制、访存等因素影响,具有不同的执行速率。这些不同速率的数据流在阵列空间结构上的耦合同步导致