公安部案件数据库仓库建设与数据挖掘研究

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:cocksun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前公安部信息系统已经积累了大量数据,包括案件、户籍、车辆、房屋等,极大提高了公安部的工作效率,但是如何将这些数据用于更长远的战略决策、趋势分析、关联分析成为了新的课题,所以建设公安部案件数据仓库已经成为了公安部信息化下一阶段的工作重点。本文首先探讨了数据仓库的基本原理,包括数据仓库概念、特性和建模方法。然后描述了公安部案件数据仓库的建设过程。首先是整体架构设计,需要考虑本系统数据和外来数据两种,本系统数据主要来自公安系统内部,外来数据在项目一期还没有正式考虑,主要是来自电信、金融等行业,这些数据可能来自不同结构、不同种类的数据库,所以需要ODI服务器来实现数据的抽取、清洗、转换和加载。然后是应用软件和数据仓库软件选型,主要讨论后者,为什么选择Oracle作为数据仓库软件,Oracle相对其他数据库软件的优势在哪里。之后是分析处理和数据挖掘模块设计和数据仓库设计,数据仓库设计采用维度模型,按客户关心的主题组织,在数据仓库基础上才能够实现数据挖掘,数据挖掘模块功能通过与客户多次讨论确定。最后是分析处理和数据挖掘模块功能举例,主要包括以下几方面:1.以时间、空间为条件的数据分析,主要分为按照时间范围查询案件相关信息——时间碰撞,按照空间,包括案件发生地、户籍所在地、临时住所等查询案件相关信息——空间碰撞,以时间、空间同时为条件的查询案件相关信息——时空碰撞;2.以作案特点为条件的数据分析,主要包括作案手段特点、时间段特点、作案对象特点等,以相似的信息查找案件;3.高危分析,类似作案特点分析,但不同的是,高危分析主要是针对大案要案,因为这些案件都是工作重点;4.分类分析,按照维度或度量分类分析,例如案件数、死亡人数、受伤人数、被绑架人数等,在结果基础上可以继续做图表分析,可以利用饼图、曲线图、柱状图获得更直观的结果;5.数据挖掘研究,主要有关联分析和序列分析,前者研究同一个罪犯不同类案件的发生的关联性,后者研究同一个罪犯不同类案件的先后关系。
其他文献
增强激光诱导击穿光谱强度的方法有很多,本文提出一种应用双重约束方法增强光谱强度的方法,将腔体与纳米金结合、磁场与纳米金结合起来约束黄铜等离子体激光诱导击穿光谱.分
动画角色是动画片的灵魂,观众对一个动画角色的价值判断不单纯停留在其外在的造型层面,还包括对角色性格内涵的认同。
随着计算机、互联网等现代信息技术的迅猛发展,世界各国纷纷借助现代信息科技来改造和优化政府的工作流程,构建电r政府,全面促进政务信息公开、强化政府监管、提高行政管理效
讨论了在应用DCS时,如何沟通工程设计人员和软件组态人员之间的条件交接,提出“应用软件组态的条件设计”的基本内容和编写方法。
全概率公式是概率论中的一个重要公式,通过对“完备事件组”条件的弱化,得到了全概率公式的第一个推广形式;通过对“事件列两两互斥”条件的两种方式的弱化,得到了第二个和第
作为城市的“语言名片”,英语标识语是一个城市的国际化程度和文化品位的直接体现,对提升城市形象起着不可替代的作用。但临沂市英语标识语存在拼写错误、乱译和语用错误等问
译者作为翻译主体,在翻译实践中发挥着传情达意的作用,旨在将原作之美淋漓尽致地得以再现。葛浩文先生的英译本《生死疲劳》中,译者从对审美客体的态度、对审美客体构成的认
主要介绍了在工控机上安装GUS软件的操作步骤,重点介绍GUS集成键盘软件设置方法。
建筑企业在经营管理中,其根本目标就是降低投入资金,同时保证施工质量,在此基础上,将企业的经济利益最大化。但是在长期发展中,很多建筑单位施工中只注重施工质量和施工进程,
项目管理本文的研究范围属于项目管理九大体系中人力资源管理。项目团队管理作为人力资源管理的主体,在本文中主要以管理学和组织行为学为依据,结合项目管理、团队建设与管理