论文部分内容阅读
目前公安部信息系统已经积累了大量数据,包括案件、户籍、车辆、房屋等,极大提高了公安部的工作效率,但是如何将这些数据用于更长远的战略决策、趋势分析、关联分析成为了新的课题,所以建设公安部案件数据仓库已经成为了公安部信息化下一阶段的工作重点。本文首先探讨了数据仓库的基本原理,包括数据仓库概念、特性和建模方法。然后描述了公安部案件数据仓库的建设过程。首先是整体架构设计,需要考虑本系统数据和外来数据两种,本系统数据主要来自公安系统内部,外来数据在项目一期还没有正式考虑,主要是来自电信、金融等行业,这些数据可能来自不同结构、不同种类的数据库,所以需要ODI服务器来实现数据的抽取、清洗、转换和加载。然后是应用软件和数据仓库软件选型,主要讨论后者,为什么选择Oracle作为数据仓库软件,Oracle相对其他数据库软件的优势在哪里。之后是分析处理和数据挖掘模块设计和数据仓库设计,数据仓库设计采用维度模型,按客户关心的主题组织,在数据仓库基础上才能够实现数据挖掘,数据挖掘模块功能通过与客户多次讨论确定。最后是分析处理和数据挖掘模块功能举例,主要包括以下几方面:1.以时间、空间为条件的数据分析,主要分为按照时间范围查询案件相关信息——时间碰撞,按照空间,包括案件发生地、户籍所在地、临时住所等查询案件相关信息——空间碰撞,以时间、空间同时为条件的查询案件相关信息——时空碰撞;2.以作案特点为条件的数据分析,主要包括作案手段特点、时间段特点、作案对象特点等,以相似的信息查找案件;3.高危分析,类似作案特点分析,但不同的是,高危分析主要是针对大案要案,因为这些案件都是工作重点;4.分类分析,按照维度或度量分类分析,例如案件数、死亡人数、受伤人数、被绑架人数等,在结果基础上可以继续做图表分析,可以利用饼图、曲线图、柱状图获得更直观的结果;5.数据挖掘研究,主要有关联分析和序列分析,前者研究同一个罪犯不同类案件的发生的关联性,后者研究同一个罪犯不同类案件的先后关系。