论文部分内容阅读
作为我国治安机构最重要的组成部分,公安机关主要负责两方面的职能,一个是维持社会治安,另一个是侦查刑事案件。在立案的过程中,一个必要环节是对案件相关嫌疑人、报案人和证人做笔录,笔录中包含着警方需要的各种各样的信息,比如案件相关人员的身份信息、家庭信息、社会信息以及犯罪的工具、地点、时间等,这些信息对警方将案件做串并案处理起到很大的辅助作用。而想要归纳出这些信息,传统的方法则是依靠警方的人力,由警员对所负责的案件笔录信息进行手动提取。然而只依靠人力分析笔录,效率会非常低下,若是利用计算机技术对笔录信息自动抽取,则会极大的节省时间。所以公安需要一个能够帮助警方管理并分析笔录的系统,利用计算机来帮助警方更好的破案。本文调研了市场中与公安询问笔录管理系统相关的产品,查阅了与公安询问笔录管理系统设计相关的论文,并调研了能够分析笔录内容的命名实体识别方法;依据对公安笔录内容做实体识别和信息提取的需求,完成了公安询问笔录管理系统中实体识别模块的概要设计和基于规则模板方法与神经网络的详细设计,其中五个基于规则的模板法分别是地名实体识别、时间实体识别、车辆实体识别,并提取偷盗类案件信息、财产损失类案件信息,神经网络方法由BILSTM与CRF所组成,可以对地名实体、时间实体、车辆实体进行命名实体识别;最终对实体识别模块的功能性需求和非功能性需求做了相应测试,并对两种自然语言处理方法的准确率、召回率和F1值做了分析与总结。本文应用上文的成果,利用SSM框架实现了公安询问笔录管理系统的实体抽取模块。该模块主要应用在对输入的笔录内容做在线实时演算上,模块成功的完成了既定要求,在识别准确率方面也有着良好的表现。