某公安询问笔录管理系统实体抽取模块的设计与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:champhorse
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为我国治安机构最重要的组成部分,公安机关主要负责两方面的职能,一个是维持社会治安,另一个是侦查刑事案件。在立案的过程中,一个必要环节是对案件相关嫌疑人、报案人和证人做笔录,笔录中包含着警方需要的各种各样的信息,比如案件相关人员的身份信息、家庭信息、社会信息以及犯罪的工具、地点、时间等,这些信息对警方将案件做串并案处理起到很大的辅助作用。而想要归纳出这些信息,传统的方法则是依靠警方的人力,由警员对所负责的案件笔录信息进行手动提取。然而只依靠人力分析笔录,效率会非常低下,若是利用计算机技术对笔录信息自动抽取,则会极大的节省时间。所以公安需要一个能够帮助警方管理并分析笔录的系统,利用计算机来帮助警方更好的破案。本文调研了市场中与公安询问笔录管理系统相关的产品,查阅了与公安询问笔录管理系统设计相关的论文,并调研了能够分析笔录内容的命名实体识别方法;依据对公安笔录内容做实体识别和信息提取的需求,完成了公安询问笔录管理系统中实体识别模块的概要设计和基于规则模板方法与神经网络的详细设计,其中五个基于规则的模板法分别是地名实体识别、时间实体识别、车辆实体识别,并提取偷盗类案件信息、财产损失类案件信息,神经网络方法由BILSTM与CRF所组成,可以对地名实体、时间实体、车辆实体进行命名实体识别;最终对实体识别模块的功能性需求和非功能性需求做了相应测试,并对两种自然语言处理方法的准确率、召回率和F1值做了分析与总结。本文应用上文的成果,利用SSM框架实现了公安询问笔录管理系统的实体抽取模块。该模块主要应用在对输入的笔录内容做在线实时演算上,模块成功的完成了既定要求,在识别准确率方面也有着良好的表现。
其他文献
随着互联网的快速发展,大学术数据迅速增长,为科学发现和技术创新在世界范围内的传播提供了技术基础。然而,随着数据量的不断增多,如何从学术数据中挖掘有用的信息成为一个关键问题。共词网络作为一种基于文章关键词构建的网络,可以为学术数据挖掘提供有效的数据支撑。图表示学习通过学习图结构和图属性,可以解决数据无法表示的问题,为数据的后续处理提供良好的数据特征表示。基于图表示学习的共词网络分析可以从一个含有丰富
随着工业技术的快速发展,在机械装配领域,对于装配的精度和质量提出了越来越高的要求。虚拟装配可以使工程师在设定产品装配工艺之前,提前发现存在的问题,提出修改意见,进而提高装配的效率以及可靠性。因此,本课题从虚拟装配中的两项关键技术:装配序列规划、零件间干涉检测出发,展开论文。装配序列规划问题始终是虚拟装配方面研究的热点也是难点,本文分析了目前存在的一些算法在求解装配序列时的不足,针对这个问题,提出了