论文部分内容阅读
近年来全球暴恐案件频发,国内外反恐形势极为严峻,反恐怖工作已成为公安部门的第一要务。2014年以来,我国暴恐活动进入新一轮活跃期,新疆暴恐活动呈现明显外溢之势,山东作为北京的南大门,连接南北的战略枢纽,京津冀一体化的重要部分,地理位置特殊,客观上为恐怖势力的渗透和蔓延提供了便利条件,涉恐形势严峻。然而,传统的事后打击已经无法满足反恐现实的需要,传统的积分模型对于权重设定的准确性、科学性也存在疑问。因此,研究涉恐实体的行为,同时改良传统积分模型的权重计算方法就尤为重要了。在算法选择方面,本文主要是对传统积分模型权重计算的改良,依靠引入机器学习的逻辑回归算法(logisticregression),同时对于二分类的问题,逻辑回归算法有着独特的优势。传统积分模型的权重一般由侦察员主观经验决定,分值赋予是否合适存在争议。机器学习的逻辑回归算法,属于监督式学习,其算法相对简单,不像随机森林、SVM、神经网络、GBDT等分类算法那么复杂,但是针对性和有效性也更强,已经比较成熟,准确率较高。在模型参数估计方面,选取了极大似然估计法估计模型参数,研究即变为以对数似然函数为目标的最优化问题,本文采用梯度下降法求权重的极大似然估计值。在数据源方面,选择了目前已知的109种涉恐实体异常行为中的部分特征数据,并进行标签化,方便后期特征的增加或减少,同时选择部分特征构建训练数据集。在算法验证方面,选择了目前主流的Python编程语言进行,利用sklearn、pandas、Numpy等库,从数据准备、预处理、训练、学习等几个方面对逻辑回归算法进行了有效性验证。同时对人工赋值权重的传统积分模型以相同的数据集进行积分计算,其结果较逻辑回归算法缺少准确性和科学性。