论文部分内容阅读
随着国民经济的不断发展,我国民航机场的旅客吞吐量也不断增加,由此带来的安检压力也逐渐增大。虽然我国民航安保持续向好发展,但是也存在安检措施“对物不对人”带来的安检效率不高的问题。根据旅客分级安检发展的趋势,针对旅客风险评估缺少对于个人背景特征定量研究的问题,本文提出基于机器学习的民航旅客综合风险评估方法。论文的主要工作如下:首先,完成数据集预处理过程。针对目前国内可供研究的案例样本极少和算法保密等问题,本研究采用开源的John Jay&ARTIS跨国恐怖主义数据库,分析个人背景特征对个人风险等级的影响。对数据集的特征属性进行详细分析,完成数据集预处理过程,包括数据清洗、特征筛选、标签构造、过采样构造平衡训练集等。其次,利用机器学习方法,选择合适的风险评估特征指标。使用随机森林的分类方法对不同风险等级样本分类,通过基尼指数计算分类过程中特征的重要度,以及特征对分类的贡献率,选择其中累计贡献率超过70%的部分特征作为风险评估中个人特征的评估指标,并对这些特征及其属性对其风险等级的影响进行分析。最后,提出定性和定量综合的民航旅客风险评估方法。综合个人特征指标以及安检信息指标,使用专家打分法作为定量评估方法,评估旅客风险等级;以人物画像作为定性评估方法,通过对高风险人员的个人特征分析构建人物画像,为旅客分级过程中个人风险等级的评估提供直观的参考,作为安检现场的一种辅助评估方法。