论文部分内容阅读
本文针对“90后”流动人口在流入地的长期居留意愿,考虑到其影响因素复杂的非线性关系,给出一种组合预测方法——Group Lasso-Adaboost模型。近几年“90后”流动人口表现出了强劲的增长趋势,是新生代流动人口不断增长的主要力量;同时,“90后”流动人口在流入地的居留时间变动性较大,有必要对其居留意愿进行深入研究。因此,本文将“90后”流动人口作为研究对象。对居留意愿产生影响的因素可能有许多,比如代际流动、公共服务、医疗保险、健康状况、住房保障、社会融合、经济因素等等,正确选择出其中的主要因素是提高模型可解释性和预测性的前提。考虑到本文使用的全国流动人口动态监测数据中影响到流动人口居留意愿的因素众多,并且一些影响因素之间可能存在多重共线性问题,本文采用Group Lasso方法筛选影响“90后”流动人口长期居留意愿的主要因素。从Group Lasso的参数估计系数可以看出影响其居留意愿受人口学、经济、社会和心理多重因素的影响。具体表现为:性别、受教育程度、婚姻状况、流动范围和流动原因5个人口学指标,月住房支出、家庭月总支出、周工作时长、就业单位性质、个人月收入、收入变化和家庭月收入7个经济指标,户口登记类型、住房性质、医保所在地和是否办理暂住证4个社会指标,以及流动时间、流动频率、未回家过年年数、父母流动经历、社交类型和社区融合程度6个心理指标。然后在变量选择的基础上,分别构建了KNN模型、Adaboost模型和BP神经网络模型,选取50%的样本来训练“90后”流动人口的长期居留意愿与各主要影响因素之间的非线性关系,最后用训练好的预测模型分别对测试集进行预测,通过比较预测效果发现,Adaboost模型的预测效果最好,准确率为79.97%。这验证了,Group Lasso-Adaboost组合预测模型在研究流动人口居留意愿行为时的可行性和有效性。