论文部分内容阅读
近年来,我国经济的快速发展,房地产行业迅速崛起.随着人们生活节奏的加快,精装房也越来越受到青睐,因此能够快速准确对多变量的精装房进行预测,对购房者或售房者都有重要指导意义.国内关于精装房的数据较少,本文便以Ames地区的精装房作为研究对象.首先利用数据之间相关性进行回归模型插补以及基于分类变量的众数或k-means插补进行缺失值的填充,其次根据已经记录的特征变量构造新的影响变量,并对数据进行对数变换及标准化处理.随后根据训练集建立单一预测模型,如线性回归,Ridge回归,Lasso回归等.结果表明:Lasso回归预测效果最好,均方根误差=0.150578,~2=0.926347.单一模型在每个样本点上预测值不具有一致性,本文又建立权重组合模型及Stacking集成模型.权重组合模型中将六个单一模型:Ridge回归模型,Lasso回归模型,ElasticNet回归,GradientBoosting回归,XGBoost回归,随机森林回归的预测方差转化为权重进行加权组合.对比于Lasso回归模型,测试集上减少6.9%,~2提高1%.Stacking集成模型中,将六个单一回归模型预测结果视为新的特征变量建立线性回归模型.对比于Lasso回归模型和权重组合模型,Stacking集成模型的分别减少22.3%,16.6%.~2分别提高1%,2.3%.说明Stacking集成算法对Ames房价预测效果最精确,误差较低,能很好的为购房者或售房者提供参考价值.