论文部分内容阅读
我国的房地产市场正在发生激烈的变化与重组,多数新房在区位、生活配套设施上的欠缺,导致人们的购房策略开始转向二手房交易市场,这也意味着我国的房地产交易市场将由新房主导的市场向二手房主导市场过渡。在这种情况下,人们对完善的二手房市场信息的需求越来越迫切。准确、及时、完善的二手房价格指数的发布,不仅为政府、房屋中介、房屋买卖双方提供决策参考,而且对房地产市场的健全发展有着至关重要的作用。本文从大数据背景出发,结合二手房市场特征,基于批量评估理论,运用随机森林算法,构建了一套精度高、处理速度快、稳定性好的二手房价格指数计算模型。国内外学者在计算二手房价格指数时,通常采用成本投入法、加权平均法、特征价格法、重复交易法和混合模型法等,这些传统的方法在实际计算过程中,通常会受到人为主观因素的影响,且样本数量有所限制,使得计算出的价格指数的准确性下降,误差较大,不能真实的反应二手房市场的变化情况。近年来,国内外研究学者在进行房地产市场研究时,应用了统计建模及机器学习的方法,获得了良好的效果。本文在大数据分析的理论基础上,搜集大量数据,运用先进的机器学习方法——随机森林,进行二手房价格指数的构建。随机森林算法是一种非线性建模工具,该算法通过对样本数据进行不断的训练学习完成模型构建,并且在数据特征缺失时也能输出拟合度高的结果,适合二手房价格指数模型的构建。本文选取重庆市江北区四个小区组成研究区域进行实证研究,应用随机森林算法,借助R软件相关程序包,确定模型参数的最优取值(mtry=5,ntree=700),计算二手房价格,对比预测结果,最终建立研究区域的二手房价格指数计算模型,并绘制不同报告期的二手房价格指数曲线图。通过研究结果,可以发现随机森林模型预测出的二手房价格指数值非常接近研究区域真实的二手房价格指数值,随机森林模型的预测效果良好。本文建立的二手房价格指数模型为政府宏观调控及消费者买卖房产提供相对准确、及时、客观的指导,具有一定的实用价值。