论文部分内容阅读
回归分析是研究变量问相互依赖关系的统计分析方法,主要包括参数回归和非参数回归.参数回归需要事先假定变量之间的函数形式,但在研究过程中我们发现,事先假定的函数形式并不一定符合实际的要求.非参数回归是比较灵活的回归方法,不需要假定变量间的函数形式,充分利用数据本身,选择适当的回归函数拟合数据的变化趋势,提高了估计的精度.面对高维数据问题时,我们需要选择合适的变量进入模型.Lasso正是一种最常用的基于惩罚回归的变量选择方法.本文首先详细介绍了基于截断幂基的惩罚样条回归模型的构造,并通过积分近似计算的例子,展示了惩罚样条回归的应用价值,并利用该方法拟合了经济学中的洛伦茨曲线.其次,本文介绍了另外一种样条基函数—B样条基函数的定义和性质,并提出了基于B样条基的改进的Lasso方法.该方法利用相邻节点之间函数值极差的倒数作为惩罚调节来压缩模型系数.模拟显示该方法改进了Lasso算法的优越性.并给出了一个基于该方法的医学实例.