论文部分内容阅读
目的:本研究旨在利用中学年龄阶段学生现在吸烟行为的影响因素的资料建立中学生现在吸烟行为的预测模型,进行有序反应变量资料建模方法和评价的探索,以期为今后的有序反应变量资料建模分析起到抛砖引玉的作用。方法与资料:采用累积logit、probit及cloglog(又称gompit)等模型建立中学生现在吸烟行为预测模型,找出中学生现在吸烟行为的主要影响因素,在此基础上探讨累积模型建模的方法学问题。资料为原中国预防医学科学院《烟草广告对青少年吸烟行为吸得影响的调查》在重庆市九龙坡区的调查数据。结果:本文资料现在吸烟率为9.5%。其中男学生为18.28%,女学生为0.85%,男学生的现在吸烟率明显高于女学生;重点中学、普通中学、中专和职高技校四类学校的现在吸烟率具有统计学意义;各年级的现在吸烟率分布也不同;每天吸烟率为3.85%、每周吸烟率为3.25%、偶尔吸烟率为2.40%、不吸烟率为90.50%;平均开始吸第一支烟的年龄为13.0岁。筛选出对中学生现在吸烟行为的影响具有显著意义的10个因素:年龄、性别、母亲的文化程度、学习成绩、零用钱、是否想模仿电影中正面人物吸烟、身边有人吸烟介意的程度、好友递烟会吸的可<WP=5>能性、应该禁止向青少年(18岁以下)售烟以及好友中吸烟者的比例。将这10个因素作为建立中学生现在吸烟行为预测模型的参数,分别建立累积logit、probit及cloglog回归模型三类模型。所建模型的拟合信息准则、拟合优度统计量、R2和关联性指标等评价指标显示:累积logit、probit及cloglog三个模型拟合效果均好、能对变异进行解释。模拟的200个随机数据集分别建模所得广义调整R2无大于等于实际数据集所得广义调整R2值。结论:对反应变量有序分类资料建模分析,拟合信息准则、拟合优度统计量、R2和关联性指标等评价指标表明建立的累积logit 、probit 、cloglog模型拟合效果、关联性均较好。三类累积模型要求资料反应变量为有序分类且样本量较大、阳性率不太低。在样本例数相对不足、阳性率较低的情况下,monte carlo模拟方法对反应变量有序分类资料所建模型预测的实用性评价具有较好的效果。建议在三类累积模型的各评价指标结果差异不大的情况下采用累积logit模型,模型参数同流行病学上比值比的联系使模型参数的解释更容易为人们所理解。