论文部分内容阅读
本文主要讨论在复杂抽样方案下病例对照数据的统计分析,利用Logistic回归模型得到人群患肺癌的重要危险因素及其相对危险度的估计.
首先,我们设计了一个有效的抽样方案:采取简单随机抽样从病例组抽取样本;采取二阶段整群抽样从对照组抽取样本.对照组的抽样比较复杂:在第一阶段将对照总体划分为M个整群,随后从中抽取m个整群;在第二阶段按混杂因素将选中的整群分层,而后按照与病例组成组匹配的方式进行分层抽样.
其次,我们给出反映抽样步骤的似然函数,并基于此似然函数对获取的病例对照数据进行统计推断,得到回归系数的极大似然估计并对模型的显著性给出检验.并在最后利用数值模拟比较了本文统计推断方法与将复杂抽样样本直接按照独立样本计算极大似然估计的优劣.