论文部分内容阅读
1995年,Benjamini&Hochberg定义了新的错误率FDR(false discovery rate),并提出了控制FDR的方法:B-H方法。B-H方法的原始证明假设检验统计量相互独立。然而,两两多重比较的统计量具有相关性。1999年Williams,Jones,Turkey提出猜想:B-H方法能够控制两两多重比较的FDR。众多文献通过数值模拟讨论了B-H方法在两两多重比较中的性质,并验证了Williams-Jones-Tukey猜想。但该结论至今未在理论上被证明。假设检验中的p值通常是未知的,实际应用中,常用N(0,1)、学生化t分布和Bootstrap方法计算p值。本文主要证明了,在一定条件下,使用N(0,1)、学生化t分布或Bootstrap方法计算p值,B-H方法均能够渐近控制两两多重比较的FDR;且该结论对非均衡样本(各组样本的样本量和方差各不相同)仍然成立。此外,本文进行了实证分析。首先,通过数值模拟验证了文中的主要结论;其次,将B-H方法应用于2012年上海各区高考成绩的两两多重比较中,并得出了一系列结论,如徐家汇区的平均高考成绩明显高于奉贤区。