分类敏感问题分层抽样调查的统计方法及应用

来源 :苏州大学 | 被引量 : 0次 | 上传用户:bombwang1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:在当今的社会调查中,经常会遇到各类敏感问题。在对敏感问题进行调查时,若采用直接调查的方式,由于涉及到个人或单位的隐私或者利益,被调查者往往拒绝回答或者在不得已回答的情况下提供虚假的回答,这样就破坏了数据的真实性,而且破坏程度的大小亦无法衡量。为了弥补传统调查方法的缺陷,1965年Warner提出了随机应答技术Warner模型。此后,统计学家们在此基础上设计了各种改进的模型。然而,在本项目组研究前,国内外对敏感问题的抽样调查,主要局限于简单随机抽样调查或对随机化模型的改进,实际应用也局限于小范围特殊人群小样本的简单随机抽样调查,且对于敏感问题抽样调查的效度和信度也极少研究。本文选定了二分类敏感问题Simmons模型、多分类敏感问题随机回答模型和随机间接回答模型,对这三种模型在分层抽样条件下的调查方法和统计公式进行了探讨,并成功应用本文的调查方法和统计公式对北京市性病艾滋病高危人群——男男性行为人群(MSM)进行了调查。通过计算机模拟分类敏感问题分层抽样调查,对本文所研究的调查方法和统计公式进行效度和信度的评价,为二分类敏感问题和多分类敏感问题的大规模的抽样调查提供科学的调查方法及有效、可靠的统计公式,为卫生部门针对性地开展健康教育以及制定性病艾滋病防控政策措施提供科学的调查数据。方法:在本文研究中,根据随机应答技术理论、分层抽样方法、Cochran的经典抽样理论、全概率公式、方差的基本性质等概率论与数理统计学理论方法推导出二分类敏感问题Simmons模型,多分类敏感问题随机回答模型和随机间接回答模型在分层抽样条件下各层总体比例的估计量及其估计方差的计算公式以及整个总体比例的估计量及其估计方差的计算公式。于2011年7月—9月,采用分层抽样的方法,以北京市MSM活动场所所处的地理位置为分层依据将其分为城区、近郊和远郊三层。在各层分别抽取MSM51人、450人、120人,合计621人,成功应用两种RRT模型对二分类敏感问题和多分类敏感问题进行了调查分析。且本文通过蒙特卡洛计算机模拟分类敏感问题分层抽样调查来评价本文调查方法及统计公式的效度和信度。结果:1、本研究推导出了二分类敏感性问题Simmons模型和多分类敏感问题随机回答模型和随机间接回答模型在分层抽样方法下的各层敏感问题总体比例的估计量及其估计方差的计算公式以及整个总体敏感问题总体比例的估计量及其估计方差的计算公式。2、运用本文研究的分层抽样条件下的两种RRT模型的调查方法及统计公式,调查城区、近郊、远郊层以及整个北京市男男性行为人群的敏感问题的结果如下:(1).城区、近郊、远郊层以及整个北京市MSM人群最近一次与男性发生肛交性行为时安全套的使用比例分别为64.71%、82.22%、81.94%和80.18%。(2).城区、近郊、远郊层以及整个北京市MSM人群最近1个月中肛交从不全程使用安全套、有时全程使用安全套、每次全程使用安全套、没有肛交的发生比例分别是2.94%、48.69%、45.43%、2.94%;5.93%、29.63%、56.29%、8.15%;8.33%、20.83%、68.06%、2.78%和6.57%、28.19%、59.83%、5.41%。(3).城区、近郊、远郊层以及整个北京市MSM人群最近一年男男商业性性行为中平均每次收费<200元、200~399元、400~599元、600元以上、无男男商业性性行为的比例分别是15.29%、3.53%、7.45%、7.45%、66.28%;2.22%、1.33%、0.44%、7.56%、88.45%;1.67%、3.33%、8.33%、11.67%、75.00%和3.44%、2.38%、4.39%、9.2%、80.59%。(4).城区、近郊、远郊层以及整个北京市MSM人群最近一年HIV检测结果为阳性、阴性、检查过但不知道结果、结果不确定、没有检查过的比例分别是3.53%、58.43%、3.53%、11.37%、23.14%;1.78%、88.00%、0.44%、1.78%、8.00%;5.00%、78.33%、5.00%、1.67%、10.00%和3.27%、80.85%、2.62%、2.79%、10.47%。(5).城区、近郊、远郊层以及整个北京市MSM人群最近一年到正规医疗机构进行性病检查结果为有性病、无性病、检查过但不知道结果、结果不确定、没有检查过的比例分别是23.14%、54.51%、3.53%、3.53%、15.29%;12.00%、68.89%、4.89%、4.44%、9.78%;21.67%、60.00%、1.67%、5.00%、11.66%和17.12%、63.72%、3.44%、4.57%、11.55%。(6).城区、近郊、远郊层以及整个北京市MSM人群男男性行为(达到射精高潮时)的方式为肛交、口交、其它性行为方式的比例分别是67.65%、23.53%、8.82%;68.89%、20.55%、10.56%;68.75%、12.5%、18.75%和68.70%、17.64%、13.66%。(7).城区、近郊、远郊层以及整个北京市MSM人群男男性行为中安全套有破损、无破损、没有使用安全套的比例分别是13.72%、67.65%、18.63%;12.12%、69.45%、18.33%;12.5%、66.67%、20.83%和12.5%、68.13%、19.37%。3、采用蒙特卡洛计算机模拟分类敏感问题随机回答模型分层抽样调查,对本文所研究的调查方法及统计公式进行效度和信度评价。计算机模拟30次的调查结果和总体参数进行比较,30次模拟抽样调查中,采用随机应答技术调查的结果和总体参数进行假设检验时,所得P值均大于0.05,差别没有统计学意义,说明本文所研究的分类敏感问题分层抽样调查方法及统计公式具有较高的效度,能够准确地估计总体参数。以本文第二部分实际调查结果与计算机30次模拟抽样调查结果进行假设检验,计算相应的P值,可以看到30次假设检验中,所得P值都大于0.05,差别无统计学意义,可以认为本文所研究的分类敏感问题随机回答模型的分层抽样的调查方法及统计公式具有较高的信度。结论:本文推导出了二分类敏感问题Simmons模型和多分类敏感问题随机回答模型和随机间接回答模型在分层抽样方法下各层敏感问题总体比例及其估计方差的计算公式以及整个总体敏感问题总体比例的估计量及其估计方差的计算公式。蒙特卡洛模拟抽样调查结果表明本文所研究的调查方法及统计公式具有较高的效度和信度,本文研究的调查方法及其统计公式科学、可靠、有效,具有广泛的应用前景。运用本文的调查方法及统计公式对北京市MSM人群进行了调查,调查结果显示MSM人群作为性病艾滋病的高危人群,以肛交为其主要性行为方式,全程使用安全套的比例低,HIV阳性率和性病检出率高,安全套破损比例高,这应该引起卫生部门的重视,应针对该人群开展有针对性的健康教育和艾滋病性病防治措施。
其他文献
目前,很多大城市都在进行地铁建设。盾构机以其能够安全开挖、快速掘进以及对地面沉降影响小的优点,在地铁区间施工中占很大比例,但是在建筑物密集的城市中,盾构隧道的施工也会不
薄基岩浅埋煤层开采时,极易引发突水溃沙灾害,其中水沙两相流体在多孔介质含水层以及破碎采动岩体中的渗流特性是研究的热点和难点问题。本文综合运用室内测试、理论分析、数值
随着新课改的不断发展,数学学习内容的不断泛化,使得很多学生成为了数学学习中的学困生。通过大量的实例证实,大多数学困生之所以为后进生是因为其学习动力的缺乏。这就导致对学
BOTDR传感系统以检测精度高、传感距离长、动态范围宽、可以实现温度和应力的同时检测而成为光纤传感的主流技术。本文对布里渊传感系统中的相关信号处理技术进行了深入研究,
随着光伏发电技术的日益成熟与国家政策的大力扶持,光伏发电的成本日渐降低,对太阳能光伏发电的应用受到普遍的关注。光伏系统输出功率存在高度的间歇性与波动性,这使得并网运行
本文旨在从关联理论的视角研究社会文化因素在言语交际话语理解过程中的作用。交际话语理解的研究上溯到亚里士多德的时代,语言哲学家们沿着两条不同的思路,开辟出了言语交际对
类比迁移在人类的学习中有着不可替代的地位,目前是心理学思维研究领域中的一个重要主题。许多研究者在类比迁移阶段的划分上达成以下共识:类比迁移包括四个阶段,即(1)源问题和靶
良好的体育行为对大学生成功地度过大学体育生活具有重要影响,对于他们终身体育意识的培养和全民健身的推进也具有十分重要的意义。近几年来,虽然国家十分重视学生的体育工作,但
近年来,男性生殖健康越来越受到威胁,男性不育率已由3:7上升到5:5,男性精子生成障碍越来越受到重视。所谓精子生成,就是指从原细胞到精子形成的连续增殖、分化、发育的过程,经历了
随着全球孔子学院的蓬勃发展,2011年9月至2012年7月笔者有幸参加了国家汉办汉语教师志愿者项目,在牙买加西印度群岛大学孔子学院承担汉语教学任务。在教学的初级阶段,除了完成