这是一篇根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布的开放获取文章,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR公共卫生和监测上的原创作品。必须包括完整的书目信息,https://publichealth.www.mybigtv.com上的原始出版物的链接,以及此版权和许可信息。
监测数据是指导政策和人力和资本资源分配的重要公共卫生资源。这些数据通常由基于非随机样本设计的大量信息组成。与真实总体相比,基于此类数据的总体估计可能会受到潜在样本分布的影响。在这项研究中,我们模拟了一个感兴趣的人群,并允许响应率以非随机的方式变化,以说明和衡量这对重要公共卫生政策结果的基于人群的估计的影响。
本研究的目的是说明非随机缺失对基于人口的调查样本估计的影响。
我们模拟了一组受访者,他们回答了一个关于他们对社区政府人员接种疫苗政策的满意度的调查问题。我们允许总体满意和不满意的应答率不同,并考虑共同努力控制潜在偏差的影响,如抽样权重、样本量膨胀和随机确定缺失的假设检验。我们通过均方误差和抽样可变性来比较这些条件,以描述在这些不同方法下产生的估计偏差。
样本估计呈现明确和可量化的偏差,即使在最有利的响应剖面。在李克特(Likert) 5分制量表上,非随机缺失导致的误差平均与事实相差近1分。通过样本量膨胀和抽样权重来减轻偏差的努力对总体结果的影响可以忽略不计。此外,假设检验偏离随机缺失很少发现非随机缺失在最广泛的响应剖面考虑。
我们的结果表明,假设监测数据在分析过程中随机缺失,可以提供与我们在整个人群中可能看到的结果有很大不同的估计。基于这种可能存在偏见的估计所作出的政策决定,在社区脱离参与和健康差异方面可能是毁灭性的。为了确定边缘群体,有必要采用其他分析方法,以摆脱对风险人群的错误测量的广泛概括,这些群体的总体反应可能与在测量的受访者中观察到的反应有很大不同。
2019年新冠肺炎疫情给全球卫生带来诸多挑战。其中许多挑战很容易观察和衡量。在这期间的几个月里,出版了无数关于社交距离和疫苗接种措施及其对感染传播的影响的出版物。即使是现在,流行病学论文也提供了疾病在高危人群和易感人群中的不同影响的最新信息,易感人群的风险可能没有那么高。这些分析大多是快速进行的,利用现有但不完整的数据进行快速评估。一个尚未详细探讨的挑战是,在我们试图衡量与COVID-19各个方面相关的知识、态度和行为时,如果不进行适当调整,对不完整数据的分析可能会产生有偏见的结果,从而导致有害影响。
公共卫生监测数据可用于无创监测社区卫生[
公共卫生监测可用于在微观层面解决一系列流行病学问题,深入到社区集群,以确定疾病集中的人员、地点和时间。当分析师试图将分析扩展到宏观层面时,当使用非随机的个人样本试图对数据不能也不能准确代表的总体进行推断时,问题就出现了[
许多处理缺失数据的统计方法要求数据随机缺失(MAR)。调查人员转而采用科恩和科恩[
对监测感兴趣的调查人员所青睐的另一种方法包括通过增加观察结果、扩大合格标准或在现有的大规模问卷上增加其他问题来扩大样本量[例如,8,11]。就公共使用的数据集和监测系统而言,通常有大量的观测数据可供分析。非常大的样本量被认为是丰富的数据源,并提供了“找到一些东西”的绝佳机会。非概率样本的设计是为了使应答者的数量最大化,这可能会为分析人员提供大量的数据,但非随机缺失的影响可能会限制从此类研究中得出的推论的价值。尽管文献中存在大量“垃圾邮件列表”样本和不完善的人口普查的例子,但我们更倾向于关注这种方法的统计影响,而不是在本文中呼吁我们的同事和同行使用这种方法[例如,9,11]。
公共卫生监测的应用往往集中在手头的数据,而不是在存在非随机缺失的情况下分析性能的一般原则。在下面的部分中,我们使用模拟来探索和说明非随机缺失对单个调查项目的影响。当缺失的随机性从半完全到完全不完全变化时,我们的方法允许我们调查和量化平均值估计中的误差。我们还提供了一个例子,说明当数据不是mar时,增加样本量如何影响估计器。最后,我们提出了Cohen和Cohen方法的结果[
我们的方法的更详细的描述可以在
我们通过每个应答者的统一随机值来诱导数据中的缺失。在我们的模拟中,我们比较了数据完全随机缺失(MCAR)和非随机缺失(NMAR)数据的影响,其中缺失不是随机的。我们将机制定义为数据缺失的原因,根据Little和Rubin的研究[
我们的模拟复制了总体的1000个随机样本,并在样本中分配观察值。抽样权重[
我们用均方误差(MSE)量化缺失和加权的影响[
我们提出了以下三种人群条件的总结结果:
跨类别的统一响应(即无响应比有响应更有可能)。
总体上满意的应答者(即两个满意的应答者比不满意的应答者更有可能)。
一般来说,人群中不满意的受访者(即,两个不满意的回答比满意的回答更有可能)。
在这些条件下,我们为一般满意的受访者提供了恒定的90%的回复率(回答三个或以上的问题),并允许不满意的受访者在10%到90%之间变化,以探索非随机缺失的影响。我们还比较了两种样本量(800和8000)的结果,以了解这如何影响估计器的行为。选取了800个样本,误差范围约为3.5%,用于估计那些对社区政府雇员和公务员接种疫苗规定满意的人的百分比。8000的样本量是在没有具体统计依据的情况下任意选取的10倍的通货膨胀率。仿真是用SAS 9.4 (Cary, NC)编写的。指
在这个模拟实验中没有人类受试者,因此不需要机构审查委员会的批准。
我们使用统一的反应模式来描述一个对政府对疫苗授权的努力没有特别强烈意见的社区。我们的回复率是使用一个假设的惯例来分配的,即通常支持公共卫生实践的人将倾向于对调查做出回应并分享他们的积极意见,而对当前状况不满意的人将会(在一定程度上)减少与陌生人谈论他们的担忧。我们将满意的社区成员的回应率保持在90%,表明他们愿意参与调查。我们考虑不满意组的反应率逐渐变差的情况,以5点李克特量表的点来衡量这种差异反应对抽样可变性、MSE和偏差的影响。我们还在计算加权平均值后报告结果,以试图调整来自该社区的样本的无响应。
第一行
有趣的是,当我们扩大样本量(
均方误差(MSE),抽样方差,和偏差的样本量和响应模式。
1000个样本中的数量,其中Cohen和Cohen的方法[
不满意不回应率 | 制服,n | 一般满足,n | 一般不满意,n | ||||||||
|
比赛 | 性 | 这两个 | 比赛 | 性 | 这两个 | 比赛 | 性 | 这两个 | ||
10% | 50 | 43 | 3. | 41 | 54 | 0 | 49 | 55 | 3. | ||
20% | 46 | 52 | 4 | 52 | 53 | 5 | 59 | 49 | 2 | ||
30% | 62 | 46 | 3. | 55 | 55 | 4 | 52 | 57 | 4 | ||
40% | 45 | 48 | 3. | 54 | 69 | 3. | 57 | 61 | 6 | ||
50% | 42 | 48 | 0 | 52 | 41 | 3. | 37 | 47 | 1 | ||
60% | 51 | 37 | 1 | 43 | 40 | 1 | 46 | 59 | 1 | ||
70% | 55 | 42 | 5 | 46 | 59 | 2 | 56 | 52 | 3. | ||
80% | 53 | 47 | 1 | 50 | 63 | 4 | 51 | 61 | 2 | ||
90% | 49 | 38 | 3. | 70 | 53 | 2 | 57 | 57 | 3. |
1000个样本中的数量,其中Cohen和Cohen的方法[
不满意不回应率 | 制服,n | 一般满足,n | 一般不满意,n | ||||||||
|
比赛 | 性 | 这两个 | 比赛 | 性 | 这两个 | 比赛 | 性 | 这两个 | ||
10% | 34 | 38 | 1 | 43 | 44 | 1 | 43 | 52 | 2 | ||
20% | 36 | 50 | 2 | 34 | 37 | 3. | 32 | 39 | 1 | ||
30% | 35 | 43 | 2 | 39 | 37 | 3. | 36 | 43 | 2 | ||
40% | 42 | 40 | 1 | 46 | 43 | 2 | 37 | 52 | 6 | ||
50% | 34 | 49 | 0 | 45 | 58 | 3. | 42 | 51 | 1 | ||
60% | 46 | 43 | 4 | 40 | 57 | 3. | 50 | 37 | 1 | ||
70% | 38 | 50 | 2 | 53 | 44 | 5 | 48 | 36 | 0 | ||
80% | 42 | 29 | 1 | 51 | 43 | 2 | 49 | 50 | 2 | ||
90% | 29 | 31 | 2 | 60 | 60 | 3. | 46 | 51 | 1 |
当模拟的应答者总体满意时,我们观察到数据中的总体缺失较少,即使不满意应答者的不回应率增加。第二行
第三行
我们的模拟表明,即使在分析一个相当简单的调查样本时,非随机缺失数据也会对基于人口的估计产生影响。我们的例子表明,随机缺失的基本诊断测试或抽样权重的使用不能自动控制这种偏差,也不是提高估计质量的简单保证或解决办法。
关于遗漏的统计讨论往往侧重于减少调查实施中的不回应[
在监测数据中,特别是在公共卫生危机中,需要迅速收集数据,现有调查往往被重新用于其他数据收集,或者分析人员包括设计未知(如果有的话)的方便数据。在这种改变用途的使用中(例如,通过将COVID-19问题添加到正在进行的调查中),我们很可能会出现新的(未知的)遗漏模式。仅根据设计进行调整(通过基于设计的权重,基于设计的选择概率,但不一定是响应概率)可以使估计适应预期的设计;然而,如上所述,新的失踪原因的重要影响将被忽视。具体来说,我们研究中的例子说明了抽样权重(根据“选择”的概率进行调整)和缺失模式(改变“响应”的概率)之间的不协调是如何导致偏差的。如果缺失发生在低权重的亚群体中(如我们普遍满意的总体例子),这种影响可以减轻,但如果缺失发生在接受高抽样权重的亚群体中(如我们普遍不满意的总体例子),这种影响可能会被夸大。除非我们同时知道选择的概率和响应的概率,否则我们无法看到全貌,也无法用传统的重加权方法适当地调整估计。
正如我们简单的例子所示,设计权重的应用不应被视为解决为监测目的而扩展调查设计的挑战的灵丹妙药。仔细看看
一个更大的问题来自于使用监控数据对一个社区做出全球性声明的意图。外推在建模中经常被提及,但很少转化为从非随机样本推断更大总体参数的估计量。我们的模拟器显示,随着人口亚组中的反应率越来越差,样本在代表更大社区方面的有效性会下降,在许多情况下会急剧下降。使用来自观测概率未知的样本的数据,特别是数据可能不是MAR的调查数据,是外推的一个明显例子。最终,未能充分代表边缘人群可能导致政治和社会动荡。基于此类数据的政策决定可能会造成或扩大已经不利于社会正义和卫生公平成果的差距。
我们在研究中展示的模拟表明,当扩展到超出其设计范围时,来自调查样本的估计有可能存在严重偏差,特别是在由于响应概率不平衡而存在差异缺失的情况下。虽然这种偏差的可能性在理论上是已知的,但我们的模拟提供了一个基本但实际的说明,说明了这个问题的潜在严重性。我们注意到,这些模拟代表了问题的简化(但可能并不罕见)说明;偏差的方向和幅度可能会随着缺失与调查的关系变化而发生很大变化。我们认为,在监测环境中,数据缺失的调查很少(如果有的话)在某种程度上是随机的,建议在不考虑潜在的差异缺失的情况下,仅根据抽样计划应用调查权重时要非常谨慎。特别是,我们建议在分析和解释的同时,对潜在偏差进行深思熟虑的总结,特别是那些从多个可用数据源中提取的数据。我们建议,与其使用调查数据向上看社区,不如鼓励分析师考虑向下看观察到的人口。
尽管假设数据是MAR在分析上是有意义的,但这个决定可能会带来相当大的成本。如果我们在错误中随机假设缺失,我们就会得出与事实相去甚远的结论,并可能导致毁灭性的社会后果。如果我们假设这种缺失不是随机的错误,我们就会得出更谨慎的结论,并为更好地识别和理解我们感兴趣的人群中可能得不到充分服务的部分开辟途径。在非随机缺失方面的错误会导致对所有可用信息进行更具社会责任感的分析。
本研究的一个局限性是我们采用了简单的随机抽样来模拟调查经验,其中大多数监测数据集是多阶段聚类设计。我们注意到,更复杂的设计通常可能导致抽样可变性的膨胀,但不会减少差分响应中固有的均方误差或偏差。在我们的例子中,我们也只考虑了三种反应模式,并根据我们自己对更强的满意和不满意倾向的描述任意分配了总体反应。我们的模拟器可供读者使用(参见
监测是公共卫生实践的一个重要组成部分。监测数据使我们能够制定有用的描述性措施,以确定疾病在高危人群中的传播特征。当前的大流行产生了大量数据,其中大部分来自非随机样本或来自调查,其中数据缺失模式可能使原始抽样计划变得模糊,以至于仅靠传统的抽样权重无法对估计值进行适当调整。我们的例子表明,有机会开发新的方法,摆脱经典的设计方法,转向探索数据收集和调整数据完整性模式的方法,让我们更有效地利用信息,为整个人口做出更好的公共卫生决策。
方法的完整描述。
SAS仿真宏。
均方误差
随机失踪
完全随机失踪
不是随机丢失
没有宣布。