这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)条款下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品(首次发表在JMIR Medical Informatics上)被适当引用。必须包括完整的书目信息,到http://medinform.www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。
在美国,医疗保健在许多不同的医疗保健系统中是分散的,包括私人、公共和联邦组织,如私人医生团体和学术医疗中心。许多患者的完整医疗数据分散在这几个医疗保健系统中,没有一个特定的系统拥有其中任何一个的完整数据。一些主要的数据分析任务,如使用历史数据的预测建模,在不完整的数据上被认为是不切实际的。
我们的目标是找到一种方法,使这些分析任务的医疗保健系统,其许多患者的数据不完整。
据我们所知,这项研究提出了第一个使用地理限制来确定一个相当大的患者子集的方法,这些患者往往从给定的医疗保健系统中获得大部分护理。可以对这部分患者进行数据比较完整的数据分析任务。我们使用来自华盛顿医学院(UWM)的数据和PreManage涵盖华盛顿州所有医院使用情况的数据来演示我们的方法。我们比较了10个候选约束来优化解决方案。
对于UWM,最好的限制是患者有UWM的初级保健医生,并且居住在距离UWM至少一家医院5英里的范围内。约16.01%(55,707/348,054)的UWM患者满足这一限制。在接下来的6个月里,约69.38%(10,501/15,135)的住院和急诊科就诊发生在联合医院,是联合医院所有患者相应比例的两倍多。
我们的方法可以确定相当大的一部分患者倾向于接受UWM的大部分护理。这使得对以前认为不可行的不完整医疗数据进行几项主要分析任务成为可能。
在美国,医疗保健在许多不同的医疗保健系统中是分散的,包括私人、公共和联邦组织,如私人医生团体和学术医疗中心。通常,一个给定的医疗保健系统中有许多患者的不完整医疗数据,因为这些患者的完整数据记录在多个医疗保健系统中[
据我们所知,这项研究提出了第一个使用地理限制来确定一个相当大的患者子集的方法,这些患者往往从一个特定的医疗保健系统获得大部分护理。这是为了使这些数据分析任务对不完整的医疗数据。尽管卫生保健系统对许多患者的数据不完整,但对这部分患者的数据更完整。对于一个需要相对完整的医疗数据的数据分析任务,我们可以针对这一部分患者进行任务,但要理解分析结果只适用于这一部分患者,而不是医疗保健系统的所有患者。与目前根本不进行这项任务的做法相比,这可能是一种改进,因为对所有患者进行这项任务是不切实际的。我们以前的工作[
患者队列包括2016年4月1日至2017年3月31日期间在UWM设施(医院和诊所)遇到存储在UWM企业数据仓库中的信息的所有成年患者(年龄≥18岁)。在本文中,相遇可以是任何类型,除非它被明确指定为医院相遇或门诊访问。UWM是华盛顿州最大的学术医疗保健系统,拥有成人医院和诊所。
我们使用的是UWM企业数据仓库中的管理数据,时间为2015年4月1日至2017年3月31日。该数据集包括我们患者队列的就诊和初级保健医生(PCP)信息。我们还使用了UWM在2017年4月1日至2017年9月30日这6个月期间所有患者的PreManage数据。PreManage是Collective Medical Technologies Inc .的商业产品,提供许多美国医院的就诊和诊断数据(住院和急诊室就诊)[
我们的目标是使用约束来确定一个相当大的患者子集,这些患者倾向于接受UWM的大部分护理。我们考虑了3家UWM医院,它们的管理和临床数据存储在UWM的企业数据仓库中:Harborview医学中心、华盛顿大学医学中心和西北医院。这三家医院都在华盛顿州的西雅图。我们考虑了以下候选约束,它们都包含了生活在其中的成分
只有距离:病人住在里面
PCP:患者有UWM PCP,并生活在其中
过去一年≥2次就诊:患者过去一年(2016年4月1日至2017年3月31日)在UWM机构就诊≥2次,并住在UWM机构内
过去2年≥2次就诊:患者在过去2年(2015年4月1日至2017年3月31日)在UWM设施≥2次就诊,并住在UWM设施内
近一年内就诊≥1次:患者近一年内在3所UWM医院中的1所就诊≥1次,且居住在该医院内
过去一年≥2次医院就诊:患者在过去一年中在UWM的3家医院中≥2次就诊,并居住在其中
过去2年内≥2次医院就诊:患者在过去2年内在3所UWM医院中≥2次医院就诊,并居住在其中
近一年内门诊≥1次:患者近一年内在医院就诊≥1次,居住在医院内
近一年内门诊次数≥2次:患者近一年内就诊次数≥2次,居住在
2年内门诊次数≥2次:患者2年内就诊次数≥2次,居住在UWM
在每个候选约束中,距离不再是一个因素
使用R的geosphere package version 1.5-5中的distvincentyellipsolid函数[
我们比较了10个候选约束条件的表现,以确定可能从UWM获得大部分护理的患者。我们使用UWM企业数据仓库中的管理数据来检查患者是否满足特定的约束。对于每个候选约束,我们计算满足它的UWM患者的百分比。对于所有满足约束条件的患者,我们使用PreManage数据来计算他们在接下来的6个月内(2017年4月1日至2017年9月30日)在UWM内发生的医院就诊的百分比。由于在医院就诊通常比在其他地方就诊要昂贵得多,因此这一百分比反映了这些患者在医院获得的护理中所占的比例。在计算这个百分比时,每个满足约束条件的患者都被包括在内,无论患者在接下来的6个月内是否有≥1次医院就诊。在选择要使用的最终约束时,我们在以下两个标准之间取得了平衡:
正如讨论部分所提到的,所选择的约束具有特殊的性质,这增加了我们的信心,即通过约束确定的患者也倾向于在UWM内进行大部分门诊就诊。
为了展示基于约束的方法如何适用于各个UWM医院,对于满足所选约束的所有患者和3家UWM医院中的每一家,我们使用PreManage数据来计算这些患者在接下来的6个月内在UWM医院发生的医院就诊的百分比。
UWM的机构审查委员会审查并批准了这项研究,并放弃了所有患者知情同意的需要。
对于10个候选约束条件中的每一个以及所有满足它的患者,
2016年4月1日至2017年3月31日期间,在华盛顿大学医学院(UWM)设施就诊的成年患者的人口统计学特征与UWM企业数据仓库中存储的信息(N=348,054)。
人口特征 | n (%) | ||
|
|||
|
18至<30 | 64311 (18.48) | |
|
30至65岁以下 | 209033 (60.06) | |
|
≥65 | 74710 (21.47) | |
|
|||
|
男性 | 154511 (44.39) | |
|
女 | 193506 (55.60) | |
|
未知或未报道 | 37 (0.01) | |
|
|||
|
美洲印第安人或阿拉斯加原住民 | 5107 (1.47) | |
|
亚洲 | 33595 (9.65) | |
|
黑人或非裔美国人 | 25224 (7.25) | |
|
多个种族 | 2772 (0.80) | |
|
夏威夷原住民或其他太平洋岛民 | 2500 (0.72) | |
|
白色 | 232354 (66.76) | |
|
未知或未报道 | 46502 (13.36) | |
|
|||
|
拉美裔 | 21436 (6.16) | |
|
非西班牙裔 | 270043 (77.59) | |
|
未知或未报道 | 56575 (16.25) | |
|
|||
|
私人 | 167640 (48.16) | |
|
公共 | 154008 (44.25) | |
|
自费或慈善 | 26406 (7.59) |
华盛顿大学医学院(UWM)患者满足10个候选约束条件的百分比。初级保健医生。
当r≤10时,华盛顿大学医学院(UWM)患者满足10个候选约束条件的百分比。初级保健医生。
在接下来的6个月里,华盛顿大学医学院(UWM)的10个候选约束条件和所有满足约束条件的患者在医院就诊的百分比。初级保健医生。
当r≤10时,华盛顿大学医学院(UWM)在接下来的6个月内对10个候选约束条件中的每一个以及满足该约束条件的所有患者进行医院就诊的百分比。初级保健医生。
在选择要使用的最终约束时,我们在方法部分末尾列出的标准1和标准2之间取得了平衡。的
对于3家UWM医院中的每一家和所有满足
华盛顿大学医学院(UWM)患者满足PCP限制的百分比,以及这些患者在接下来的6个月内在UWM内发生的医院就诊的百分比。初级保健医生。
对于华盛顿大学医学院(UWM)的3家医院和所有满足PCP约束的患者,他们在接下来的6个月内在UWM医院就诊的百分比。初级保健医生。
通过在标准1和标准2之间取得平衡,我们选择了
我们的研究结果表明,对于居住在3家UWM医院中至少一家医院5英里范围内的患者,UWM为他们提供了大部分护理,并拥有相当完整的医疗数据。对于需要相对完整数据的数据分析任务,例如使用历史数据进行预测建模,我们可以对这一部分患者进行任务并获得有用的结果,即使对所有UWM患者进行任务是不切实际的。例如,我们可以建立一个预测模型来识别这一子集中未来的高成本患者[
我们的研究结果表明,住在离三所UWM医院较远的患者往往从UWM获得较少的护理。这表明UWM考虑对居住在距离UWM医院不同距离的患者采用不同的预防干预措施,例如,进行护理管理,以取得更好的效果。对于那些只从联合医院接受一小部分治疗的病人,联合医院很难以具有成本效益的方式使用昂贵的预防性干预措施。
本研究使用的PreManage数据涵盖了所有年龄组的成年患者。不能使用主要覆盖65岁以上患者和某些残疾和疾病患者的医疗保险索赔数据。与许多其他医疗保健系统类似,UWM没有完整的索赔数据,涵盖所有患者在UWM内外的医疗保健使用。我们可以使用索赔数据对另一个医疗保健系统进行类似的研究,如果它有完整的索赔数据,涵盖了该系统内外所有患者的医疗保健使用。
本研究使用PreManage数据验证
这篇论文的重点是确定患者可能接受大部分的照顾,从一个特定的卫生保健系统。如果多个医疗保健系统交换数据,我们可以使用类似的方法来识别可能从这些医疗保健系统中获得大部分护理的患者。这可以在这些医疗保健系统中实现多个数据分析任务。
这项研究有几个局限性,可以作为未来工作的有趣领域:
到目前为止,UWM仅在有限的时间内积累了PreManage数据。在UWM积累了更多的PreManage数据后,我们应该重新进行分析,检查未来2到3年内在UWM内发生的患者医院遭遇的百分比,看看我们的结论是否会发生变化。
本研究在单一医疗保健系统UWM中展示了我们基于约束的患者识别方法,UWM主要为城市地区提供住院和门诊服务。为了理解我们的方法是如何推广的,我们应该在其他几个医疗保健系统上重复我们的分析,一些主要服务于城市地区,另一些在农村地区提供许多服务,看看最优约束是否会改变。对于在农村地区提供多种服务的医疗保健系统,我们期望的最佳价值是
对于许多患者的医疗数据不完整的医疗保健系统,我们可以使用我们的方法来识别医疗保健系统拥有更完整数据的患者子集,并估计该子集患者的数据不完整程度。对于数据分析任务来说,使用不完整的数据对这一部分患者进行分析可能会产生偏倚结果,但在偏倚程度可以接受的情况下,这仍然比没有结果要好。然而,数据不完整程度与分析结果偏差程度之间的确切关系尚不清楚。特别是,我们不知道数据不完整水平的阈值,超过该阈值,分析结论可能无效。为了解决这个问题,我们可以从另一个医疗保健系统(如Kaiser Permanente)获取一个相当完整的数据集,删除数据集的不同部分,并检查结果对分析结果的影响。这将帮助我们了解我们的方法是否足以在当前的医疗保健系统中实现数据分析任务。
据我们所知,对于许多患者的医疗数据不完整的医疗保健系统,我们提供了第一种方法,使用地理限制来确定一个相当大的患者子集,这些患者倾向于从系统中接受大部分护理。结果表明,该方法在UWM下具有较好的性能。我们的方法为对不完整的医疗数据进行几个主要的分析任务打开了大门,这些任务以前被认为是不切实际的。
初级保健医生
华盛顿大学医学院
作者感谢刘欣然、Richard Crouch、Lisa Swan、Kristal Mauritz-Miller、Christie Benevich、Philip J Brewster、Ross Lordon、Lucy Wang和Mika N Sinanan的有益讨论。GL得到了美国国立卫生研究院国家心脏、肺和血液研究所的部分支持,资助号为R01HL142503。资助者在研究设计、数据收集和分析、发表决定或手稿准备方面没有任何作用。
论文主要由GL负责。他构思和设计研究,进行文献回顾和数据分析,并撰写论文。ESL、PTH和ABW对各种医学问题提供了反馈意见,对报告的概念化做出了贡献,并修改了论文。ESL也为研究的概念化做出了贡献。所有作者都同意提交的最终稿件,并同意对工作的各个方面负责。
没有宣布。