卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

JMI

JMIR Med Inform

JMIR医学信息学

2291 - 9694

卡塔尔世界杯8强波胆分析

加拿大多伦多

v6i4e12241

30401670

10.2196/12241

原始论文

识别可能从特定医疗保健系统获得大部分护理的患者:通过二次分析的演示

Eysenbach

冈瑟

表

林肯

罗

帮派

博士学位 1

生物医学信息与医学教育系华盛顿大学

华盛顿大学南湖联合医学院

共和街850号C栋

358047箱

西雅图，华盛顿州，98195

美国 1 206 221 4596 1 206 221 2671 gangluo@cs.wisc.edu

http://orcid.org/0000-0001-7217-4008

Tarczy-Hornoch

彼得

医学博士 1 2 3.

http://orcid.org/0000-0003-1047-179X

威尔科克斯

亚当B

博士学位 1

http://orcid.org/0000-0002-6305-735X

李

E莎莉

博士学位 4

http://orcid.org/0000-0002-6268-2110

1 生物医学信息与医学教育系华盛顿大学

西雅图,华盛顿州

美国 2 新生儿科儿科华盛顿大学

西雅图,华盛顿州

美国 3. 计算机科学与工程系华盛顿大学

西雅图,华盛顿州

美国 4 人口健康分析华盛顿大学医学金融华盛顿大学

西雅图,华盛顿州

美国

通讯作者:罗刚 gangluo@cs.wisc.edu

Oct-Dec 2018

05 11 2018

6 4

e12241

17 9 2018 8 10 2018 13 10 2018 16 10 2018

©罗刚，Peter Tarczy-Hornoch, Adam B Wilcox, E Sally Lee。最初发表于JMIR医学信息学(http://medinform.www.mybigtv.com)， 2018年11月5日。

2018

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)条款下发布的开放获取文章，该许可允许在任何媒介上不受限制地使用、分发和复制，前提是原始作品(首次发表在JMIR Medical Informatics上)被适当引用。必须包括完整的书目信息，到http://medinform.www.mybigtv.com/上原始出版物的链接，以及版权和许可信息。

背景

在美国，医疗保健在许多不同的医疗保健系统中是分散的，包括私人、公共和联邦组织，如私人医生团体和学术医疗中心。许多患者的完整医疗数据分散在这几个医疗保健系统中，没有一个特定的系统拥有其中任何一个的完整数据。一些主要的数据分析任务，如使用历史数据的预测建模，在不完整的数据上被认为是不切实际的。

客观的

我们的目标是找到一种方法，使这些分析任务的医疗保健系统，其许多患者的数据不完整。

方法

据我们所知，这项研究提出了第一个使用地理限制来确定一个相当大的患者子集的方法，这些患者往往从给定的医疗保健系统中获得大部分护理。可以对这部分患者进行数据比较完整的数据分析任务。我们使用来自华盛顿医学院(UWM)的数据和PreManage涵盖华盛顿州所有医院使用情况的数据来演示我们的方法。我们比较了10个候选约束来优化解决方案。

结果

对于UWM，最好的限制是患者有UWM的初级保健医生，并且居住在距离UWM至少一家医院5英里的范围内。约16.01%(55,707/348,054)的UWM患者满足这一限制。在接下来的6个月里，约69.38%(10,501/15,135)的住院和急诊科就诊发生在联合医院，是联合医院所有患者相应比例的两倍多。

结论

我们的方法可以确定相当大的一部分患者倾向于接受UWM的大部分护理。这使得对以前认为不可行的不完整医疗数据进行几项主要分析任务成为可能。

数据分析住院病人应急部门卫生保健系统

介绍

在美国，医疗保健在许多不同的医疗保健系统中是分散的，包括私人、公共和联邦组织，如私人医生团体和学术医疗中心。通常，一个给定的医疗保健系统中有许多患者的不完整医疗数据，因为这些患者的完整数据记录在多个医疗保健系统中[ 1， 2]。Finnell等[ 2[]表明，在印第安纳州的3年期间，40.7%的急诊科就诊患者也曾在其他医疗保健系统急诊科就诊。Bourgeois等[ 1的研究表明，在马萨诸塞州的5年期间，56.5%的成人医院就诊(住院和急诊室就诊)来自于在其他医院也有过就诊经历的患者。数据不完整在学术卫生保健系统中尤其成问题，例如华盛顿大学医学院(UWM)，那里的许多患者是从其他卫生保健系统转诊过来的。如结果部分所示，在所有UWM患者中，不到三分之一的医院就诊发生在UWM内。目前，一些主要的数据分析任务，如使用历史数据的预测建模，在不完整的数据上是不切实际的。这限制了基于这些分析任务的应用程序。例如，预测建模被广泛用于识别未来的高成本患者[ 3.]护理管理[ 4]以防止高昂的费用和健康状况恶化[ 5- 7]。预测病人费用的典型模型假设有完整的历史数据[ 8- 10并且不被病人数据不完整的卫生保健系统使用。因此，许多未来的高成本患者没有被识别和登记在护理管理中，导致了不希望的结果。

据我们所知，这项研究提出了第一个使用地理限制来确定一个相当大的患者子集的方法，这些患者往往从一个特定的医疗保健系统获得大部分护理。这是为了使这些数据分析任务对不完整的医疗数据。尽管卫生保健系统对许多患者的数据不完整，但对这部分患者的数据更完整。对于一个需要相对完整的医疗数据的数据分析任务，我们可以针对这一部分患者进行任务，但要理解分析结果只适用于这一部分患者，而不是医疗保健系统的所有患者。与目前根本不进行这项任务的做法相比，这可能是一种改进，因为对所有患者进行这项任务是不切实际的。我们以前的工作[ 11]概述了该方法的主要目标，但没有完成该方法，没有进行计算机编码实现，也没有评估该方法的性能。本研究旨在填补这些空白，并利用UWM的数据证明我们的方法。

方法患者人群

患者队列包括2016年4月1日至2017年3月31日期间在UWM设施(医院和诊所)遇到存储在UWM企业数据仓库中的信息的所有成年患者(年龄≥18岁)。在本文中，相遇可以是任何类型，除非它被明确指定为医院相遇或门诊访问。UWM是华盛顿州最大的学术医疗保健系统，拥有成人医院和诊所。

数据集

我们使用的是UWM企业数据仓库中的管理数据，时间为2015年4月1日至2017年3月31日。该数据集包括我们患者队列的就诊和初级保健医生(PCP)信息。我们还使用了UWM在2017年4月1日至2017年9月30日这6个月期间所有患者的PreManage数据。PreManage是Collective Medical Technologies Inc .的商业产品，提供许多美国医院的就诊和诊断数据(住院和急诊室就诊)[ 12]。PreManage的数据覆盖了华盛顿州的所有医院。从2017年4月1日开始，UWM已经收到了相对完整的患者PreManage数据。在本文中，我们选择2017年4月1日作为分隔前期和后期的指标日期进行分析任务。

我们基于约束的患者识别方法

我们的目标是使用约束来确定一个相当大的患者子集，这些患者倾向于接受UWM的大部分护理。我们考虑了3家UWM医院，它们的管理和临床数据存储在UWM的企业数据仓库中:Harborview医学中心、华盛顿大学医学中心和西北医院。这三家医院都在华盛顿州的西雅图。我们考虑了以下候选约束，它们都包含了生活在其中的成分 r三所联合医院中至少一所的距离 r作为研究中待确定最优值的参数:

只有距离:病人住在里面 r三家联合医院中至少一家的距离直观地说，在其他条件相同的情况下，患者住得离UWM医院越近，患者接受UWM治疗的比例就越大。此外，越小的 r则满足约束条件的UWM患者数量越少。

PCP:患者有UWM PCP，并生活在其中 r三家联合医院中至少一家的距离UWM pcp倾向于在UWM内部进行转诊。因此，直观地说，与其他患者相比，患有UWM PCP的患者可能从UWM获得更多的护理。

过去一年≥2次就诊:患者过去一年(2016年4月1日至2017年3月31日)在UWM机构就诊≥2次，并住在UWM机构内 r三家联合医院中至少一家的距离直观地说，以前在UWM设施接触较多的患者将来可能会从UWM获得更大比例的护理。

过去2年≥2次就诊:患者在过去2年(2015年4月1日至2017年3月31日)在UWM设施≥2次就诊，并住在UWM设施内 r三家联合医院中至少一家的距离

近一年内就诊≥1次:患者近一年内在3所UWM医院中的1所就诊≥1次，且居住在该医院内 r三家联合医院中至少一家的距离

过去一年≥2次医院就诊:患者在过去一年中在UWM的3家医院中≥2次就诊，并居住在其中 r三家联合医院中至少一家的距离

过去2年内≥2次医院就诊:患者在过去2年内在3所UWM医院中≥2次医院就诊，并居住在其中 r三家联合医院中至少一家的距离

近一年内门诊≥1次:患者近一年内在医院就诊≥1次，居住在医院内 r三家联合医院中至少一家的距离

近一年内门诊次数≥2次:患者近一年内就诊次数≥2次，居住在 r三家联合医院中至少一家的距离

2年内门诊次数≥2次:患者2年内就诊次数≥2次，居住在UWM r三家联合医院中至少一家的距离

在每个候选约束中，距离不再是一个因素 r= +∞。

数据分析

使用R的geosphere package version 1.5-5中的distvincentyellipsolid函数[ 13]，我们根据患者的5位数家庭住址邮政编码和医院地址的经纬度坐标计算了患者家和UWM医院之间的椭球大圆距离。这个距离作为患者家到医院之间的旅行距离的粗略代表，易于计算，并且足以用于我们的患者识别目的，如结果部分所示。对于其他想要采用我们基于约束的患者识别方法进行研究的研究人员来说，使用邮政编码而不是确切的患者家庭住址可以促进数据获取，因为有限的数据集比已识别的数据集更容易获得。

我们比较了10个候选约束条件的表现，以确定可能从UWM获得大部分护理的患者。我们使用UWM企业数据仓库中的管理数据来检查患者是否满足特定的约束。对于每个候选约束，我们计算满足它的UWM患者的百分比。对于所有满足约束条件的患者，我们使用PreManage数据来计算他们在接下来的6个月内(2017年4月1日至2017年9月30日)在UWM内发生的医院就诊的百分比。由于在医院就诊通常比在其他地方就诊要昂贵得多，因此这一百分比反映了这些患者在医院获得的护理中所占的比例。在计算这个百分比时，每个满足约束条件的患者都被包括在内，无论患者在接下来的6个月内是否有≥1次医院就诊。在选择要使用的最终约束时，我们在以下两个标准之间取得了平衡:

标准1:满足约束条件的UWM患者百分比应尽可能大。由于将对这些患者进行多个数据分析任务，这将使基于这些任务的应用程序的有用性最大化。

标准2:对于满足约束条件的患者，其在UWM内发生的医院遭遇的百分比应尽可能大。这是为了最大限度地提高UWM对这些患者的医疗数据的完整性。对于将对这些患者进行的数据分析任务，这个程度会影响分析结果的偏倚。

正如讨论部分所提到的，所选择的约束具有特殊的性质，这增加了我们的信心，即通过约束确定的患者也倾向于在UWM内进行大部分门诊就诊。

为了展示基于约束的方法如何适用于各个UWM医院，对于满足所选约束的所有患者和3家UWM医院中的每一家，我们使用PreManage数据来计算这些患者在接下来的6个月内在UWM医院发生的医院就诊的百分比。

伦理批准

UWM的机构审查委员会审查并批准了这项研究，并放弃了所有患者知情同意的需要。

结果

表1显示了我们患者队列的人口统计学特征。

图1和 2显示满足10个候选约束条件的UWM患者的百分比。百分比随着 r，一开始很快 r是小而又慢的不如 r变得更大。回想一下, r是患者家到最近的UWM医院之间允许的最大距离，以英里为单位。由于UWM主要服务于西雅图大都会地区，88.92%(309,483/348,054)的UWM患者居住在UWM 3家医院中至少一家的60英里范围内。约44.76%(138,530/309,483)的患者居住在5英里范围内。

对于10个候选约束条件中的每一个以及所有满足它的患者，图3和 4显示他们在接下来的6个月里在联合医院就诊的百分比。只有少数例外 r是小的，如 r增加时，百分比减少时，最初很快 r是小而又慢的不如 r变得更大。这与我们的直觉一致，即在其他条件相同的情况下，住在离UWM医院较远的患者不太可能使用它们。不管有多小 r然而，这一比例从未接近100%，部分原因是UWM患者也可以使用距离某些UWM医院不到1英里的几家非UWM医院。由于我们希望这个百分比尽可能大，我们应该选择 r≤5或≤10，取决于约束条件。

表1

2016年4月1日至2017年3月31日期间，在华盛顿大学医学院(UWM)设施就诊的成年患者的人口统计学特征与UWM企业数据仓库中存储的信息(N=348,054)。

人口特征			n (%)
年龄(以年计)
	18至<30	64311 (18.48)
	30至65岁以下	209033 (60.06)
	≥65	74710 (21.47)
性别
	男性	154511 (44.39)
	女	193506 (55.60)
	未知或未报道	37 (0.01)
比赛
	美洲印第安人或阿拉斯加原住民	5107 (1.47)
	亚洲	33595 (9.65)
	黑人或非裔美国人	25224 (7.25)
	多个种族	2772 (0.80)
	夏威夷原住民或其他太平洋岛民	2500 (0.72)
	白色	232354 (66.76)
	未知或未报道	46502 (13.36)
种族
	拉美裔	21436 (6.16)
	非西班牙裔	270043 (77.59)
	未知或未报道	56575 (16.25)
保险
	私人	167640 (48.16)
	公共	154008 (44.25)
	自费或慈善	26406 (7.59)

图1

华盛顿大学医学院(UWM)患者满足10个候选约束条件的百分比。初级保健医生。

图2

当r≤10时，华盛顿大学医学院(UWM)患者满足10个候选约束条件的百分比。初级保健医生。

图3

在接下来的6个月里，华盛顿大学医学院(UWM)的10个候选约束条件和所有满足约束条件的患者在医院就诊的百分比。初级保健医生。

图4

当r≤10时，华盛顿大学医学院(UWM)在接下来的6个月内对10个候选约束条件中的每一个以及满足该约束条件的所有患者进行医院就诊的百分比。初级保健医生。

在选择要使用的最终约束时，我们在方法部分末尾列出的标准1和标准2之间取得了平衡。的卡式肺囊虫肺炎约束明显优于标准1上的其他6个约束。当 r当≤6时，卡式肺囊虫肺炎约束优于标准2下的所有其他约束。另外,当 r=+∞和距离不再是一个因素，没有约束胜过卡式肺囊虫肺炎约束与 r标准2≤6。图5为UWM患者中满足卡式肺囊虫肺炎约束条件以及这些患者在随后6个月内在UWM内就诊的百分比。当卡式肺囊虫肺炎约束与 r= 5,16.01%(55,707/348,054)的UWM患者满足约束条件。对于这些患者，69.38%(10,501/15,135)的医院就诊发生在接下来的6个月内。相比之下，在所有UWM患者中，31.80%(39,171/123,162)的医院就诊发生在接下来的6个月UWM内。

对于3家UWM医院中的每一家和所有满足卡式肺囊虫肺炎约束, 图6显示了他们在接下来的6个月里在联合医院医院就诊的百分比。这一比例在3家联合医院各不相同。作为 r在3家联合医院中，这一比例以相似的速度下降。

图5

华盛顿大学医学院(UWM)患者满足PCP限制的百分比，以及这些患者在接下来的6个月内在UWM内发生的医院就诊的百分比。初级保健医生。

图6

对于华盛顿大学医学院(UWM)的3家医院和所有满足PCP约束的患者，他们在接下来的6个月内在UWM医院就诊的百分比。初级保健医生。

讨论主要研究结果

通过在标准1和标准2之间取得平衡，我们选择了卡式肺囊虫肺炎约束与 r=5作为要使用的最后一个。使用我们基于约束的方法来识别正确的患者子集，我们在接下来的6个月内将UWM内发生的患者医院就诊的百分比增加了一倍以上:从31.80%(39,171/123,162)增加到69.38%(10,501/15,135)。此外，由于每个确定的患者都有一个UWM PCP，我们确信确定的患者在接下来的6个月内大部分门诊就诊都在UWM内，即使我们没有数据来验证这一点。

我们研究结果的潜在用途

我们的研究结果表明，对于居住在3家UWM医院中至少一家医院5英里范围内的患者，UWM为他们提供了大部分护理，并拥有相当完整的医疗数据。对于需要相对完整数据的数据分析任务，例如使用历史数据进行预测建模，我们可以对这一部分患者进行任务并获得有用的结果，即使对所有UWM患者进行任务是不切实际的。例如，我们可以建立一个预测模型来识别这一子集中未来的高成本患者[ 3.]。将这类患者纳入护理管理有助于预防高成本和改善预后[ 5- 7]。

我们的研究结果表明，住在离三所UWM医院较远的患者往往从UWM获得较少的护理。这表明UWM考虑对居住在距离UWM医院不同距离的患者采用不同的预防干预措施，例如，进行护理管理，以取得更好的效果。对于那些只从联合医院接受一小部分治疗的病人，联合医院很难以具有成本效益的方式使用昂贵的预防性干预措施。

本研究使用的PreManage数据涵盖了所有年龄组的成年患者。不能使用主要覆盖65岁以上患者和某些残疾和疾病患者的医疗保险索赔数据。与许多其他医疗保健系统类似，UWM没有完整的索赔数据，涵盖所有患者在UWM内外的医疗保健使用。我们可以使用索赔数据对另一个医疗保健系统进行类似的研究，如果它有完整的索赔数据，涵盖了该系统内外所有患者的医疗保健使用。

本研究使用PreManage数据验证卡式肺囊虫肺炎UWM约束的有效性。然而, 卡式肺囊虫肺炎约束不依赖于PreManage数据的可用性，即使不能访问PreManage数据，也可以由另一个医疗保健系统使用。在这种情况下，估计的一种方法是卡式肺囊虫肺炎约束的有效性是调查一些病人关于他们的医疗保健使用系统内外。

这篇论文的重点是确定患者可能接受大部分的照顾，从一个特定的卫生保健系统。如果多个医疗保健系统交换数据，我们可以使用类似的方法来识别可能从这些医疗保健系统中获得大部分护理的患者。这可以在这些医疗保健系统中实现多个数据分析任务。

限制

这项研究有几个局限性，可以作为未来工作的有趣领域:

到目前为止，UWM仅在有限的时间内积累了PreManage数据。在UWM积累了更多的PreManage数据后，我们应该重新进行分析，检查未来2到3年内在UWM内发生的患者医院遭遇的百分比，看看我们的结论是否会发生变化。

本研究在单一医疗保健系统UWM中展示了我们基于约束的患者识别方法，UWM主要为城市地区提供住院和门诊服务。为了理解我们的方法是如何推广的，我们应该在其他几个医疗保健系统上重复我们的分析，一些主要服务于城市地区，另一些在农村地区提供许多服务，看看最优约束是否会改变。对于在农村地区提供多种服务的医疗保健系统，我们期望的最佳价值是 r>5，因为农村地区患者比城市地区更分散。

对于许多患者的医疗数据不完整的医疗保健系统，我们可以使用我们的方法来识别医疗保健系统拥有更完整数据的患者子集，并估计该子集患者的数据不完整程度。对于数据分析任务来说，使用不完整的数据对这一部分患者进行分析可能会产生偏倚结果，但在偏倚程度可以接受的情况下，这仍然比没有结果要好。然而，数据不完整程度与分析结果偏差程度之间的确切关系尚不清楚。特别是，我们不知道数据不完整水平的阈值，超过该阈值，分析结论可能无效。为了解决这个问题，我们可以从另一个医疗保健系统(如Kaiser Permanente)获取一个相当完整的数据集，删除数据集的不同部分，并检查结果对分析结果的影响。这将帮助我们了解我们的方法是否足以在当前的医疗保健系统中实现数据分析任务。

结论

据我们所知，对于许多患者的医疗数据不完整的医疗保健系统，我们提供了第一种方法，使用地理限制来确定一个相当大的患者子集，这些患者倾向于从系统中接受大部分护理。结果表明，该方法在UWM下具有较好的性能。我们的方法为对不完整的医疗数据进行几个主要的分析任务打开了大门，这些任务以前被认为是不切实际的。

缩写

卡式肺囊虫肺炎

初级保健医生

UWM

华盛顿大学医学院

作者感谢刘欣然、Richard Crouch、Lisa Swan、Kristal Mauritz-Miller、Christie Benevich、Philip J Brewster、Ross Lordon、Lucy Wang和Mika N Sinanan的有益讨论。GL得到了美国国立卫生研究院国家心脏、肺和血液研究所的部分支持，资助号为R01HL142503。资助者在研究设计、数据收集和分析、发表决定或手稿准备方面没有任何作用。

论文主要由GL负责。他构思和设计研究，进行文献回顾和数据分析，并撰写论文。ESL、PTH和ABW对各种医学问题提供了反馈意见，对报告的概念化做出了贡献，并修改了论文。ESL也为研究的概念化做出了贡献。所有作者都同意提交的最终稿件，并同意对工作的各个方面负责。

没有宣布。

资产阶级

足球俱乐部

奥尔森

吉隆坡

Mandl

在多个急症医疗机构治疗的患者:量化信息碎片化

高级实习医师 2010 12 13 170 22 1989 95

10.1001 / archinternmed.2010.439

21149756

170/22/1989

Finnell

Overhage

买点

年代

并非所有的医疗保健都是地方性的:对印第安纳州急诊科医疗服务分布的评估

AMIA年度会议进程 2011 2011 409 16

22195094

PMC3243262

咖喱

比林斯

达林

迪克森

威廉姆斯

米

Wennberg

Kingsfund 2015-08-10 预测风险项目:文献综述 http://www.kingsfund.org.uk/sites/files/kf/field/field_document/predictive-risk-literature-review-june2005.pdf

梅斯

全科医生

邓肯

白色

管理式医疗反弹?健康计划成本控制战略的最新变化

卫生助理(米尔伍德) 2004 供应网络独家 w4 - 427 36

10.1377 / hlthaff.w4.427

15451964

hlthaff.w4.427

Vogeli

盾牌

李

助教

吉布森

结核病

马德尔

维斯

布卢门撒尔

多种慢性疾病:患病率、健康后果以及对质量、护理管理和成本的影响

J Gen实习医学 2007 12 22 ,85 391 5

10.1007 / s11606 - 007 - 0322 - 1

18026807

PMC2150598

Caloyeras

摩根大通

刘

Exum

布罗德里克

米

Mattke

年代

管理明显的疾病，而不是健康风险，在过去七年中为百事公司节省了资金

卫生助理(米尔伍德) 2014 01 33 1 124 31

10.1377 / hlthaff.2013.0625

24395944

33/1/124

纳尔逊L

国会预算办公室 2015-08-10 医疗保险在疾病管理和护理协调方面示范项目的经验教训 https://www.cbo.gov/sites/default/files/112th-congress-2011-2012/workingpaper/WP2012-01_Nelson_Medicare_DMCC_Demonstrations_1.pdf

邓肯

搞笑

医疗保健风险调整和预测建模 2011

Winsted, CT

怡达出版有限公司

一个灰考尔N

Rti 2005

2015-08-10

军队人群的风险评估，以预测卫生保健费用和利用 http://www.rti.org/pubs/tricare_riskassessment_final_report_combined.pdf

Iezzoni

衡量卫生保健结果的风险调整，第4版 2013

芝加哥,

卫生行政出版社

罗

石头

提单

约翰逊

医学博士

Tarczy-Hornoch

威尔科克斯

穆尼

盛

Haug

Nkoy

临床大数据机器学习模型的自动化构建:原理与方法

JMIR Res协议 2017 08 29 6 8 e175

10.2196 / resprot.7757

28851678

v6i8e175

PMC5596298

Collectivemedicaltech 2017-02-19 预管理:消除沟通差距，缩小护理差距 http://collectivemedicaltech.com/what-we-do-2/premanage/

Cran.r-project 2018-09-17 地圈:球面三角学 https://cran.r-project.org/web/packages/geosphere/index.html