JMIR J医疗互联网服务 医学互联网研究杂志 1438 - 8871 卡塔尔世界杯8强波胆分析 加拿大多伦多 v18i12e325 27998877 10.2196 / jmir.6400 的观点 的观点 弥合卫生数据鸿沟 Eysenbach 冈瑟 Wagholikar Kavi Jiggins Colorafi 凯伦 附加评论 狮子座安东尼 医学博士,硕士,公共卫生硕士 1 http://orcid.org/0000-0001-6712-6626 Davidzon 圭多 医学博士,SM 1 http://orcid.org/0000-0001-5579-6825 约翰逊 Alistair电子战 DPhil 1 http://orcid.org/0000-0003-0140-0797 科莫罗夫斯基 马修 医学博士,研究硕士 1
关键数据 马萨诸塞大道77号 剑桥,马萨诸塞州,02139 美国 1 617 710 3114 1 617 258 7859 matthieu.komorowski@gmail.com
http://orcid.org/0000-0003-0559-5747
马歇尔 多米尼克·C 黑带大师 1 http://orcid.org/0000-0002-3498-2511 奈尔 苏尼尔年代 医学博士,工商管理硕士 1 http://orcid.org/0000-0002-4332-1221 菲利普斯 科林·T 医学博士 1 http://orcid.org/0000-0002-6543-0234 波拉德 汤姆J 博士学位 1 http://orcid.org/0000-0002-5676-7898 Raffa 杰西维 博士学位 1 http://orcid.org/0000-0001-8665-2429 Salciccioli 贾斯汀D 妈,黑带大师 1 http://orcid.org/0000-0001-8092-0883 萨尔格里罗 旧金山Muge 医学博士 1 http://orcid.org/0000-0003-2291-6434 石头 大卫J 医学博士 1 http://orcid.org/0000-0003-4855-4283
1 关键数据 剑桥,麻 美国 通讯作者:Matthieu Komorowski matthieu.komorowski@gmail.com 12 2016 20. 12 2016 18 12 e325 28 7 2016 28 9 2016 28 9 2016 21 11 2016 ©Leo Anthony Celi, Guido Davidzon, Alistair EW Johnson, Matthieu Komorowski, Dominic C Marshall, Sunil S Nair, Colin T Phillips, Tom J Pollard, Jesse D Raffa, Justin D Salciccioli, Francisco Muge Salgueiro, David J Stone。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2016年12月20日。 2016

这是一篇开放获取的文章,根据创作共用署名许可(http://creativecommons.org/licenses/by/2.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。

基本的质量、安全和成本问题并没有随着医疗保健的日益数字化而得到解决。这种数字化的进展伴随着临床医生、领域专家和技术专家(如数据科学家)之间持续存在的分歧。临床医生和数据科学家之间的脱节导致了研究和医疗资源的浪费,创新的吸收缓慢,以及比理想和可实现的结果更差的结果。可以通过在这两个学科之间创建一种协作文化来缩小这种差异,例如数据马拉松等活动。然而,为了更充分和更有意义地弥合鸿沟,医学教育、出版和资助过程的基础设施必须发展起来,以支持和加强学习型医疗保健系统。

电子健康记录 机器学习 卫生保健政策 医学教育 协作
简介

美国医疗保健研究与质量局(AHRQ)成立于1989年,是为了响应医学研究所(现为国家医学科学院)的一份报告,该报告指出“不断上升的医疗保健成本,医疗实践模式的广泛差异,以及一些医疗服务价值很少或没有价值的证据”[ 1].25年多过去了,这三个领域的进展令人惊讶,甚至令人震惊。通过普遍提供标准化、循证和真正指示的护理,可以反映出护理质量并没有提高到人们所希望的程度。同样,在这25年的时间里,医疗安全和医疗差错也越来越多地进入医疗系统的意识[ 2],这些领域的进展缓慢、来之不易,而且没有得到其他领域的智能、数据驱动的工程设计的支持。

最近计算能力和数据存储的增长导致了一个涉及分析数字存档信息以获取新知识的全新领域:数据科学。虽然医疗质量在很大程度上是由临床试验和昂贵的前瞻性研究决定的,但数据科学在临床领域的应用有机会大幅提高知识生成的速度和可以回答的问题的广度。当研究不实际时,给出的答案是特别有趣的,一个这样的例子是一个小效应量的增强治疗的比较(通常需要一个非常大的前瞻性队列)。数据科学也有机会更直接地为临床决策提供信息,预测相关临床现象的发生,如生理恶化、诊断、药物依从性或器官排斥。1989年AHRQ成立时,机器学习还处于萌芽阶段,现在已经无处不在,从搜索查询到最佳路线,机器学习影响着我们日常生活的方方面面。在败血症生存运动指南出版之前的十年中[ 3.],评估机器学习在败血症决策支持和预测中的应用的出版物数量显著增加( 图1).

将机器学习应用于临床实践的兴趣正在增加,但这些技术的实际应用并不尽如人意。由于缺乏高质量的证据或工具来支持大多数日常决策,从业人员继续在没有技术支持和监测的情况下作出判断,因此,个别从业人员的诊断错误率高得令人无法接受[ 4].

需要了解数据的临床相关性的临床医生和数据科学家之间存在持久的差距,数据科学家对于从正在生成的越来越多的卫生保健数据中提取有用的信息至关重要。在本文中,我们重点讨论了数据科学和医疗保健竖井之间的鸿沟,并假定缺乏集成是医疗保健数据革命的主要障碍。我们首先讨论了支持这种差异存在的已发表文献,然后就如何弥合执业临床医生和数据科学家之间的差距提出了建议。

PubMed搜索(“脓毒症”[所有领域]或“脓毒症”[所有领域])和(“机器学习”[所有领域]或“数据分析”[所有领域]或“数据科学”[所有领域]或“工程”[所有领域]或“计算”[所有领域]或“预测”[所有领域])和(“2002/01/01”[PDAT]:“2016/12/31”[PDAT])的结果。

的分歧

在实践和研究领域,科学家和工程师之间存在着分歧,另一方面,临床医生最熟悉定义和限制医学实践的紧急情况和不确定性。这种情况的发展有几个原因。直到最近,可用于进行研究的数据来源非常有限,如比较有效性的确定、成本分析和治疗效果异质性的阐明。此外,一直缺乏强烈的动机(即,很少或没有消极的财务激励;缺乏实证研究;以及强烈的个人和行业惰性和阻力),以减少浪费和有时有害的做法变化,或避免(通常补偿丰厚)价值很少或没有价值的卫生服务。

2012年,加州理工学院喷气推进实验室的基里·瓦格斯塔夫(Kiri Wagstaff)发表了一篇名为《重要的机器学习》(Machine learning that matters)的深刻文章,指出了许多机器学习研究与社会中重要(且真实)的问题(包括医疗保健问题)脱节的程度[ 5].为了将精力重新集中在重要的主题上,瓦格斯塔夫提出了几个“影响挑战”,将机器学习与现实世界的结果联系起来,比如拯救一个人的生命或通过改进决策节省大量的资金。在2014年的特刊上 机器学习 6], Rudin和Wagstaff更详细地探讨了机器学习研究及其更广泛的应用之间的联系,并明确强调了跨学科合作对发展有影响力的研究的重要性。虽然机器学习在各种实际应用中都有明显的需求,但作者认为,顶级机构缺乏推动这类工作的热情,造成了一种“矛盾的局面”,阻碍了它的发展。这种情况加剧了卫生数据的分歧。

弥合分歧 建议1:协作

考虑到问题的定义,最明显也是最具挑战性的解决方案是鼓励数据科学家和临床医生之间的合作。在过去的50年里,统计学与临床研究的结合,以及生物统计学家的兴起,可以作为社会学习的模板。随着时间的推移,生物统计学家在生物医学研究中的角色已经变得协作,至少部分原因是该学科的历史和传统。美国这一历史上的一个重要事件是1962年通过的《联邦食品、药物和化妆品法》Kefauver-Harris修正案,该修正案初步确立了今天食品和药物管理局评估药物的方法[ 7].该法案本身要求证明新药的疗效,而在其签署成为法律之前,这是不需要的。这项立法和随后20年的事件使统计学家与临床研究人员密切接触,现在临床研究人员需要统计学家的专业知识来设计、分析和报告他们的研究,并有效地建立了生物统计学家和临床科学家之间合作的传统,直到今天。

数据科学家和那些专注于医学实践的人之间的这一过程能否加速?纽约西奈山卫生系统新成立的伊坎基因组学和多尺度生物学研究所雇佣了300多人,他们的背景涉及硬件设计、大数据计算、基因测序和生物信息学。 8].通过将这一人才与西奈山的疾病中心联系起来,并使用机器学习和预测建模(大数据元素)的工具,科学家们已经发表了关于共变阿尔茨海默病的炎症模型[ 9]并且正在仔细研究人体中最复杂和生物多样性的细胞群之一,肠道微生物群,它可能比以前认识到的更多地负责身体的内稳态[ 10].

通过向研究人员灌输更深刻地认识到与互补学科的同事合作所带来的好处,可能有助于弥合这种分歧。两篇论文发表于 生理学教育进展,美国生理学会的一份杂志,呼吁医学教育做出改变,以缩小工程师和医生之间的知识差距[ 11 12].

建议2:教育

医学已经笨拙地通过后门进入了数字时代:庞大而昂贵的电子医疗记录系统的实施在很大程度上没有仔细和有计划地考虑它们对整个医疗保健系统的影响,包括教育、实践、工作流程和研究。教育和实践系统没有充分考虑到这个新的数字化世界,其后果包括学生对他们的数字化未来没有准备,非常不高兴的医生坐在电脑屏幕前,从大量的下拉列表中选择似乎无穷无尽的项目,以及无意识地失去许多改进实践和研究的机会。现在是时候承认和解决医学从纸上到计算机、从观点和经验到证据、从记忆到搜索引擎的转变了,即使这有点迟,也有点不积极。

以往的报告表明,临床医生甚至临床科学家对统计方法及其在临床数据(包括实践中使用的数据)中的应用缺乏了解[ 13 14].大多数医生似乎对这些日益重要的问题知之甚少,似乎更不感兴趣。这种不可接受的认识和培训差距促使国际上更新医学课程,以便增加统计应用和流行病学方面的指导和接触。然而,具备信息学和数据科学知识的医师教育者数量不足,他们甚至需要向初级学员提供最基本和最重要的见解。 15].

这些问题包括我们训练谁、何时、如何以及训练什么?培训应侧重于两类医疗培训生:医学生和住院医生。如果我们承认,在接下来的半个世纪里,对这种性质的混合技能的需求可能会越来越大,那么就有充分的理由将数据科学纳入医学院和住院医师培训的核心课程[ 16].介绍使用数字健康记录进行研究可能会为能够为知识发现做出贡献奠定基础,无论医学生和住院医生最终选择哪种职业道路。接下来应该是选修课,最好是有实践研究(如暑期课程或实习),为那些特别感兴趣的人进一步培养这些技能。后者很可能成为这一领域未来教育工作者的核心。

感兴趣的医科学生和住院医生将受益于促进跨学科工作关系的教育机会。这样的经历之一可能是参与数据马拉松,我们以前在自己的工作中使用过数据马拉松来鼓励合作[ 17].在这类事件中产生的资源和见解可以存储并用于正在进行的合作,并可以不断更新,以提供更高的科学严谨性和洞察力。最后一个建议由在线平台和社区代表,医生和数据科学家可以在那里互动,讨论临床相关问题,并共享代码库和工作示例。

也许最重要的是,创造一种意识到并尊重数据在支持和改进实践和研究方面的重要性和潜在力量的医学文化,可能是最重要和最终有效的因素。临床过程中的每个参与者都应该意识到并理解他们在整个系统中提供可靠和可靠的数据的作用,他们和其他人随后将用于改善护理。

建议3:重新思考学术激励

对医学培训生进行数据分析方法的教育,对数据科学家培训生进行临床实践和数据等特定领域问题的教育,将成为这两个群体今后在职业生涯中进行合作的基础。学术期刊鼓励临床医生和数据科学家联合投稿的政策可以促进这种合作。学术医学“不发表就灭亡”的文化在过去30年里没有太大变化[ 18并导致了各种各样的琐事:发表模糊或无关的结果,临床或研究的重要性最低;将结果划分为多个期刊的多个手稿;以及对数据集的竞争(或者,至少是缺乏透明度和共享)。虽然平等作者身份并不是解决这些问题的灵丹妙药,但它可能会减轻研究人员之间合作的一些障碍,并可能产生更高质量的出版物。大数据更适合于合作而不是分离——多个研究可以在同一个数据集上进行,用于不同的目的。例如,来自香港的急诊科数据集被用来确定对极端天气敏感的人群, 而且制定截至2036年的救护车需求长期预测[ 19].

我们预测,这种合作模式的持续成功将需要对平等作者身份的认可,就像目前期刊、大学和资助机构所使用的那样。我们认为,论文的影响比个人贡献更重要,前提是作者将证明他们每个人都在最终出版物或提案的发展中发挥了有意义的作用。平等的作者身份可能不会结束,但可能会缓和当前的出版策略,即发布多篇规模较小、影响力较小的论文,以获得小组所有成员的第一/最后作者身份——这对他们的简历和学术地位很重要。下一步将是对对手方使用的数据给予认可——如何比让其他研究人员在他们自己的相关(或不相关)研究问题上使用相同的数据更好地验证自己的队列呢?后者得出的任何结论在一定程度上都应归功于前者,因为后者在生成和整理高保真数据集方面发挥了作用,这一作用也得到了学术界的认可。这些措施将鼓励对大数据基础设施的投资,同时也将提高“大数据”结论的质量。

建议4:资金

促进某一特定领域的研究并通过资助鼓励各领域之间的合作并不新鲜。大约20年前,美国国立卫生研究院(NIH)召集了一个临床研究主任小组,以解决申请临床研究经费的医生研究人员减少的问题。该小组提出了一系列建议,以增加临床研究人员的资助机会[ 20.].我们建议今天实施许多相同的方法,通过资金和激励来鼓励临床医生和数据科学家之间更密切的合作。

美国国家卫生研究院资助的研究项目使用活动代码进行分类,例如,R系列的代码对应研究资助(如R01, R13), K系列的代码对应职业发展奖励。我们建议为从事数据科学的临床医生设立一个K奖类别,类似于临床研究主任小组建议为临床医生设立的K23补助金。为数据科学家提供独特的K奖将提供更多的资助机会,因为K奖通常会资助40%的申请人,而不像R0奖,后者更具竞争力,资助率要低得多,通常为10%。这种支持对于在数据科学研究人员职业生涯的脆弱早期培养他们至关重要。

通过重组研究部门,并在所有专门用于二次分析的研究所中增加研究部门,赠款将增加数据科学提案的可用资金,否则在当前结构中可能无法获得资金。有一个专门针对二次分析的研究部分来对数据科学提案进行评分,将确保至少10%的数据科学提案得到资助(并避免与初级分析提案竞争,后者可能会获得优先评分)。此外,规定医疗保健提供者作为提案团队的一部分将鼓励提案背后的临床动力。

美国联邦政府增加获得资金的另一个例子是美国退伍军人事务部的大数据科学家培训增强计划,该计划已被6个试点中心采用[ 21].该计划支持数据科学家直接与医院现场的临床科学家一起工作。

结论

更好地利用临床数据有可能解决卫生保健系统中一些重要的、有问题的和尚未解决的问题。这些因素包括高昂的、甚至是过高的成本;不必要的和不可取的实践变化;数字化工作流程的改进;普遍实施合理、可靠和可用的循证医学;个性化、精准医疗的引入;质量;安全;有效的沟通;高效的护理协调; and the introduction of data-driven and -supported clinical decision making. However, the introduction of this kind of revolution into health care inevitably involves crossing disciplinary boundaries in a way that requires cooperation and collaboration among a frankly diverse group of experts in order to optimize the combined output of these contributors. The formation of such teams requires that each team member be more educated in the issues involved outside of their own comfort areas. As a primarily medically oriented group, we focus on the impact on medical training, but the principles relate to those in nonmedical areas who need to become sufficiently educated in clinical matters to contribute optimally to the grand scheme. For example, how can current advanced analytic techniques such as machine learning be best applied to both clinical research and practice problems? Clearly, specific kinds of clinical-technical collaborations will be required to guide these kinds of processes and projects to fruition.

在本文中,我们不仅试图描述问题,而且还试图描述我们所处状况的潜在解决方案,或者至少是解决方案的初步方法。这种情况包括一个成本高昂、复杂而庞大的医疗保健系统,该系统可以很好地进行改进,以及由于医疗保健的加速数字化而积累的越来越多的未充分利用的数据。

临床医生不应该觉得自己像可互换的齿轮一样,盲目地将大量数据输入一个没有回报的巨大黑洞;数据科学家不应该发现新知识并开发与领域专家隔离的预测算法。相反,所有人都应该将自己视为一个真正有效的临床数据系统的必要组成部分,该系统致力于为个人和人群提供优秀的护理,同时努力改善护理的各个方面。

回家的消息

1.基本的质量、安全和成本问题并没有随着医疗保健的日益数字化而得到解决。

2.这种数字化的进展伴随着临床医生、领域专家和技术专家(如数据科学家)之间持续存在的分歧。

3.可以通过在这两个学科之间创建一种协作文化来缩小这种差异,例如数据马拉松等活动。

4.然而,为了更充分和更有意义地弥合鸿沟,医学教育、出版和资助过程的基础设施必须发展起来,以支持和加强学习型医疗保健系统。

缩写 AHRQ

医疗保健研究和质量机构

国家卫生研究院

美国国立卫生研究院

我们感谢Roger Mark博士、Kenneth Mukamal博士和Peter Weller博士的宝贵意见。

Leo Anthony Celi, Alistair EW Johnson, Tom J Pollard和Jesse Raffa由美国国立卫生研究院通过国家生物医学成像和生物工程研究所资助R01 EB017205-01A1和飞利浦医疗保健。Matthieu Komorowski由伦敦帝国理工学院院长博士奖学金资助。

没有宣布。

格罗斯曼 JH 乔丹 Lohr KN 临床实践指南:新项目的指导 1990 华盛顿特区 国家科学院出版社 医学研究所 美国卫生保健质量委员会 科恩 LT 唐纳森 女士 科里根 JM 人孰能无过:建立更安全的卫生系统 2000 华盛顿特区 国家科学院出版社 粗捷 RP 莱维 毫米 罗兹 一个 Annane D Gerlach H 蛋白石 SM Sevransky 跳出来 CL 道格拉斯 Jaeschke R 奥斯本 TM Nunnally 汤森 莱因哈特 K Kleinpell RM 安格斯 直流 Deutschman CS 马查多 FR ·鲁本菲尔德 GD 韦伯 年代 比尔 RJ 文森特 J 莫雷诺 R 生存败血症运动指南Com 生存脓毒症运动:严重脓毒症和脓毒症休克国际管理指南,2012 重症监护医学 2013 02 39 2 165 228 10.1007 / s00134 - 012 - 2769 - 8 23361625 Graber 毫升 医学诊断错误的发生率 英国医学杂志Qual Saf 2013 10 22补充2 ii21 7 10.1136 / bmjqs - 2012 - 001615 23771902 bmjqs - 2012 - 001615 PMC3786666 瓦格斯塔夫 K 重要的机器学习 2012 2016-12-08 纽约伊萨卡岛 康奈尔大学图书馆 https://arxiv.org/ftp/arxiv/papers/1206/1206.4656.pdf 鲁丁 C 瓦格斯塔夫 吉隆坡 科学和社会的机器学习 机器学习 2013 11 28 95 1 1 9 10.1007 / s10994 - 013 - 5425 - 9 格林 晶澳 Podolsky 上海 改革、监管和制药——50岁的凯弗-哈里斯修正案 N英语J医学 2012 10 18 367 16 1481 3. 10.1056 / NEJMp1210007 23075174 PMC4101807 斯凯特 E Chilukuri 年代 大数据在医学中的作用 2015 2016-12-08 纽约州纽约 麦肯锡公司 http://www.mckinsey.com/industries/pharmaceuticals-and-medical-products/our-insights/the-role-of-big-data-in-medicine B Gaiteri C Bodea l Z 而言 J Podtelezhnikov AA C T Tran l 多布林 R Fluder E 克拉曼 B Melquist 年代 Narayanan 运动型多功能车 C 沙阿 H Mahajan 吉利斯 T 迈索尔 J 麦克唐纳 羊肉 班尼特 马勒尼 C 石头 DJ Gudnason V 迈尔斯 AJ 斯凯特 EE 诺伊曼 H J Emilsson V 综合系统方法识别晚发性阿尔茨海默病的遗传节点和网络 细胞 2013 04 25 153 3. 707 20. 10.1016 / j.cell.2013.03.030 23622250 s0092 - 8674 (13) 00387 - 5 PMC3677161 伊坎研究所和遗传与基因组科学系 研究 2016 2016-12-08 纽约州纽约 西奈山的伊坎医学院 http://icahn.mssm.edu/research/genomics/research 汉弗莱 JD 象牙海岸 GL 沃尔顿 专职阿訇 遗传算法 莱恩 遗传算法 生物医学科学和工程研究生研究和培训的新范式 Adv物理教育 2005 06 29 2 98 102 10.1152 / advan.00053.2004 15905153 29/2/98 Matsuki N 武田 Yamano Imai Y 石川 T 山口那津男 T 独特的生物医学教育项目对工程师的影响:赎回和尊重项目 Adv物理教育 2009 06 33 2 91 7 10.1152 / advan.90120.2008 19509393 33/2/91 霍顿 新泽西 瑞士人 党卫军 杂志中的统计方法 N英语J医学 2005 11 03 353 18 1977 9 10.1056 / NEJM200511033531823 16267336 353/18/1977 Windish DM 担任 SJ 绿色 毫升 医学住院医师对生物统计学和医学文献结果的理解 《美国医学会杂志》 2007 09 05 298 9 1010 22 10.1001 / jama.298.9.1010 17785646 298/9/1010 使用清洁 CR 医学教育是问题的一部分,也是解决问题的一部分 美国医学会实习生 2013 09 23 173 17 1639 43 10.1001 / jamainternmed.2013.9074 23857567 1713510 莫斯科维茨 一个 McSparron J 石头 DJ 附加评论 为大数据时代培养新一代临床医生 哈维医学Stud Rev 2015 01 2 1 24 7 25688383 PMC4327872 Aboab J 附加评论 查尔顿 P Ghassemi 马歇尔 直流 Mayaud l 瑙曼 T McCague N 沉重的一击 波拉德 TJ Resche-Rigon Salciccioli JD 石头 DJ 支持跨学科合作的“数据马拉松”模型 科学翻译医学 2016 8 333年ps8 10.1126 / scitranslmed.aad9072 27053770 天使 不发表就灭亡:一个提议 实习医生 1986 02 104 2 261 2 3946958 HT YQ 穆雷 K DH 斯莱德 D 大数据作为急诊医学研究的新途径 J急性疾病 2015 08 4 3. 178 9 10.1016 / j.joad.2015.04.003 内森 DG 临床研究:感知、现实和提出的解决方案。国家卫生研究院临床研究主任小组 《美国医学会杂志》 1998 10 28 280 16 1427 31 9801003 jsc80034 巴贝罗 R 莱维 N 2016-12-08 在美国退伍军人事务部医疗中心增加数据科学的使用。华盛顿特区:白宫;2015. https://www.whitehouse.gov/blog/2015/10/08/increasing-use-data-science-us-department-veterans-affairs-medical-centers
Baidu
map