原始论文
摘要
背景:数据分析用于识别提示治疗选择或临床结果差异的信号。迄今为止的分析一般集中在假设驱动的方法上。
摘要目的:本研究旨在开发一种无假设的方法来识别初级保健数据中的异常处方行为。我们的目标是将这种方法应用于横断面研究中的国家数据集,以确定在临床委托组(CCGs)中使用有显著差异的化学品,以便进行进一步的临床审查,从而证明优先级方法的概念证明。
方法:在这里,我们报告了一种新的数据驱动方法,以识别初级保健数据中的异常处方行为。该方法首先应用一组过滤步骤来识别处方率分布中可能包含异常值的化学品,然后应用两种排序方法来识别这些候选化学品中最极端的异常值。该方法已应用于三个月的国家处方数据(2017年6月至8月)。
结果:我们的方法按行政区域对所有化学品进行排名。我们提供了2种临床特别感兴趣的抗精神病药物的说明结果:盐酸丙嗪和哌雅嗪,它们在离群指标中排名很高。具体来说,我们的方法确定,虽然盐酸丙嗪和哌嗪很少被大多数临床医生使用(全国处方率分别为11.1和6.2 / 1000张抗精神病处方),但在研究期间,它们在英国2个小地理区域的抗精神病处方中占据了相当大的比例(最大区域处方率分别为298.7和241.1 / 1000张抗精神病处方)。
结论:我们的无假设方法能够在临床实践中确定审计和审查的候选人。为了说明这一点,我们提供了两个例子,两种非常不寻常的抗精神病药物在英格兰的两个小地理区域不成比例地使用。
doi: 10.2196/41200
关键字
简介
自2011年以来,英国国家卫生服务(NHS)公开分享了详细的每月全科医生处方数据,包括个人剂量、化学品和品牌,并在个人全科医生层面汇总。这些数据支持了关于广泛主题的原始研究,并支持了系统审计和审查计划,以实现初级保健处方的改进[
].我们的团队开发了OpenPrescribing.net [
],这是一个免费且广泛使用的工具,任何人都可以在英国的任何诊所查看处方,并监控处方模式,直至单个品牌、配方和剂量。OpenPrescribing提供数据驱动的反馈,以帮助区域和实践级别的药物优化团队,并确定他们可能没有意识到的审查领域。例如,我们确定每个NHS组织是否在超过80个预定义措施上是一个异常值,这些措施涵盖了一系列处方安全性、成本效益和功效问题。通过比较品牌或仿制药和配方,还计算了每种做法的独特节省机会[ ],而有证据显示,这些节省已得以实现[ ].通常,用于服务审计和质量改进的数据科学是假设驱动的:确定目标行为并使用数据来衡量该目标的实现[
, ].考虑到大量公开的NHS处方数据(过去十年中超过20亿行数据覆盖8000个组织)以及可能存在于该数据集中的广泛临床行为和护理变化的潜在信号,我们开始开发新的无假设的数据科学技术,以确定由护理变化驱动的服务改进的新机会。我们的总体分析目标是建立原型并描述方法,以识别处方数据中先前未知的临床兴趣信号(现有的识别异常值的方法通常集中在处方的财务方面[
- ]或专注于特定的临床问题[ , ])。我们进行了一系列内部研讨会,以开发一份简短的数据科学方法清单,这些方法可能用于识别在NHS组织或地区异常分布的处方行为。在这里,我们简要地报告了一种这样的方法的成功部署(通过峰度和所有化学类对的中位数差异之间的比率对化学物质进行排名),并演示了如何在英格兰的2个小地区确定了不寻常的抗精神病药物的高处方。方法
研究设计和数据来源
我们进行了一项横断面研究,使用2017年6月至8月英国全科医生处方的所有配药产品的开放NHS处方数据,从OpenPrescribing数据库中提取。选择相对较短的3个月的窗口,因为这项工作代表了概念的证明。该数据集包括,对于每种做法,产品和处方月份,处方药的数量(相当于每种产品出现在处方表格上的数量),以及总数量(如片剂和mL)。实践由其母公司临床调试组(CCG)进行分组,CCG是NHS的一个行政区域。在英格兰,2017年,大约7000个NHS全科实践被安排在207个ccg中。
数据处理
在英国规定的所有化学品都被分配到一个“类”化学品,使用他们的英国国家配方(BNF)遗留代码来识别化学品的相关BNF分段。我们将搜索范围限定在BNF(1511种规定化学品)第1-15章中的化学品,以排除不遵循化学品/分段结构的章节,这些章节主要涵盖敷料等非药用产品。对于每一对化学品类别,为每种化学品规定的项目数量(类似于处方数据中的处方)表示为其类别中所有化学品规定的总项目的比例。计算每个CCG的化学等级比例值。为了避免包括很少规定的化学品类别,从而产生虚假的结果,我们排除了116种总规定含量最低的化学品(具体来说,最低两百分位)和4种被少于50个ccg使用的化学品。总共有1395种化学物质被分析。
根据离群值指标对化学类对进行排名
我们首先试图将分析重点放在那些分布特征表明(1)ccg之间的合理变异性和(2)正异常值(即处方率较高的异常值,而不是处方率较低的异常值)的化学品上:化学品类别对在>10%范围内被过滤,>0偏斜。该研究确定了412种感兴趣的候选化学品。为了进一步细化这组化学品,我们只保留了那些候选化学品(1)中位数比例<0.1,即大多数ccg以非常低的比例开出处方,或根本不开出处方;(2)全国处方数量并不小(至少1000张处方),以限制少量处方随机波动的影响。这些进一步的过滤步骤将我们的候选化学品清单减少到204种。
然后,我们实施了两种替代排名方法来识别候选化学品中的异常值。第一个是峰度,它可以被描述为一个给定分布的尾部比正态分布重或轻的程度的数值度量;总的来说,具有高峰度的数据集往往比具有低峰度的数据集具有更极端的异常值。峰度是一种很好的方法,用于检测数据集中未知数量的异常值[
, ].我们计算了所有ccg中每个候选化学类别对的峰度,并根据该峰度值对化学物质进行排序(从高到低)。然后,我们生成了另一种化学品排名,使用的比率是第95和第97百分位(最高处方ccg)与第50和第95百分位(这些ccg以更温和的比例处方)之间的化学类比例的百分位范围计算得出的;这一比率今后称为“高:中百分位比率”。这两种方法都对所有化学品进行了排序,对于排名最高的化学品,ccg之间在该化学品在其类别所有化学品的所有处方中使用的程度上存在非常大的差异。该排名用于临床工作人员(BMK, RC, OM和BG)对临床感兴趣的信号进行手动评估的化学类别对的优先级。
使用Choropleth map可视化处方率
对于选择的临床感兴趣的化学类对,我们使用OpenPrescribing.net生成了一个choropleth map,以可视化每种化学药品处方的地理分布作为其类的比例。使用Python和谷歌BigQuery进行数据管理,使用Python进行分析(作者HJC和LEMH)。数据和图表,以及所有用于数据管理和分析的代码都可以在GitHub上公开查看和重用[
].道德的考虑
这项研究完全使用公开的数据;因此,不需要伦理批准。
结果
共有204种化学品被发现具有处方率分布,表明在英格兰NHS的行政区域之间存在积极的异常值。
总结了这些化学物质的高、中百分位比和峰度值。突出显示了任何异常值测量排名前5位的化学品。这些结果的临床回顾确定了2种化学物质来说明方法学:盐酸丙嗪(高:中百分位比:1.804,峰度:43.61)和哌雅嗪(高:中百分位比:0.880,峰度:49.60)。这2种抗精神病药物是高:中百分位比排名前2位的化学物质,也在峰度排名前10位(分别为第九和第七)。
更详细地探索这些化学物质,哌嗪在英格兰东部的处方率要高得多(
在277,470张(4.7%)抗精神病药处方中,有13,119张是哌嗪,而全国2,489,069张(0.6%)抗精神病药处方中有15,344张是哌嗪。OpenPrescribing choroppleth地图显示,这种高水平的处方尤其集中在诺维奇和诺福克地区( 一个; ).盐酸丙嗪在英格兰西北部的处方剂量较高( ),在412,624张(4.9%)抗精神病处方中占20060张,而在全国2,489,069张(1.1%)抗精神病处方中占27,724张。再次,这些异常的处方行为集中在特定的ccg:博尔顿和更广泛的大曼彻斯特地区( B; ).![](https://asset.jmir.pub/assets/958bdab94abaf6ca622988fbc0af9147.png)
地区 | 抗精神病药物,n | Pericyazine | 丙嗪盐酸盐 | ||
规定,n | 每1000人 | 规定,n | 每1000人 | ||
东米德兰兹 | 188593年 | 155 | 0.8 | 1088 | 5.8 |
英格兰东部 | 277470年 | 13119年 | 47.3 | 381 | 1.4 |
肯特,萨里和苏塞克斯 | 189490年 | 192 | 1.0 | 334 | 1.8 |
伦敦北部中部和东部 | 151108年 | 84 | 0.6 | 122 | 0.8 |
北东 | 162212年 | 96 | 0.6 | 620 | 3.8 |
西北 | 412624年 | 315 | 0.8 | 20060年 | 48.6 |
伦敦西北部 | 89949年 | 5 | 0.1 | One hundred. | 1.1 |
伦敦南部 | 124296年 | 103 | 0.8 | 127 | 1.0 |
南西 | 209838年 | 306 | 1.5 | 131 | 0.6 |
泰晤士河谷 | 75489年 | 10 | 0.1 | 163 | 2.2 |
威塞克斯 | 121442年 | 104 | 0.9 | 276 | 2.3 |
西米德兰兹郡 | 246907年 | 580 | 2.3 | 3951 | 16.0 |
约克郡和亨伯河 | 239651年 | 275 | 1.1 | 371 | 1.5 |
所有 | 2489069年 | 15344年 | 6.2 | 27724年 | 11.1 |
![](https://asset.jmir.pub/assets/1b96573e45dc1032d79760257c059af4.png)
讨论
总结
使用无假设的方法,我们将数据科学技术应用于国家数据集,以识别异常值。在随后的临床回顾中,发现了两种不同寻常的抗精神病药物,在全国使用非常有限,但在英格兰的两个小地理区域非常常见。具体来说,哌嗪只占全国所有抗精神病处方药的0.6%(2,489,069人中有15,344人),但在诺维奇,它占所有抗精神病处方药的24.1%(21,553人中有5197人);盐酸丙嗪占全国所有抗精神病药物处方的1.1% (27,724 / 2,489,069);然而,在博尔顿,它代表了29.9%(5549 / 18577)的所有抗精神病处方。
优势和劣势
这项研究是对方法论的务实和探索性方法的概念证明,并且仍在迭代开发中,以优化指标和参数。因此,我们认识到,我们用来对这里描述的化学类对进行排名的指标存在局限性。例如,产生的排名可能具有误导性,即少数ccg是特定化学品的处方者,从而夸大了同一化学品在其他领域的离群值地位。此外,在处方数量较少的情况下,可变性的影响尚不清楚,尽管我们确实试图通过去除处方数量特别低的化学品来减轻这种影响。然而,我们并没有将这项工作作为异常值检测的独立方法;相反,我们将其作为一种优先考虑和关注手动临床审计和审查的方法。
我们的研究确实涵盖了相当短的一段时间(2017年6月至8月),再次因为它是一个概念证明。然而,OpenPrescribing所使用的数据集确实包括了英国所有典型实践中的所有处方,从而最大限度地减少了获得偏差样本的可能性。此外,使用我们的方法确定的化学物质确实是进一步调查的合法目标;不幸的是,我们对这项工作的报道以及随后对这些处方异常值原因的调查受到了COVID-19大流行的干扰。
背景信息
哌嗪很少用于精神分裂症,也很少用于严重焦虑、精神运动性躁动、暴力或危险冲动行为的短期辅助治疗[
].在英国临床指南的主要来源——国家健康与护理卓越研究所(NICE)网站上的任何指南中都没有提到哌雅嗪。2014年Cochrane对吡嗪的一项综述仅确定了5项适合纳入的研究,由于证据质量较低,无法确定吡嗪在精神分裂症中的作用,并发现与非典型抗精神病药物相比,吡嗪的副作用发生率更高[ ].PubMed搜索发现只有73份出版物包含“periyazine”一词[ 相比之下,氟哌啶醇和利培酮的结果分别为22000和11000。盐酸丙嗪可用于老年人的精神运动性躁动和躁动或躁动[ ].在任何NICE指南中都没有提及,仅在1355份PubMed记录中出现[ (1964年达到高峰)。我们知道,之前没有使用无假设的数据科学技术,以本文概述的方式系统地识别任何给定治疗选择或临床结果的异常值。政策影响及解释
我们只报告了在这两个小区域内与国家处方规范有重大偏差的事实,并没有直接评论在任何单个患者或一般情况下使用这些药物的适当性。这超出了这项工作的范围,从事详细的定性或其他研究,以了解这两个地区这两种不寻常的抗精神病药物的高使用率的原因;然而,我们注意到盐酸丙嗪和哌雅嗪先前分别出现在大曼彻斯特和诺福克的治疗处方中。此外,值得注意的是,抗精神病药物通常在二级护理中开始,而在全科实践中处方被取代。
卫生和社会保障部最近就一项利用数据改善卫生服务和结果的雄心勃勃的计划进行了咨询[
].使用数据来确定临床活动和结果的差异是长期确立的[ , NHS最近的旗舰项目,如RightCare和Getting it Right First Time,都专注于识别和解决护理中的差异。然而,这些方法通常依赖于传统方法,其中理想的临床活动或结果由临床医生或专员前瞻性地定义,然后通过分析相关数据来衡量依从性。这是极不可能的,这些传统的方法将永远识别不寻常的处方行为在这篇论文中报道。同样,很可能还有许多进一步的临床有趣的信号,可以通过采取各种数据驱动的方法来检测不寻常的临床活动或NHS数据的全部结果来识别。在我们运行OpenPrescribing.net的经验中,更好地利用数据改进服务的主要障碍是在纯学术的健康数据工作和在服务分析中实际使用数据之间的无用的文化和实践鸿沟。这可以通过使用不同的团队、不同的资助机制、不同的机构和不同的数据基础设施来证明。由于这两个领域的方法、数据和总体目标有很大的重叠,我们希望资助者和委员能够帮助将这些工作结合起来。
未来的研究
这些发现将有助于更广泛的工作计划,其目的是在OpenPrescribing.net上开发一系列互动工具,在个人实践、ccg和其他关键的NHS组织群体(如初级保健网络和综合护理系统)的层面上,提出与国家处方规范存在实质性分歧的候选信号。对于这项基于网络的服务,我们希望在没有进一步证据或指南背景的情况下,大规模地呈现各种各样的信号,作为临床或调试团队积极讨论和进一步探索的触发器,并邀请反馈他们是否发现这些信号有助于发现任何以前未被认识到的改变当地处方实践的机会或理解任何分歧的原因。
结论
我们描述了一种无假设的方法,以确定在临床实践中进行审计和审查的候选人,并举例强调了在英格兰的两个小地理区域中不比例使用的2种非常不寻常的抗精神病药物。
致谢
这项工作得到了牛津大学国家卫生研究所(NIHR)生物医学研究中心的支持,由健康基金会资助(奖励编号7599);NIHR初级保健研究学院资助(奖励编号327);NIHR的患者福利研究项目(批准编号为PB-PG-0418-20036)和NIHR牛津和泰晤士河谷应用研究合作。开放处方项目目前由英国国家医疗服务体系(NHS)资助,国家卫生研究所和健康基金会还为特定主题提供了额外的资金支持。该项目的第一阶段于2015年12月启动,由英格兰西部学术健康科学网络资助。本出版物中表达的观点是作者的观点,不一定是国家卫生研究院、英国国民医疗服务体系或卫生和社会福利部的观点。资助者在研究设计、数据收集、分析和解释中没有任何作用;在报告的写作中;以及发表文章的决定。
数据可用性
这项研究完全使用公开的、公开的数据。处理过的数据可与所有分析代码一起在研究存储库中获得[
].作者的贡献
BG根据SJWE的输入构思了这项研究。HJC和AJW设计了这些方法。HJC和LEMH利用AJW、BMK、RC和BG的方法和解释输入收集和分析数据。HJC、AJW和SCJB都直接访问并验证了NHS商业服务管理局发布的基础数据。所有作者确认他们已经完全访问了研究中的所有数据,并承担提交发表的责任。BMK根据RC、HJC、SJWE、BG、OM和JM的意见起草了手稿。LEMH准备了最终提交的手稿。所有作者都贡献并批准了最终的手稿。SCJB是由DE和PI提供输入的相关网站资源的首席工程师。英国天然气集团负责监督该项目,并担任担保人。
利益冲突
所有作者均已在www.icmje.org/coi_disclosure.pdf上填写ICMJE(国际医学期刊编辑委员会)统一披露表,并声明如下:BG获得了来自Laura和John Arnold基金会、NHS国家健康研究所(NIHR)、NIHR初级保健研究学院、NIHR牛津生物医学研究中心、Mohn-Westlake基金会、NIHR牛津和泰晤士谷应用研究合作、Wellcome信托基金、好思维基金会、英国健康数据研究、健康基金会、世界卫生组织、UKRI、英国哮喘基金会、英国肺部基金会的研究资金,以及国家核心研究计划的纵向健康和福祉链;他还通过为非专业观众就滥用科学发表演讲和写作而获得个人收入。BMK和OM为NHS工作,并借调到贝内特应用数据科学研究所。所有其他牛津大学的作者都在BG的资助下工作。
英格兰东部的哌嗪处方(2017年6月至8月)。
XLSX文件(Microsoft Excel文件),18kb
英格兰西北部的盐酸丙嗪处方(2017年6月至8月)。
XLSX文件(Microsoft Excel文件),18kb参考文献
- Goldacre B, MacKenna B. NHS应该更好地利用医院药品数据。BMJ 2020年7月17日;370:m2607。[CrossRef] [Medline]
- 探索英格兰的处方数据。OpenPrescribing.net。URL:https://openprescribing.net/[2022-10-18]访问
- Croker R, Walker AJ, Bacon S, Curtis HJ, French L, Goldacre B.确定英国NHS处方成本节约的新机制:最小化“单位价格”,一项横断面研究。BMJ公开赛2018年2月08日;8(2):e019643 [免费全文] [CrossRef] [Medline]
- Walker AJ, Curtis HJ, Croker R, Bacon S, Goldacre B.测量开放的基于网络的处方数据分析服务对临床实践的影响:NHS英格兰数据的队列研究。J Med Internet Res 2019年1月16日;21(1):e10929。[CrossRef]
- Croker R, Walker A, Goldacre B.为什么一些实践没有实施新的尿路感染抗生素处方指南?NHS英格兰初级保健的队列研究和调查。《抗菌化学杂志》2019年4月01日;74(4):1125-1132。[CrossRef] [Medline]
- Curtis HJ, Walker AJ, MacKenna B, Croker R, Goldacre B.次优他汀类药物治疗方案处方:英国初级保健趋势和变化的回顾性队列研究。Br J Gen Pract 2020年6月29日;70(697):e525-e533。[CrossRef]
- Aral KD, Güvenir HA, sabuncuo土耳其卢I, Akar AR.一种处方欺诈检测模型。计算方法与程序,2012年4月,106(1):37-46。[CrossRef] [Medline]
- 王林,王志强,王志强。全科医师处方药物的可变性。PLoS One 2018 Feb 20;13(2):e0189599 [免费全文] [CrossRef] [Medline]
- Hirsch O, Donner-Banzhoff N, Schulz M, Erhart M.使用漏斗图和混合效应模型检测和可视化提供商分析中的异常值-以处方索赔数据为例。国际环境与资源公共卫生2018年9月15日;15(9):2015 [免费全文] [CrossRef] [Medline]
- Mordecai L, Reynolds C, Donaldson LJ, de C Williams AC.英格兰初级保健中阿片类药物处方的区域变化模式:一项回顾性观察研究。Br J Gen practical 2018年2月12日;68(668):e225-e233。[CrossRef]
- MacKenna B, Curtis HJ, Walker AJ, Croker R, Bacon S, Goldacre B.甲氨蝶呤不安全处方的趋势和变化:英国NHS初级保健的队列研究。Br J Gen Pract 2020年6月22日;70(696):e481-e488。[CrossRef]
- 比赛中JH。峰度为小样本中的异常值提供了一个很好的综合检验。中国生物化学杂志2007年9月;40(13-14):1032-1036。[CrossRef] [Medline]
- Verma SP, Díaz-González L, Rosales-Rivera M, Quiroz-Ruiz A.蒙特卡罗模拟中四个单一极端离群值不一致性检验的比较性能。科学通报2014;2014:746451 [免费全文] [CrossRef] [Medline]
- 峰度离群值:存储库。GitHub。URL:https://github.com/ebmdatalab/kurtosis-pericyazine[2022-10-18]访问
- 产品特点综述-吡嗪10mg片。Zentiva。URL:https://www.medicines.org.uk/emc/product/3969/smpc[2022-10-18]访问
- 张志刚,张志刚,张志刚,张志刚。Cochrane Database Syst Rev 2014;5:CD007479。[CrossRef]
- 关键字搜索“periyazine .”。PubMed。URL:https://web.archive.org/web/20210823105333/https: / / pubmed.ncbi.nlm .nih.gov / ? = pericyazine&sort =日期[2022-10-18]访问
- 产品特性概述-丙嗪25mg覆膜片。梯瓦英国有限公司,2022年2月16日。URL:https://products.tevauk.com/mediafile/id/52087.pdf[2022-10-31]访问
- 关键字搜索“丙嗪”。PubMed。URL:https://web.archive.org/web/20210823110138/https: / / pubmed.ncbi.nlm .nih.gov / ? = promazine&sort =日期[2022-10-18]访问
- 数据拯救生命:用数据重塑健康和社会护理。英国卫生和社会保障部。URL:https://www.gov.uk/government/publications/data-saves-lives-reshaping-health-and-social-care-with-data[2022-10-18]访问
- Glover农协。学龄儿童扁桃体切除术的发生率。2016年12月06日;31(10):1219-1236。[CrossRef]
- Fisher ES, Wennberg DE, Stukel TA, Gottlieb DJ, Lucas FL, Pinder EL。医疗保险支出地区差异的影响。第一部分:护理的内容、质量和可及性。安实习医学2003 Feb 18;138(4):273-287 [免费全文] [CrossRef] [Medline]
缩写
BNF:英国国家配方 |
20:临床调试组 |
好:国家健康和护理卓越研究所 |
国民健康保险制度:国民保健制度 |
C·洛维斯编辑;提交19.07.22;F莫里亚蒂同行评审;对作者11.09.22的评论;修订本收到14.10.22;接受16.10.22;发表20.12.22
版权©Brian MacKenna, Helen J Curtis, Lisa E M Hopcroft, Alex J Walker, Richard Croker, Orla Macdonald, Stephen J W Evans, Peter Inglesby, David Evans, Jessica Morley, Sebastian C J Bacon, Ben Goldacre。最初发表在JMIR医学信息学(https://medinform.www.mybigtv.com), 20.12.2022。
这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR医学信息学上的原创作品。必须包括完整的书目信息,https://medinform.www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。