原始论文
摘要
背景:数据分析用于识别提示治疗选择或临床结果变化的信号。迄今为止的分析通常集中在假设驱动的方法上。
摘要目的:本研究旨在发展一种无假设的方法来识别初级保健数据中的异常处方行为。我们的目标是将该方法应用于一项横断面研究中的国家数据集,以确定临床调试组(ccg)中使用差异显著的化学品,以进行进一步的临床审查,从而证明优先排序方法的概念。
方法:在这里,我们报告了一种新的数据驱动的方法来识别不寻常的处方行为在初级保健数据。该方法首先应用一组过滤步骤来识别处方率分布可能包含异常值的化学物质,然后应用两种排序方法来识别这些候选物质中最极端的异常值。该方法已应用于三个月的国家处方数据(2017年6月至8月)。
结果:我们的方法按行政区域提供所有化学品的排名。我们提供了两种具有特殊临床意义的抗精神病药物的说明性结果:盐酸丙嗪和pericyazine,这两种药物通过离群指标排名很高。具体来说,我们的方法发现,虽然大多数临床医生很少使用盐酸丙嗪和吡嗪(全国处方率分别为11.1 / 1000和6.2 / 1000抗精神病药),但在研究期间,它们在英国2个小地理区域的抗精神病药处方中占很大比例(最大区域处方率分别为298.7 / 1000和241.1 / 1000抗精神病药处方)。
结论:我们的无假设方法能够在临床实践中确定审计和审查的候选人。为了说明这一点,我们提供了两个例子,两种非常不寻常的抗精神病药物在英格兰的两个小地理区域不成比例地使用。
doi: 10.2196/41200
关键字
介绍
自2011年以来,英国国家卫生服务(NHS)公开分享了详细的月度全科医生处方数据,包括个人剂量、化学品和品牌,并在个人全科医生层面进行汇总。这些数据支持了广泛主题的原始研究,并支持系统审计和审查计划,以实现初级保健处方的改进[
]。我们的团队制作了OpenPrescribing.net [
]是一个免费且广泛使用的工具,任何人都可以在英国的任何诊所查看处方,并监控处方模式,直至个人品牌、配方和剂量的水平。OpenPrescribing提供数据驱动的反馈,以协助区域和实践级药物优化团队,并确定他们可能没有意识到的审查领域。例如,我们确定每个NHS组织是否在超过80个预定义的措施中是一个异常值,这些措施涵盖了一系列处方安全性,成本效益和功效问题。通过比较品牌药或仿制药和配方药,计算出每种做法的独特节约机会[ ,而且有证据表明,这些节约已经实现了[ ]。通常,用于服务审计和质量改进的数据科学是假设驱动的:识别目标行为并使用数据来衡量该目标的实现[
, ]。考虑到公开可用的NHS处方数据的巨大规模(过去十年中覆盖8000个组织的超过20亿行数据)以及该数据集中可能存在的临床行为和护理变化的潜在信号的广泛范围,我们着手开发新的无假设数据科学技术,以确定由护理变化驱动的服务改进的新机会。我们的总体分析目标是建立原型并描述方法,以识别处方数据中先前未知的临床兴趣信号(现有的识别异常值的方法通常侧重于处方的财务方面[
- ]或专注于特定的临床问题[ , ])。我们举办了一系列内部研讨会,以开发一份数据科学方法的简短清单,这些方法可用于识别NHS组织或地区中异常分布的处方行为。在这里,我们简要地报告了一种这样的方法的成功部署(通过峰度和所有化学类对的中间差异之间的比率对化学物质进行排名),并展示了如何在英格兰的两个小地区确定不寻常的抗精神病药物的高处方。方法
研究设计和数据来源
我们使用从OpenPrescribing数据库中提取的2017年6月至8月英格兰全科医生处方的所有配药的开放NHS处方数据进行了一项横断面研究。选择了相对较短的3个月窗口,因为这项工作代表了概念的证明。数据集包括每种做法、产品和处方月份、处方项目数量(相当于每种产品出现在处方表格上的数量)和总数量(例如,片剂和mL)。实践分组由他们的母公司临床调试组(CCG),一个NHS行政区域。在英格兰,2017年约有7000名NHS全科医生被安排在207个ccg中。
数据处理
英国规定的所有化学品都被分配到化学品的“类别”中,使用他们的英国国家配方集(BNF)遗留代码来识别化学品的相关BNF分段。我们将搜索限制在BNF(1511处方化学品)第1-15章中的化学品,以排除不遵循化学/子段落结构的章节,这些章节主要涵盖非医药产品,如敷料。对于每个化学品类别对,每种化学品的处方数量(类似于处方数据中的处方)表示为其类别中所有化学品的总处方项目的比例。计算每个CCG的这些化学类比例值。为了避免包括很少被规定的化学品类别,从而产生虚假的发现,我们排除了116种总规定项目最少的化学品(特别是最低的两个百分位数)和4种使用少于50个ccg的化学品。总共有1395种化学物质需要分析。
通过离群指标对化学类对进行排序
我们首先试图将分析重点放在那些具有(1)合理变异性和(2)ccg中正异常值的分布特征的化学品上(即,处方率较高的异常值而不是处方率较低的异常值):过滤范围>10%且偏度>0的化学类对。这确定了412种感兴趣的候选化学物质。为了进一步细化这组化学品,我们只保留了以下候选药物:(1)中位数比例<0.1,即大多数ccg以非常低的比率开处方,或者根本没有开处方;(2)全国处方数量并不小(至少1000张处方),以限制少量处方随机波动的影响。这些进一步的过滤步骤将候选清单减少到204种化学物质。
然后,我们实施了两种替代排名方法来识别候选化学品中的异常值。第一个是峰度,它可以被描述为一个给定分布的尾部比正态分布重或轻的程度的数值度量;总体而言,高峰度的数据集往往比低峰度的数据集有更多的极端异常值。峰度是检测数据集中未知数量的异常值的好方法[
, ]。我们计算了所有ccg中每个候选化学类对的峰度,并根据该峰度值对化学物质进行了排序(从高到低)。然后,我们使用一个比率来生成化学品的替代排名,该比率计算为第95和97个百分位(最高处方ccg)与第50和95个百分位(那些处方率较适中的ccg)之间的化学类比例的百分位数范围;这个比率以后将被称为“高:中百分位比率”。这两种方法对所有化学品进行排序,对于排名最高的化学品,ccg之间在该化学品在所有同类化学品的所有处方中使用的程度上存在非常大的差异。该排序用于临床工作人员(BMK, RC, OM和BG)手动评估化学类对的优先级,以获得临床感兴趣的信号。
使用Choropleth地图可视化处方率
对于选定的临床感兴趣的化学类对,我们使用OpenPrescribing.net生成了一个choropleth地图,以可视化每种化学药物在其类别中所占比例的处方地理分布。使用Python和Google BigQuery进行数据管理,使用Python进行分析(作者HJC和LEMH)。数据和图表,以及所有用于数据管理和分析的代码都可以在GitHub上公开查看和重用[
]。道德的考虑
本研究只使用公开的数据;因此,不需要伦理批准。
结果
共有204种化学品被发现具有处方率分布,表明在英格兰NHS行政区域之间的正异常值。
总结了这些化学物质的高、中百分位比和峰度值。通过任何异常值测量排名前5位的化学品都被突出显示。通过对这些结果的临床回顾,确定了两种化学物质:盐酸丙嗪(高:中百分位比:1.804,峰度:43.61)和pericyazine(高:中百分位比:0.880,峰度:49.60)。这两种抗精神病药物是中高百分位比排名前2位的化学药品,也是峰度排名前10位的化学药品(分别为第9位和第7位)。
对这些化学物质进行更详细的研究后发现,在英格兰东部,吡嗪的使用率要高得多(
),在277,470份(4.7%)抗精神病药物处方中,有13,119份使用了pericyazine,而在全国范围内,2,489,069份(0.6%)的抗精神病药物处方中有15,344份使用了pericyazine。OpenPrescribing的地图显示,这种高水平的处方尤其集中在诺维奇和诺福克地区,范围更广( 一个; )。盐酸丙嗪在英格兰西北部的处方剂量较高( ),在412,624份(4.9%)抗精神病处方中占20,060份,而在全国2,489,069份(1.1%)抗精神病处方中占27,724份。同样,这些异常的处方行为集中在特定的ccg:博尔顿和更广泛的大曼彻斯特地区( B; )。![](https://asset.jmir.pub/assets/958bdab94abaf6ca622988fbc0af9147.png)
地区 | 抗精神病药物,n | Pericyazine | 丙嗪盐酸盐 | ||
规定,n | 每1000人 | 规定,n | 每1000人 | ||
东米德兰兹 | 188593年 | 155 | 0.8 | 1088 | 5.8 |
英格兰东部 | 277470年 | 13119年 | 47.3 | 381 | 1.4 |
肯特,萨里和苏塞克斯 | 189490年 | 192 | 1.0 | 334 | 1.8 |
伦敦北部、中部和东部 | 151108年 | 84 | 0.6 | 122 | 0.8 |
北东 | 162212年 | 96 | 0.6 | 620 | 3.8 |
西北 | 412624年 | 315 | 0.8 | 20060年 | 48.6 |
伦敦西北部 | 89949年 | 5 | 0.1 | One hundred. | 1.1 |
伦敦南部 | 124296年 | 103 | 0.8 | 127 | 1.0 |
南西 | 209838年 | 306 | 1.5 | 131 | 0.6 |
泰晤士河谷 | 75489年 | 10 | 0.1 | 163 | 2.2 |
威塞克斯 | 121442年 | 104 | 0.9 | 276 | 2.3 |
西米德兰兹郡 | 246907年 | 580 | 2.3 | 3951 | 16.0 |
约克郡和亨伯河 | 239651年 | 275 | 1.1 | 371 | 1.5 |
所有 | 2489069年 | 15344年 | 6.2 | 27724年 | 11.1 |
![](https://asset.jmir.pub/assets/1b96573e45dc1032d79760257c059af4.png)
讨论
总结
使用无假设的方法,我们将数据科学技术应用于国家数据集以识别异常值。根据随后的临床审查,确定了两种不寻常的抗精神病药物,在全国范围内使用非常有限,在英格兰的两个小地理区域非常常用。具体来说,在全国所有抗精神病药物处方中,pericyazine仅占0.6%(2489069张中的15344张),但在诺里奇,它占所有抗精神病药物处方的24.1%(21553张中的5197张);盐酸丙嗪占全国所有抗精神病药物处方的1.1%(248969张中的27724张);然而,在博尔顿,它占所有抗精神病药物处方的29.9%(18,577人中有5549人)。
优势和劣势
这项研究是一个实用和探索性方法的概念证明,并且仍然在优化度量和参数的迭代开发中。因此,我们认识到,我们用来对这里描述的化学类对进行排序的指标存在局限性。例如,产生的排名可能会产生误导,因为少数ccg位于特定化学品的处方者之下,从而夸大了同一化学品在其他领域的异常状态。此外,在处方数量较少的情况下,变异性的影响尚不清楚,尽管我们确实试图通过去除处方量特别低的化学品来减轻这种影响。然而,我们并没有将这项工作作为离群值检测的独立方法;相反,我们将其作为一种优先考虑和专注于手动临床审计和审查的方法。
我们的研究确实涵盖了相当短的一段时间(2017年6月至8月),这也是因为它是一个概念证明。然而,使用的OpenPrescribing数据集确实包括了英国所有典型实践中的所有处方,从而最大限度地减少了获得偏倚样本的可能性。此外,使用我们的方法确定的化学品确实是进一步调查的合法目标;不幸的是,我们对这项工作的报告以及随后对这些处方异常值原因的调查被COVID-19大流行打断。
背景调查结果
Pericyazine很少用于精神分裂症和严重焦虑、精神运动性躁动、暴力或危险冲动行为的短期辅助治疗[
]。在英国临床指南的主要来源——国家健康与护理卓越研究所(NICE)网站上的任何指南中都没有提到pericyazine。2014年Cochrane对pericyazine的一篇综述只发现了5项适合纳入的研究,由于证据质量较低,无法确定pericyazine在精神分裂症中的作用,并且发现与非典型抗精神病药物相比,其副作用发生率更高[ ]。PubMed搜索发现只有73篇出版物包含“pericyazine”这个词[ 相比之下,氟哌啶醇有超过2.2万个结果,利培酮有1.1万个结果。盐酸丙嗪获准用于治疗老年人的精神运动性躁动和躁动或不安[ ]。在任何NICE指南中都没有提到它,并且仅在1355篇PubMed记录中出现[ (在1964年达到顶峰)。据我们所知,在此之前的研究中,没有使用数据科学技术以无假设的方式系统地识别任何给定治疗选择或临床结果的异常值。政策影响及诠释
我们只报告了这两个小地区与国家处方规范存在重大偏差的事实,并没有直接评论在任何单个患者或一般患者中使用这些药物的适当性。本研究的范围不包括进行详细的定性或其他研究,以了解这两种不同寻常的抗精神病药物在这两个地区大量使用的原因;然而,我们注意到盐酸丙嗪和pericyazine先前分别出现在大曼彻斯特和诺福克的治疗处方中。此外,值得注意的是,抗精神病药物通常是在二级护理中开始的,而处方则在一般实践中被接受。
卫生和社会保障部最近就一项利用数据改善保健服务和结果的雄心勃勃的计划进行了咨询[
]。使用数据来识别临床活动和结果的变化是很早就建立起来的[ , ], NHS最近的旗舰项目,如RightCare和Getting it Right First Time,都专注于识别和解决护理中的差异。然而,这些方法通常依赖于传统方法,即由临床医生或专员前瞻性地定义理想的临床活动或结果,然后通过分析相关数据来衡量依从性。这是极不可能的,这些传统的方法将永远识别不寻常的处方行为报告在这篇论文。同样,很可能还有许多进一步的临床有趣的信号,可以通过采取各种数据驱动的方法来检测NHS数据中不寻常的临床活动或结果来识别。根据我们运行OpenPrescribing.net的经验,更好地利用数据来改善服务的主要障碍是,在纯粹的健康数据学术工作和在服务分析中实际使用数据之间存在无益的文化和实践鸿沟。一般来说,这可以通过使用不同的团队、不同的资助机制、不同的机构和不同的数据基础设施来例证。由于这两个领域的方法、数据和总体目标在很大程度上重叠,我们希望资助者和专员能够帮助将这些工作结合起来。
未来的研究
这些发现将有助于更广泛的工作计划,其目的是在OpenPrescribing.net上开发一系列互动工具,以在个人实践、ccg和其他关键NHS组织组(如初级保健网络和综合保健系统)的层面上,为与国家处方规范存在实质性差异的候选信号提供兴趣。对于这项基于网络的服务,我们希望大规模地呈现各种各样的信号,而不需要进一步的证据或指南背景,作为临床或调试团队积极的本地讨论和进一步探索的触发器,并邀请他们反馈信号是否有助于识别以前未被认识到的改变当地处方实践的机会或理解任何分歧的原因。
结论
我们描述了一种无假设的方法来确定临床实践中审计和审查的候选人,并强调了在英格兰两个小地理区域不成比例地使用两种非常不寻常的抗精神病药物的例子。
致谢
这项工作得到了牛津国立卫生研究所(NIHR)生物医学研究中心的支持,得到了卫生基金会的资助(奖励参考号7599);国家卫生研究院初级保健研究学院资助(奖励参考号327);由英国国立卫生研究院的“患者福利研究计划”(资助参考编号PB-PG-0418-20036)和英国国立卫生研究院牛津和泰晤士河谷应用研究合作组织资助。开放处方项目目前由英国国家医疗服务体系(NHS)资助,国家卫生研究所(National Institute for Health Research)和卫生基金会(Health Foundation)为特定主题提供额外资金支持。该项目的第一阶段将于2015年12月启动测试,由英格兰西部学术健康科学网络资助。本出版物中表达的观点仅代表作者的观点,不一定代表英国国家卫生研究院、英国国民健康服务体系或卫生与社会保障部的观点。资助者在研究设计、数据收集、分析和解释中没有任何作用;在撰写报告时;并决定将文章提交发表。
数据可用性
这项研究只使用公开的数据。此外,在研究存储库中还可以获得处理过的数据以及所有分析代码[
]。作者的贡献
BG根据SJWE的意见构思了这项研究。HJC和AJW设计了方法。HJC和LEMH收集并分析了AJW, BMK, RC和BG提供的方法和解释输入的数据。HJC、AJW和SCJB都直接访问并验证了NHS商业服务管理局发布的底层数据。所有作者确认他们对研究中的所有数据有完全的访问权,并承担提交发表的责任。BMK起草了RC、HJC、SJWE、BG、OM和JM的稿件。LEMH准备了最后提交的手稿。所有作者都参与并批准了最终稿件。SCJB是相关网站资源的首席工程师,并得到了DE和PI的输入。BG监督该项目,并作为担保人。
利益冲突
所有作者已在www.icmje.org/coi_disclosure.pdf上填写ICMJE(国际医学期刊编辑委员会)统一披露表,并声明如下:BG获得了以下机构的研究资助:劳拉和约翰·阿诺德基金会、NHS国家卫生研究所(NIHR)、NIHR初级保健研究学院、NIHR牛津生物医学研究中心、Mohn-Westlake基金会、NIHR牛津和泰晤士河谷应用研究合作、惠康基金会、良好思维基金会、英国健康数据研究、健康基金会、世界卫生组织、UKRI、英国哮喘基金会、英国肺科基金会、以及国家核心研究项目的纵向健康和福祉项目;他还通过为外行听众发表关于滥用科学的演讲和写作获得个人收入。BMK和OM为NHS工作,并借调到贝内特应用数据科学研究所。所有其他牛津大学的作者都是由BG资助的。
英格兰东部的伯利亚辛处方(2017年6月- 8月)。
XLSX文件(Microsoft Excel文件),18kb
2017年6 - 8月英格兰西北部盐酸丙嗪处方分析
XLSX文件(Microsoft Excel文件),18kb参考文献
- NHS应该更好地利用医院药物数据。中国医学杂志2020年7月17日;370:m2607。[CrossRef] [Medline]
- 探索英格兰的处方数据。OpenPrescribing.net。URL:https://openprescribing.net/[2022-10-18]访问
- Croker R, Walker AJ, Bacon S, Curtis HJ, French L, Goldacre B.新机制以确定英国NHS处方中的成本节约:最小化“单位价格”,一项横断面研究。BMJ Open 2018 Feb 08;8(2):e019643 [j]免费全文] [CrossRef] [Medline]
- Walker AJ, Curtis HJ, Croker R, Bacon S, Goldacre B.基于开放网络的处方数据分析服务对临床实践的影响:基于NHS英格兰数据的队列研究。医学与互联网杂志,2019,16;21(1):e10929。[CrossRef]
- Croker R, Walker A, Goldacre B.为什么有些做法不执行新的尿路感染抗生素处方指南?英国国家医疗服务体系初级保健队列研究与调查。中国生物医学工程学报(英文版);39(4):1145 - 1145。[CrossRef] [Medline]
- Curtis HJ, Walker AJ, MacKenna B, Croker R, Goldacre B.次优他汀类药物治疗方案的处方:英国初级保健趋势和变化的回顾性队列研究。[J]中国医药工程学报,2009,29(6):525- 533。[CrossRef]
- 张建军,张建军,张建军。一种处方欺诈检测模型。计算机工程学报,2012,31(1):37-46。[CrossRef] [Medline]
- Bucholc M, O'Kane M, Ashe S, Wong-Lin K.全科医生药物处方变异性。公共科学图书馆,2018;13(2):e0189599 [j]免费全文] [CrossRef] [Medline]
- Hirsch O, Donner-Banzhoff N, Schulz M, Erhart M.利用漏斗图和混合效应模型检测和可视化提供者分析中的异常值——以处方索赔数据为例。国际环境与公共卫生杂志,2018,Sep 15;15(9):2015 [J]免费全文] [CrossRef] [Medline]
- Mordecai L, Reynolds C, Donaldson LJ, de C Williams AC.英格兰初级保健阿片类药物处方的区域差异模式:回顾性观察研究。中国生物医学工程学报,2018,30(6):559 - 563。[CrossRef]
- 马凯娜,Curtis HJ, Walker AJ, Croker R, Bacon S, Goldacre B.甲氨蝶呤不安全处方的趋势和变化:英国NHS初级保健队列研究。中国生物医学工程学报,2016,30(6):888 - 888。[CrossRef]
- 比赛中JH。峰度为小样本中的异常值提供了一个很好的综合检验。中国生物医学工程杂志,2007;30(3):332 - 336。[CrossRef] [Medline]
- Verma SP, Díaz-González L, Rosales-Rivera M, Quiroz-Ruiz A.蒙特卡罗模拟中四个单极端异常值不一致检验的比较性能。科学通报,2014;44 (4):662 - 662 [J]免费全文] [CrossRef] [Medline]
- 峰度异常值:库。GitHub。URL:https://github.com/ebmdatalab/kurtosis-pericyazine[2022-10-18]访问
- 产品特性综述-百里亚嗪10mg片。Zentiva。URL:https://www.medicines.org.uk/emc/product/3969/smpc[2022-10-18]访问
- Matar H, Almerie M, Makhoul S, Xia J, Humphreys P. Pericyazine治疗精神分裂症。Cochrane Database system, 2014;5:CD007479。[CrossRef]
- 关键词搜索“pericyazine.”。PubMed。URL:https://web.archive.org/web/20210823105333/https: / / pubmed.ncbi.nlm .nih.gov / ? = pericyazine&sort =日期[2022-10-18]访问
- 产品特性概述-丙嗪25mg薄膜包衣片。梯瓦英国有限公司,2022年2月16日。URL:https://products.tevauk.com/mediafile/id/52087.pdf[2022-10-31]访问
- 关键字搜索“promazine”。PubMed。URL:https://web.archive.org/web/20210823110138/https: / / pubmed.ncbi.nlm .nih.gov / ? = promazine&sort =日期[2022-10-18]访问
- 数据拯救生命:用数据重塑健康和社会保健。英国卫生和社会保障部。URL:https://www.gov.uk/government/publications/data-saves-lives-reshaping-health-and-social-care-with-data[2022-10-18]访问
- Glover农协。学龄儿童扁桃体切除术的发生率。医学进展,2016,31(10):1219-1236。[CrossRef]
- 李建军,李建军,李建军,李建军。医疗保险支出地区差异的影响。第1部分:护理的内容、质量和可及性。中华医学杂志2003年2月18日;38(4):273- 273 [j]免费全文] [CrossRef] [Medline]
缩写
BNF:英国国家处方集 |
20:临床调试组 |
好:国家健康和护理卓越研究所 |
国民健康保险制度:国民保健制度 |
C·洛维斯编辑;提交19.07.22;由莫里亚蒂进行同行评审;对作者的评论11.09.22;修订版本收到14.10.22;接受16.10.22;发表20.12.22
版权©Brian MacKenna, Helen J Curtis, Lisa E M Hopcroft, Alex J Walker, Richard Croker, Orla Macdonald, Stephen J W Evans, Peter Inglesby, David Evans, Jessica Morley, Sebastian C J Bacon, Ben Goldacre。最初发表于JMIR医学信息学(https://medinform.www.mybigtv.com), 2022年12月20日。
这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)条款下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品(首次发表在JMIR Medical Informatics上)被适当引用。必须包括完整的书目信息,到https://medinform.www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。