JMI JMIR Med Inform JMIR医学信息学 2291 - 9694 卡塔尔世界杯8强波胆分析 加拿大多伦多 v9i4e25035 33720842 10.2196/25035 原始论文 原始论文 使用统一的观察性数据库描述癌症化疗患者的抗癌治疗轨迹和模式:回顾性研究 Eysenbach 冈瑟 班达 胡安 Rusu 露西娅 Hokyun 女士 1 https://orcid.org/0000-0002-6220-4207 生陈 医学博士,女士 2 3. https://orcid.org/0000-0002-5052-6399 Seok云 医学博士 4 https://orcid.org/0000-0002-4995-9912 搜索引擎优化 Seung在 医学博士 5 https://orcid.org/0000-0003-4417-0135 华纳 杰里米·L 医学博士,女士 6 https://orcid.org/0000-0002-2851-7242 Belenkaya Rimma 马女士 7 https://orcid.org/0000-0001-7318-1541 公园 Rae Woong 医学博士 1 2
生物医学信息系 亚洲大学医学院 洪在馆5楼 2004年世界杯,永潼区 京畿道水原市,16499 大韩民国 82 31 219 4471 rwpark99@gmail.com
https://orcid.org/0000-0003-4989-3287
生物医学科学系 亚洲大学医学院 韩国水原京畿道 大韩民国 生物医学信息系 亚洲大学医学院 韩国水原京畿道 大韩民国 预防医学系 延世大学医学院 首尔 大韩民国 血液肿瘤科 亚洲大学医学院 韩国水原京畿道 大韩民国 内科 康东圣心医院 翰林大学医学院 首尔 大韩民国 血液学和肿瘤学分部 医学系 范德比尔特大学医学中心 美国田纳西州纳什维尔 美国 卫生信息学系 纪念斯隆·凯特琳癌症中心 纽约,纽约 美国 通讯作者:Rae Woong Park rwpark99@gmail.com 4 2021 6 4 2021 9 4 e25035 15 10 2020 7 11 2020 12 11 2020 20. 1 2021 ©Hokyun Jeon, Seng Chan You, Seok Yun Kang, Seung In Seo, Jeremy L Warner, Rimma Belenkaya, Rae Woong Park。最初发表于JMIR医学信息学(http://medinform.www.mybigtv.com), 06.04.2021。 2021

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)条款下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品(首次发表在JMIR Medical Informatics上)被适当引用。必须包括完整的书目信息,到http://medinform.www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。

背景

基于真实证据的准确和快速的临床决策对癌症患者至关重要。然而,癌症化疗方案的复杂性阻碍了使用观察性健康数据库的回顾性研究。

客观的

本研究的目的是利用算法确定的化疗时间,比较不同方案类型的抗癌治疗轨迹和临床事件模式。

方法

我们开发了一种算法,从传统观察性医疗结果伙伴关系(OMOP)公共数据模型(CDM)数据库中的用药记录中提取方案级抽象化疗事件。该算法在亚洲大学医学院(AUSOM)数据库中通过人工审查临床记录进行验证。使用该算法,我们从EHR数据库和索赔数据库中提取了患者的化疗事件。我们还开发了一个应用软件,用于可视化基于OMOP-CDM数据库中的治疗事件的化疗治疗模式。使用该软件,我们在两个基于ehr的OMOP-CDM数据库中生成了机构中使用的方案类型的趋势,迭代化疗使用的模式以及癌症治疗的轨迹。作为一项试点研究,使用AUSOM数据库测量化疗引起的中性粒细胞减少症根据方案的发病时间。根据全国索赔数据库,对COVID-19患者的抗癌治疗轨迹进行了可视化。

结果

我们对85种不同方案的结直肠癌、乳腺癌和肺癌患者进行了178,360次治疗。该算法准确识别了400例患者的化疗方案类型(平均阳性预测值>98%)。确定了8236例患者2008-2018年常规临床化疗方案的使用趋势。对于总共12个方案(给予患者比例最大的方案),重复治疗的次数与某些病例的标准化疗方案一致。此外,还显示了包括62例新冠肺炎患者在内的8315例患者的抗癌治疗轨迹。对中性粒细胞减少症的比较分析表明,在结直肠癌治疗方案中,中性粒细胞减少症的发作往往集中在9-15天之间,而在某些乳腺癌或肺癌治疗方案中,中性粒细胞减少症的发作往往集中在2-8天之间。

结论

我们提出了一种生成化疗事件的方法,用于引入OMOP-CDM数据库的肿瘤学扩展模块。这些概念验证研究通过分布式研究网络展示了所提议框架的可用性、可扩展性和互操作性。

抗肿瘤联合化疗方案 电子健康记录 癌症 模式 化疗 数据库 回顾 算法 可伸缩性 互操作性
介绍 背景

在癌症研究中,尽管信息技术最近取得了进步,而且电子健康记录(EHRs)或行政索赔数据库也提供了数据,但除癌症登记外,实际数据的利用相对不足[ 1]。在癌症研究中积极使用电子病历或索赔数据库的主要挑战之一是临床相关结构化数据元素的有限可用性。癌症研究的基本数据元素包括以治疗方案为单位的抗癌治疗记录,而不是治疗方案中使用的单个药物。为了使研究人员获得对癌症患者的治疗方案进行比较研究所需的数据,劳动密集型的预处理是不可避免的[ 2- 4]。

之前的工作

此前,研究人员开发了算法,以取代从用药史中获取化疗细节的人工努力[ 5- 8]。尽管这些研究为在癌症研究中使用真实世界的证据开辟了道路,但它们都没有关注于识别和解决组织障碍。由于不同机构和国家的电子病历或索赔数据库的结构和语义存在异质性,这些研究都没有提供可扩展的框架。

观察性健康数据科学和信息学(OHDSI)协作是一个为全球协作研究而组织的多利益相关方团体,它提供观察性医疗成果伙伴关系(OMOP)公共数据模型(CDM),以促进关于统一观察性数据库的医学研究[ 9]。OHDSI社区的肿瘤学工作组提出了一个肿瘤学模块,以简化收集肿瘤学数据的艰巨任务[ 10]。肿瘤学模块具有填充化疗发作的结构和血液学/肿瘤学词汇[ 11]。然而,尚未提出一种可推广的填充化疗发作的方法,并且涉及使用数据模式的病例很少。

目标

本研究的主要目标是通过开发一种算法来自动识别癌症患者的方案级化疗发作,将肿瘤学扩展无缝引入OMOP-CDM。为了对生成的化疗发作的可用性进行概念验证研究,癌症患者的治疗模式和轨迹由附加软件呈现。根据不同的常规治疗方案,我们还确定了患者中性粒细胞减少事件的发病时间和发生率的差异。

方法 研究设计

本研究由两个主要过程组成:(1)开发从OMOP-CDM数据库中识别抗癌治疗事件的算法;(2)使用可视化软件基于算法衍生的事件记录分析癌症治疗或临床事件的趋势和轨迹。此外,我们进行了一项试点研究,以确定各种化疗方案中中性粒细胞减少的发病时间,以验证该算法的可扩展性。所有方法都独立应用于每个数据库,数据仅以图形摘要的形式收集。

数据源

我们使用韩国两家三级医院的电子病历和韩国全国索赔数据库进行了这项研究。亚洲大学医学院(AUSOM)数据库包括1994-2018年收集的314万名患者的医疗记录[ 12]。康东圣心医院(KDH)数据库包括1986年至2018年收集的168万名患者的医疗记录。健康保险审查和评估服务(HIRA) COVID-19数据集是一个全国性的行政索赔数据库,提供了2017-2020年韩国7590名COVID-19患者的报销保险索赔信息[ 13]。每个数据源都被标准化到OMOP-CDM数据库(版本5.3)中。根据病史和诊断,我们从电子病历数据库中确定了肺癌、乳腺癌和结直肠癌患者。从HIRA COVID-19数据集中,我们选择患有COVID-19和任何恶性肿瘤疾病的患者作为描述性分析的目标。

算法开发 化疗方案提取流程

图1显示了从统一数据库中的药物记录生成化疗事件的整个过程。HemOnc是OMOP-CDM采用的抗癌药物和化疗方案的标准词汇,源自同名wiki页面,包括免费提供的方案和一般信息的医疗资源[ 14]。为了将HemOnc中的语义方案传递给可编程算法,收集方案中详细说明方案的部分并将其转换为参数化值,这些参数化值列出了组成药物以及反映药物时间表的适当时间标准。因此,我们开发了化疗管理的分层描述(HDAC),这是一个机器可读的JavaScript对象表示法(JSON)片段,包含HemOnc的参数化信息。HDAC包含方案组成药物的变量和药物计划时间窗口的时间范围值参数。

我们开发了一个方案级化疗事件记录抽象工具(TRACER)来填充方案级化疗事件抽象( 图2).TRACER通过利用HDAC中的药物条件参数值或时间窗口生成事件。化疗发作包括治疗方案的类型和治疗周期的数量。

化疗发作提取的工作流程示意图。HemOnc(基于web的开源癌症化疗方案数据库)中的1506个方案方案被参数化为JSON结构化数据,称为HDAC。将OMOP-CDM数据库中的JSON文件和单一药物暴露记录实例化为算法的输入数据。TRACER通过利用HDAC的参数来确定化疗期。化疗的发作被安排在发作表中,这是OMOP-CDM中的一个肿瘤学模块。贝芙:贝伐单抗;公共数据模型;FOLFIRI:氟尿嘧啶、亚叶酸素和伊立替康;FOLFOX:氟尿嘧啶、亚叶酸素和奥沙利铂;HDAC:化疗给药分级描述; JSON: JavaScript Object Notation; OMOP: Observational Medical Outcomes Partnership; TRACER: Tool for Regimen-level Abstraction of Chemotherapy Episode Record.

方案级化疗事件记录抽象工具中算法规则的示意图。FOLFOX:氟尿嘧啶、亚叶酸素和奥沙利铂。

化疗方案描述实例化

HDAC包括标准化参数,将方案协议的规格输入算法。HDAC中的变量分为两类:药物组成参数(药物参数)和元参数。

药物参数包括药物标识符(OMOP概念id),它将特定方案与其各自的作用联系起来。每个药物参数都被赋予一个角色,作为索引药物、联合药物或排除药物。HDAC中的指标药物是一种成分药物,可用于识别治疗的第一天(第1天)。HDAC中的联合药物是该方案的组成药物(而不是指标药物)。排斥性药物是指其外观表明另一种治疗方案。例如,奥沙利铂是氟尿嘧啶、亚叶酸钙和奥沙利铂(FOLFOX)方案中的指标药物。亚叶酸素和氟尿嘧啶是联合用药。在本例中,贝伐单抗被认为是一种排除性药物,以区分FOLFOX方案与FOLFOX-贝伐单抗方案( 图2).

元参数包括HDAC文档的元数据(例如,文档的来源、有效日期或无效原因),以确定修改并定义要调整到算法规则的窗口范围。窗口标识药物记录单元,该单元确定药物记录是特定方案的一部分还是区分不同治疗周期的边界。HDAC还规定了插曲的窗口,以区分分开的治疗线。药物方案的概念ID(在HemOnc词汇表中编码)是每个HDAC片段的主键。基于HemOnc网络数据库中的化疗适应症,专家对1506个化疗方案的适应症进行了审查并实例化到HDAC中。

算法定义

TRACER按顺序提取包含在用户设置列表中的方案集。该算法以已定义的规则和参数逐步识别方案的每个治疗周期记录和治疗线事件( 图3).该算法包括以下四个步骤:

相应治疗周期的第1天(索引日期)根据索引药物的分发日期确定。每个索引日期被标记为一个基准点,用于检查其他药物成分的使用,以确定特定的治疗方案。

在HDAC中预先设定的周期窗口内,对联合用药或排除用药的处方进行研究。如果在此期间给予了指标药物和所有联合药物,并且没有开具排除药物,则将指标药物和联合药物的记录作为靶向方案的组成部分。这些记录被抽象为一个疗程记录。

每个事件的开始日期来源于索引用药实例的开始日期,事件记录的结束日期来源于最后一个索引或联合用药的结束日期。生成的片段被收录在OMOP-CDM肿瘤学模块的片段表中。

剧集按时间顺序编号,前提是每集开始日期之间的间隔不超过HDAC中预定义的窗口。当间隔超过周期窗口时,集记录被折叠为相同的集。区分治疗线的窗口也在HDAC中定义。TRACER通过方案类型的变化或基于前一集开始日期的治疗线窗口之外的发作来区分不同的治疗线。

定义化疗方案发作提取算法。FOLFIRI:氟尿嘧啶、亚叶酸素和伊立替康;FOLFOX:氟尿嘧啶、亚叶酸素和奥沙利铂;HDAC:化疗给药分级描述。

算法验证

我们回顾了患者的出院记录和进展记录,以验证所提出算法的准确性。验证了以下方案:(1)氟尿嘧啶+亚叶酸(FULV), (2) FOLFOX,(3)氟尿嘧啶+亚叶酸钙+伊立替康(FOLFIRI),(4)卡培他滨单药治疗。在有算法衍生的目标方案发作记录的患者中,每种方案随机选择100例患者。对于这一人群,我们检查了发作记录,并将其与临床记录进行了比较。

表征治疗模式和轨迹

我们开发了可视化应用程序来描述接受化疗的癌症患者的治疗模式。使用该工具,我们展示了2008-2018年所有化疗方案使用的相对比例。根据方案类型,每个患者的迭代治疗周期数的分布被描绘成热图,颜色饱和度随患者数量的变化而变化。根据癌症类型,对接受常规抗癌治疗的患者的抗癌治疗轨迹也进行了说明。添加了COVID-19患者和癌症患者的轨迹,以验证工具的可扩展性。EHR数据库的描述性结果包括8种最流行的治疗方案类型。对于AUSOM数据库,我们在描述性分析中增加了乳腺癌的激素治疗和肺癌的靶向治疗或免疫治疗。

中性粒细胞减少症发病时间分析

我们还进行了一项初步研究,调查了从第一次化疗发作开始化疗诱导的(发热性)中性粒细胞减少(CIN/FN)事件的时间。中性粒细胞减少症是骨髓抑制化疗的常见不良事件。符合国家癌症研究所不良事件通用术语标准(CTCAE;CIN 4级(绝对中性粒细胞计数[ANC] <0.5 × 109/L)用于鉴别严重CIN事件。FN事件鉴定为ANC <1.0 × 109/L诊断为发热或感染,或任何使用粒细胞集落刺激因子预防。一个图显示了每个中性粒细胞减少事件,以点表示发病日期,在同一个图中,一个小提琴图显示了中性粒细胞减少发病日期的趋势。为了确定中性粒细胞减少事件的发生时间,计算每个患者第一次化疗日期与第一次CIN/FN发作日期之间的间隔。由于总体测量计划为每周,中性粒细胞减少症的发病日期以7天为段进行分类,以显示发病日期的趋势,而不是确定的日期。为了明确单一药物方案对中性粒细胞减少症发病的影响,化疗仅限于一线治疗,仅考虑化疗开始后30天内的CIN/FN事件。化疗当日,ANC水平可能暂时降低;因此,化疗期间的CIN/FN事件被忽略。我们还按方案类型描述了每个周期中CIN/FN事件的发生率。按癌症类型划分,CIN/FN事件发生频率最高的4个方案被纳入发生率图。

统计分析

描述性分析使用从该算法导出的化疗事件进行。为了验证该算法,我们计算了与临床记录中描述的相同方案类型发作的患者比例。计算平均绝对误差(即临床记录中估计周期数与实际记录之间的绝对值的平均值)和均方根误差(即临床记录中估计周期数与实际记录之间的平均值的平方根)。整个系统使用R(版本3.5.2;R Foundation for Statistical Computing)。算法和可视化软件的源代码已上传到GitHub [ 15]。

道德声明

本研究经韩国亚洲大学医院(批准文号:AJIRB-MED-OBS-20-092)和韩国江东圣心医院(批准文号:2017-03-003)机构审查委员会批准。使用HIRA数据的机构审查委员会编号为AJIRB-MED-EXP-20-087。

结果 人口特征

TRACER从AUSOM数据库中共生成了178,360次化疗。包括结直肠癌12种方案类型,乳腺癌24种方案类型(包括6种激素治疗方案),肺癌19种方案类型(包括8种靶向治疗方案)。接受相应治疗方案的患者人数列于 多媒体附录1。AUSOM数据库中患者的特征如下( 表1).在10,353例结直肠癌、9546例乳腺癌和12,671例肺癌病例中,分别有3151例(30.4%)、5568例(58.3%)和1593例(12.5%)患者有治疗记录。接受化疗的患者数量逐年增加。从KDH数据库中提取了总共69,353次化疗。KDH数据库包括2758例结直肠癌患者,其中564例(20.4%)有化疗发作。在KDH数据库中的乳腺癌(n=6420)和肺癌(n=2663)患者中,分别有1075例(16.7%)和642例(24.1%)患者有化疗发作。HIRA COVID-19数据集主要由女性患者组成(60%)[ 13]。在7590例COVID-19患者中,我们发现382例(5%)患者患有原发性恶性肿瘤疾病。

亚洲大学医学院数据库中结直肠癌、乳腺癌和肺癌患者的特征。

患者特点 按癌症类型划分的病人
结直肠癌(N=10,353) 乳腺癌(N=9546) 肺癌(N=12,671)
指数年龄(年),平均值(SD) 62 (13.2) 50 (11.4) 64 (12.7)
性别,n (%)
男性 6116 (59.1) 62 (0.7) 9166 (72.3)
4237 (40.9) 9484 (99.3) 3505 (27.7)
接受化疗的患者数,n (%)
1999 - 2002 265 (2.6) 646 (6.8) 524 (4.1)
2003 - 2006 516 (5.0) 829 (8.7) 617 (4.9)
2007 - 2010 672 (6.5) 965 (10.1) 738 (5.8)
2011 - 2014 852 (8.2) 1373 (14.4) 775 (6.1)
2015 - 2018 912 (8.8) 2111 (22.1) 1127 (8.9)
接受手术的患者人数,n (%) 3760 (36.3) 5541 (58.0) 1776 (14.0)
基线绝对中性粒细胞计数/μL,平均值(SD) 5582 (4403) 3750 (3199) 6517 (5283)
接受化疗的患者数,n (%)
一线治疗 3151 (30.4) 5568 (58.3) 1593 (12.5)
二线治疗 1212 (11.7) 4739 (49.6) 888 (7.0)
三线治疗 506 (4.8) 4005 (41.9) 521 (4.1)
第四道治疗 234 (2.2) 3573 (37.4) 336 (2.6)
TRACER的准确性验证

表2显示了与临床记录相比,算法导出的发作记录的准确性。对于方案类型,FULV方案的阳性预测值超过95%,对于FOLFOX、FOLFIRI和卡培他滨单药治疗的整个发作,化疗类型可以精确估计。在经过验证的方案中,平均85.6%的发作记录正确地推断了治疗周期的数量。发作记录中的周期数与临床记录中描述的周期数的平均差异小于一个周期。

与图表回顾相比,化疗发作的验证。

治疗方案 没有信息,n 阳性预测值a、b方案类型,n/ n (%) 精度c处理周期数,% 平均绝对误差 均方根误差
FULVd 30. 67/70 (95) 94 0.1 0.4
FOLFOXe 8 92/92 (100) 87 0.3 0.6
有效率,f 21 79/79 (100) 89 0.4 1.4
卡培他滨单药治疗 65 35/35 (100) 73 0.7 1.5

一个对于每个方案,随机抽取100例病例并进行审查。30例、8例、21例和65例分别使用FULV、FOLFOX、FOLFIRI和卡培他滨单药治疗的患者在出院总结中没有化疗信息。

b人工比对生成的发作记录与临床笔记内容,匹配病例对方案类型的预测值为阳性。

c人工比较生成的发作记录与临床记录内容的治疗周期数中匹配病例的百分比。

dFULV:氟尿嘧啶和亚叶酸素。

eFOLFOX:氟尿嘧啶、亚叶酸素和奥沙利铂。

fFOLFIRI:氟尿嘧啶、亚叶酸素和伊立替康。

化疗模式

AUSOM数据库中使用的化疗方案的趋势显示在 多媒体附录2。自2016年以来,肺癌化疗方案的数量有所增加,包括靶向抗癌药物(如奥西替尼、塞瑞替尼和克里唑替尼)和免疫疗法(如纳武单抗和派姆单抗)。平均而言,31.2%的患者接受了FOLFOX方案,其次是20.3%的患者接受了FULV方案。截至2012年,接受靶向抗癌药物(如贝伐单抗或西妥昔单抗)化疗的患者比例逐渐增加。他莫昔芬在乳腺癌患者中的使用也逐渐增加。 多媒体附录3显示了KDH数据库中化疗方案使用的趋势。KDH数据库中最常用的结直肠癌治疗方案也是FOLFOX(平均27.3%),其次是FULV,平均23%。自2013年以来,KDH数据库中使用的结直肠癌靶向抗癌药物等方案有所增加。2013-2016年,吉非替尼单药治疗是肺癌最常用的治疗方案,这与AUSOM数据库的趋势相似。在KDH数据库中的乳腺癌患者中,曲妥珠单抗的使用自2014年以来急剧增加。

两个EHR数据库中患者在迭代化疗周期数量上的分布被描绘为热图。在AUSOM数据库的热图中,结肠直肠癌的FULV、FOLFOX和卡培他滨和奥沙利铂(CapeOx)方案中最普遍的重复周期数与HemOnc方案的建议一致(分别为6、12和8个周期; 图4).此外,针对乳腺癌的紫杉醇单药治疗、阿霉素单药治疗以及环磷酰胺和阿霉素(AC)的最普遍的治疗迭代次数也与一般建议一致(某些情况下为4个周期)。“顺铂+长春瑞滨”和“顺铂+培美曲塞”治疗肺癌也符合建议(某些病例为4个疗程)。在KDH数据库中,接受FOLFOX方案的患者中,接受12个周期治疗的结直肠癌患者所占比例最大( 多媒体附录4).总共四种方案——氟尿嘧啶、表柔比星和环磷酰胺(FEC);氟尿嘧啶、阿霉素和环磷酰胺(FAC);环磷酰胺、甲氨蝶呤和氟尿嘧啶(CMF);和taxotere——用于治疗乳腺癌,大多数重复6次,HemOnc的每个方案方案在某些情况下包括6个周期。

亚洲大学医学院数据库中按方案类型进行周期迭代的患者分布热图。(A)结直肠癌,(B)乳腺癌,(C)肺癌患者的数量;治疗迭代计数由颜色饱和度表示,颜色越深表示患者数量越多。小于10例的细胞未见报道。AC:阿霉素和环磷酰胺;CapeOx:卡培他滨和奥沙利铂;FAC:氟尿嘧啶、阿霉素和环磷酰胺;FOLFIRI:氟尿嘧啶、亚叶酸素和伊立替康;FOLFOX:氟尿嘧啶、亚叶酸素和奥沙利铂。

癌症治疗的轨迹

图5显示了AUSOM数据库中肺癌患者的治疗轨迹。在总共1120例患者中,肺切除-放疗-顺铂和长春瑞滨(n=63, 5.6%)是最常见的轨迹。显示结直肠癌或乳腺癌患者的治疗轨迹,无论采用哪种一线治疗( 多媒体附录5).在至少包括三种治疗的结直肠癌或乳腺癌患者的治疗轨迹中,结肠切除术- folfox - folfiri (n= 78,4%)和乳房切除术- ac -紫杉醇单药治疗(n= 235,5%)分别是比例最高的轨迹。根据癌症类型描述的10种最常见的轨迹见 多媒体附录6

亚洲大学医学院肺癌患者抗癌治疗轨迹数据库。肺癌患者的治疗轨迹按照一线治疗的类型进行分类:(A)手术,(B)化疗或放化疗,(C)放疗。每个节点的高度代表相应治疗线或治疗中的患者总数。进展到下一疗程的患者数量用灰线表示。化疗方案的改变或治疗类型之间的过渡被视为治疗线的过渡。标签上的百分比涵盖了同一轨迹线上的患者数量与所有患者的比例。由于大量节点阻碍了图形摘要中可视化的目的,因此节点在第三个节点处被截断。同样的原因,患者计数小于10的淋巴结被切除。亚洲大学医学院;RT:放射治疗。

KDH数据库中患者的治疗轨迹见 多媒体附录7。在结直肠癌患者中,FOLFOX是最常用的一线方案(n=52, 17.9%)和二线方案(n=84, 28.9%)。对于乳腺癌,泰索替是乳房切除术前最常见的一线化疗方案(n=58, 17.3%)。吉非替尼是肺癌患者中最广泛使用的一线方案(n=30, 10.5%)。 图6显示了同时患有COVID-19的恶性肿瘤患者的治疗轨迹。在全国诊断为COVID-19的7590名患者中,我们确定了382名有癌症史的患者。其中62例患者有过一次化疗。大多数患者在2017-2020年期间,即COVID-19感染之前,只接受过一次治疗(n=47)。该轨迹包括6例生命末期的患者。

COVID-19患者的抗癌治疗轨迹。Sankey绘制的2019冠状病毒病患者的治疗轨迹图,包括2017年至2020年间的抗癌化疗。每个节点代表用于癌症治疗的化疗方案。标签上的百分比涵盖了同一轨迹阶段每个节点患者人数的比例。由于大量节点阻碍了图形摘要中可视化的目的,因此节点在第四个节点处被截断。出于同样的原因,患者计数<5的淋巴结被切除。

化疗诱导中性粒细胞减少的时机

图7显示AUSOM数据库中每个患者CIN/FN事件的发病时间。结直肠癌患者中性粒细胞减少的发作集中在第9天至第15天。与用于结直肠癌的方案相比,多西紫杉醇单药治疗和泰索替治疗乳腺癌和卡铂加吉西他滨治疗肺癌后记录的中性粒细胞减少事件通常早一周开始(2-8天)。我们说明了在治疗的每个周期中性粒细胞减少事件的发生率 多媒体附录8。无论癌症类型如何,除了结肠直肠癌的FOLFOX方案和肺癌的卡铂和紫杉醇方案外,第一个周期CIN/FN事件的发生率很高。最后,中性粒细胞减少症在包括阿霉素和多西紫杉醇作为组成药物的泰索帝治疗乳腺癌方案中发生的频率更高(75.3%)。

不同治疗方案中性粒细胞减少症发病时间的变化趋势。亚洲大学医学院对(A)乳腺癌、(B)结直肠癌和(C)肺癌患者首次接受化疗后化疗引起的(发热性)中性粒细胞减少事件的发生时间进行了研究。每个点代表一个不同病人的中性粒细胞减少事件。这些事件以7天为周期进行分类。小提琴图表示每天化疗后的频率变化趋势。AC:阿霉素和环磷酰胺;FAC:氟尿嘧啶、阿霉素和环磷酰胺;FOLFIRI:氟尿嘧啶、亚叶酸素和伊立替康;FOLFOX:氟尿嘧啶、亚叶酸素和奥沙利铂。

讨论 概述

本研究描述了一个基于OMOP-CDM中的肿瘤学扩展模型分析癌症患者治疗模式和轨迹的系统。提出的算法(TRACER)用于提取方案水平的化疗发作,有效地生成癌症患者的治疗发作。这种方法说明了如何用自动提取系统取代人工管理。通过回顾临床记录验证了获得的发作,这表明治疗方案的类型或治疗周期的数量估计具有很高的准确性。我们还通过开展一项调查不同化疗方案中CIN/FN发病时间的试点研究,证明了所提出系统的有效性。

主要研究结果

全面的临床信息,包括纵向治疗序列和癌症患者的各种临床结果,在全国范围内的癌症登记处,如监测、流行病学和最终结果计划中是无法获得的。 16- 18]或韩国中央癌症登记处[ 19 20.]。从电子病历中获得的大规模真实数据[ 21]及行政索偿资料[ 17标准化数据网络可以支持及时评估常规临床实践的特征和质量,以及跨机构或国家的积极药物警戒。

COVID-19的意外快速传播表明,迫切需要及时检索癌症患者的详细数据,为大流行期间癌症患者的管理提供相关证据[ 22]。虽然传统的癌症登记无法向研究人员提供这些数据,但电子病历和索赔数据库的二次使用可以迅速提供有价值的见解,了解新型感染对癌症患者的影响[ 13]。TRACER能够生成记录来描述COVID-19患者的癌症治疗和死亡轨迹,这可能有助于确定癌症治疗与COVID-19致命病例之间的关系。

我们演示了电子捕获的数据元素如何使用纵向详细的临床数据来支持临床研究。FN是最常见的肿瘤急症之一[ 23]并与相当高的发病率和死亡率有关[ 24]。虽然众所周知,在实体瘤或淋巴瘤的第一个化疗周期中,CIN/FN的风险最高[ 25 26],各种方案中CIN/FN发生的确切时间在很大程度上是未知的。我们发现,CIN/FN事件在化疗的第一个周期更频繁,并且多西紫杉醇或阿霉素的方案之后发生了更多的CIN/FN事件,这与报道的结果一致[ 27]。与接受其他方案治疗的患者(7-13天)相比,接受多西他赛或卡铂方案的患者通常发生CIN/FN事件相对较早(2-8天)。

限制

这项研究有几个局限性。首先,只有四种方案通过人工审查得到了验证;因此,目前尚不清楚其他类型方案的发作是否也可以精确估计。然而,治疗周期重复模式显示提取的记录与方案的标准方案一致,表明该算法可以正确解释可变方案。第二个限制是,确定的治疗发作率相对较低(在AUSOM数据库中乳腺癌患者中最高为58%),这表明治疗发作可能被遗漏,尽管许多癌症患者仅接受手术或放疗治疗,本应不被捕获。这可能是因为该算法只提取HemOnc词汇表中包含的方案。HDAC的灵活结构允许为特定方案添加用户定义的规则,有可能通过微调算法减少特定研究中治疗事件的缺失率。

结论

我们开发了一种技术来生成包括在OMOP-CDM肿瘤学模块中的化疗事件,并分析癌症患者的治疗模式。我们证明了所提出的流程在分布式数据网络中是可重复和可扩展的。我们的研究结果表明,从统一的观察数据库中描述治疗轨迹的可推广策略可以迅速确定临床事件的特征,从而能够为突发的大流行危机产生现实世界的证据。需要进一步的研究来为不同方案类型的临床结果提供统计证据。

来自亚洲大学医学院数据库的化疗事件。下面列出了治疗结直肠癌、乳腺癌和肺癌最常用的10种化疗方案。

亚洲大学医学院数据库中化疗方案使用趋势。下图为亚洲大学医学院数据库2008-2018年(A)结直肠癌、(B)乳腺癌、(C)肺癌患者化疗方案使用比例。

康东圣心医院数据库中化疗方案使用趋势。显示了康东圣心医院数据库中2008-2018年(A)结直肠癌、(B)乳腺癌、(C)肺癌患者的化疗方案使用比例。

康东圣心医院数据库中按方案类型进行周期迭代的患者分布热图。(A)结直肠癌,(B)乳腺癌,(C)肺癌患者的数量;处理迭代计数由颜色饱和度差表示。

来自康东圣心医院数据库的化疗方案使用趋势。显示了康东圣心医院数据库中2008-2018年(A)结直肠癌、(B)乳腺癌、(C)肺癌患者的化疗方案使用比例。

亚洲大学医学院数据库中癌症患者的治疗轨迹列表。

康东圣心医院数据库中癌症患者抗癌治疗轨迹。显示了康东圣心医院数据库中(A)结直肠癌、(B)乳腺癌和(C)肺癌患者的治疗轨迹。

治疗周期中性粒细胞减少的发生率。(A)结直肠癌,(B)肺癌,(C)乳腺癌的周期和治疗方案中首次中性粒细胞减少事件发生率的直方图。

缩写 交流

环磷酰胺和阿霉素

非洲国民大会

绝对中性粒细胞计数

AUSOM

亚洲大学医学院

CapeOx

卡培他滨和奥沙利铂

清洁发展机制

通用数据模型

CIN / FN

化疗引起的(发热性)中性粒细胞减少症

CMF

环磷酰胺,甲氨蝶呤和氟尿嘧啶

CRCAE

不良事件的通用术语标准

电子健康档案

电子健康记录

前沿空中管制官

氟尿嘧啶,阿霉素和环磷酰胺

选举委员会

氟尿嘧啶,表柔比星和环磷酰胺

有效率,

氟尿嘧啶,亚叶酸素和伊立替康

FOLFOX

氟尿嘧啶,亚叶酸素和奥沙利铂

FULV

氟尿嘧啶和亚叶酸

HDAC

化疗给药分级描述

希拉

健康保险审查和评估处

JSON

JavaScript对象符号

KDH

康东圣心医院

OHDSI

观察健康数据科学与信息学

OMOP

观察性医疗成果伙伴关系

示踪剂

化疗事件记录的方案级抽象工具

SCY、HJ和RWP对研究设计有贡献。所有作者都参与了本文的撰写和最终审定。这项工作得到了韩国贸易、工业和能源部(MOTIE)资助的生物产业战略技术发展计划(20001234)和韩国卫生技术研发项目(通过韩国卫生和福利部资助的韩国卫生产业发展研究所(KHIDI))的资助(资助号HI16C0992)的支持。JLW由国家癌症研究所资助(批准号CA231840)。

JW拥有HemOnc.org LLC的股权;这种权益没有财务价值。JW是HemOnc本体的首席软件架构师;这个角色是无偿的。HemOnc的开发部分由NIH拨款U24 CA194215支持;U01 CA231840;U24 CA248010。资助者在研究的发展或实施中没有任何作用。

Khozin 年代 布卢门撒尔 通用汽车 Pazdur R 肿瘤学临床证据生成的真实世界数据 美国国立癌症研究所 2017 11 01 109 11 10.1093 / jnci / djx187 29059439 4157738 Bendell JC Bekaii-Saab TS 科恩 艾尔 赫维茨 Kozloff Tezcan H 罗奇 N 妈妈 Y 年代 电影 艾德 中间人 D Grothey 一个 最初接受folfox -贝伐单抗或folfiri -贝伐单抗治疗的转移性结直肠癌患者的治疗模式和临床结果:来自ARIES的结果,一项贝伐单抗观察性队列研究 肿瘤学家 2012 17 12 1486 95 10.1634 / theoncologist.2012 - 0190 23015662 theoncologist.2012 - 0190 PMC3528380 Dasari 一个 Bergsland 埃克 本森 AB B 黄齐的 l Totev T 非洲酪脂树 J 女士 尼瑞 国会议员 Dagohoy CG 毛雷尔 已经 J Kulke MH 现实世界中晚期肺神经内分泌肿瘤的治疗模式和临床结果:一项多中心回顾性图表回顾研究 肿瘤学家 2019 08 24 8 1066 1075 10.1634 / theoncologist.2018 - 0520 30610008 theoncologist.2018 - 0520 PMC6693720 纳德勒 E 莱托 Pavilack 博伊德 Vergara-Silva 一个 费尔南德斯 一个 社区实践环境中转移性非小细胞肺癌患者的治疗模式和临床结果 临床肺癌 2018 07 19 4 360 370 10.1016 / j.cllc.2018.02.002 29576407 s1525 - 7304 (18) 30021 - 4 Bikov 马林斯 CD 密封 B Onukwugha E 汉娜 N SEER-Medicare中转移性结肠癌化疗/生物方案的识别算法 医疗保健 2015 08 53 8 e58 64 10.1097 / MLR.0b013e31828fad9f 23552436 卡罗尔 纳米 Burniece 公里 Holzman J McQuillan DB 一个 Ritzwoller DP 使用结构化电子数据识别系统性癌症治疗的算法 JCO临床癌症信息 2017 11 1 1 9 10.1200 / CCI.17.00002 30657379 PMC7006900 Prodel Lamarsalle l 奥古斯托。 V ATLAS:使用索赔数据库的治疗线的时间序列对齐的鲁棒算法 2019 2019 IEEE生物信息学与计算生物学计算智能会议(CIBCB) 2019年7月9日至11日 意大利锡耶纳 1 8 10.1109 / cibcb.2019.8791467 Weymann D 科斯塔 年代 Regier 利用管理数据代理系统性癌症治疗行数的循环算法的验证 JCO临床癌症信息 2019 08 3. 1 10 10.1200 / CCI.19.00022 31365273 Hripcsak G 杜克大学 JD 沙阿 NH 帝国 CG 溶血性尿毒综合征 V Schuemie 乔丹 Suchard 公园 RW 难闻的 Rijnbeek 公关 帝杰 普拉特 N 诺尔 GN Y 体育 马迪根 D 瑞安 PB 观察健康数据科学和信息学(OHDSI):观察研究人员的机会 Stud健康技术信息 2015 216 574 8 26262116 PMC4815923 Belenkaya R •格利 Dymshyts D Araujo 年代 威廉姆斯 一个 R 帝国 C 使用OMOP CDM肿瘤学模块的标准化观察性癌症研究 Stud健康技术信息 2019 08 21 264 1831 1832 10.3233 / SHTI190670 31438365 SHTI190670 华纳 莱托 Dymshyts D 帝国 CG •格利 乔丹 ·豪切斯那里借得创意 H Moldwin 古银 Belenkaya R 威廉姆斯 AE 个人电脑 HemOnc: OMOP公共数据模型中化疗方案表示的新标准词汇表 J生物医学信息 2019 08 96 103239 10.1016 / j.jbi.2019.103239 31238109 s1532 - 0464 (19) 30158 - 3 PMC6697579 D 埃克 公园 我的 SY 瑞安 P Schuemie 乔丹 胫骨 D 公园 H 公园 RW 韩国某三级教学医院电子病历数据向分布式网络研究通用数据模型的转换及数据质量评估 健康信息中心 2016 01 22 1 54 8 10.4258 / hir.2016.22.1.54 26893951 PMC4756059 燃烧 E SC 塞纳 AG) Kostka K Abedtash H Abrahao MTF Alberga 一个 Alghoul H 肌萎缩性侧索硬化症 O Alshammari TM Areia C 班达 JM J Culhane 交流 达维多夫 一个 DeFalco FJ Duarte-Salles T 杜瓦尔 年代 驯鹰人 T W Golozar 一个 哈丁 J Hripcsak G 溶血性尿毒综合征 V H Y 荣格 CY Kaas-Hansen 废话 Kaduk D 肯特 年代 Y Kolovos 年代 车道 JCE H 林奇 Makadia R Matheny 梅塔 P 莫拉莱斯 博士 Natarajan K 尼伯格 F Ostropolets 一个 公园 RW 公园 J 小波 JD Prats-Uribe 一个 G 帝国 C ρ Y Rijnbeek P Sathappan 先令 LM Schuemie 沙阿 NH Shoaibi 一个 首歌 年代 Spotnitz Suchard Swerdel 旅馆 D Volpe 年代 H 威廉姆斯 AE BB l 甲虫 O Prieto-Alhambra D 瑞安 P COVID-19住院患者的国际特征以及与先前因流感住院患者的比较 medRxiv。 预印本于2020年4月25日在线发布 10.1101 / 2020.04.22.20074336 32511443 PMC7239064 华纳 莱托 考恩 AJ 大厅 交流 个人电脑 HemOnc.org:肿瘤学专业人员的在线协作知识平台 J肿瘤学实践 2015 05 11 3. e336 50 10.1200 / JOP.2014.001511 25736385 JOP.2014.001511 PMC5706141 香港 SC CancerTxPathway GitHub 2020 2020-10-15 https://github.com/ABMI/CancerTxPathway 巴赫 PB Guadagnoli E 施拉格 D Schussler N 沃伦 莱托 患者人口统计学和社会经济特征在SEER-Medicare数据库中的应用和局限性 医疗保健 2002 08 40 8增刊 4 19 10.1097 / 00005650-200208001-00003 12187164 00005650-200208001-00003 Enewold l 帕森斯 H l 马胃蝇蛆 D 里维拉 博士 巴雷特 乔丹 Virnig 英航 沃伦 莱托 SEER-Medicare数据的更新概述:增强的内容和应用 英国国立癌症研究所 2020 05 01 2020 55 3. 13 10.1093 / jncimonographs / lgz029 32412076 5837300 PMC7225666 沃伦 莱托 Klabunde CN 施拉格 D 巴赫 PB 莱利 女朋友 SEER-Medicare数据概述:内容、研究应用和对美国老年人口的普遍性 医疗保健 2002 08 40 8增刊 4 3. 10.1097/01. mlr.0000020942.47004.03 12187163 00005650-200208001-00002 荣格 K 黄ydF4y2Ba Y 香港 H 西文 韩国癌症统计:2016年发病率、死亡率、生存率和患病率 癌症治疗 2019 04 51 2 417 430 10.4143 / crt.2019.138 30913865 crt.2019.138 PMC6473271 胫骨 H 黄ydF4y2Ba Y 荣格 K 香港 H 年代 J 能剧 H J Pisani P 公园 J 区域癌症登记处的成员 1999~2001年全国癌症发病率使用国家癌症发病率数据库的第一个结果 癌症治疗 2005 12 37 6 325 31 10.4143 / crt.2005.37.6.325 19956367 PMC2785938 X l 月亮 年代 亚当森 B 巴喜 年代 美国真实世界临床肿瘤数据库中人群特征的比较:Flatiron Health, SEER和NPCR MedRxiv。 预印本于2020年5月30日在线发布 10.1101 / 2020.03.16.20037143 库德 纳米 Choueiri TK 沙阿 DP Shyr Y 鲁宾斯坦 SM 里维拉 博士 雨水 年代 C 德赛 一个 德利马·洛佩斯 G Grivas P 画家 CA 彼得斯 年代 汤普森 Bakouny Z Batist G Bekaii-Saab T Bilen Bouganim N Larroya MB 可以见到效果 D 德尔Prete SA 朵罗修 DB 伊根 个人电脑 Elkrief 一个 Farmakiotis D 植物区系 D Galsky 医学博士 格洛弗 乔丹 格里菲思 EA Gulati 美联社 古普塔 年代 哈菲兹 N Halfdanarson TR Hawley E Kasi 一个 卡其色 基于“增大化现实”技术 雷蒙 CA 刘易斯 C 洛根 B 大师 T 麦凯 RR 台面 类风湿性关节炎 摩根 正义与发展党 马尔卡希 曼氏金融 Panagiotou 办公自动化 Peddi P Pennell NA 雷诺兹 K 罗森 LR Rosovsky R 萨拉查 施密特 一个 沙阿 SA 沙亚 晶澳 斯坦哈特 J Stockerl-Goldstein 印度 年代 Vinh 直流 赫贝 跳频 韦斯曼 JT Wulff-Burchfield E Z 一个 Zubiri l Mishra 年代 莱曼 “大酒店” BI 华纳 莱托 COVID-19癌症协会 新冠肺炎对癌症患者临床影响(CCC19):一项队列研究 《柳叶刀》 2020 06 20. 395 10241 1907 1918 10.1016 / s0140 - 6736 (20) 31187 - 9 32473681 s0140 - 6736 (20) 31187 - 9 PMC7255743 刘易斯 Hendrickson 亚历山大-伍尔兹 莫伊尼汉 TJ 肿瘤急症:病理生理学、表现、诊断和治疗 癌症J临床 2011 61 5 287 314 10.3322 / caac.20124 21858793 库德 纳米 戴尔 直流 克劳福德 J 中海油服 莱曼 “大酒店” 成人癌症患者发热性中性粒细胞减少症的死亡率、发病率和费用 癌症 2006 05 15 106 10 2258 66 10.1002 / cncr.21847 16575919 Culakova E Thota R Poniewierski 女士 库德 纳米 Wogu 房颤 戴尔 直流 克劳福德 J 莱曼 “大酒店” 美国肿瘤学实践中化疗相关毒性和支持治疗模式:一项全国性前瞻性队列研究 癌症医疗 2014 04 3. 2 434 44 10.1002 / cam4.200 24706592 PMC3987093 克劳福德 J 戴尔 直流 库德 纳米 Culakova E Poniewierski 女士 沃尔夫 D 莱曼 “大酒店” 接受化疗的成年癌症患者中性粒细胞减少事件的风险和时间:一项前瞻性全国肿瘤学实践研究的结果 [J]国家计算机网络 2008 02 6 2 109 18 10.6004 / jnccn.2008.0012 18319047 Lalami Y Paesmans Muanza F 裸线 Plehiers B Dubreucq l Georgala 一个 Klastersky J 关注方案特异性危险因素,我们能否预测发热性中性粒细胞减少患者化疗诱导的中性粒细胞减少的持续时间?回顾性分析 安杂志 2006 03 17 3. 507 14 10.1093 / annonc / mdj092 16322116 s0923 - 7534 (19) 43527 - 8
Baidu
map