发表在gydF4y2Ba在gydF4y2Ba7卷gydF4y2Ba,3号gydF4y2Ba(2019)gydF4y2Ba:Jul-SepgydF4y2Ba

本文的预印本(早期版本)是可用的gydF4y2Bahttps://preprints.www.mybigtv.com/preprint/13554gydF4y2Ba,第一次出版gydF4y2Ba。gydF4y2Ba
急性髓系白血病的核心数据元素:一个基于统一医学语言系统的语义分析和专家的审查gydF4y2Ba

急性髓系白血病的核心数据元素:一个基于统一医学语言系统的语义分析和专家的审查gydF4y2Ba

急性髓系白血病的核心数据元素:一个基于统一医学语言系统的语义分析和专家的审查gydF4y2Ba

原始论文gydF4y2Ba

1gydF4y2Ba明斯特大学医学信息学研究所,德国明斯特gydF4y2Ba

2gydF4y2Ba明斯特大学医学系的一个医院,德国明斯特gydF4y2Ba

通讯作者:gydF4y2Ba

朱利安Varghese医学博士,摩根士丹利资本国际(MSci)gydF4y2Ba

医学信息学研究所gydF4y2Ba

明斯特大学gydF4y2Ba

研究所毛皮Medizinische Informatik明斯特gydF4y2Ba

Albert-Schweitzer-Campus 1gydF4y2Ba

明斯特,48149gydF4y2Ba

德国gydF4y2Ba

电话:49 2518354714gydF4y2Ba

电子邮件:gydF4y2Bajulian.varghese@uni-muenster.degydF4y2Ba


背景:gydF4y2Ba癌症领域如急性髓系白血病(AML),大量的数据元素是来自不同机构和异构数据定义在一个病人身上。临床数据的缺乏阻碍了跨机构协调电子数据交换和未来的荟萃分析。gydF4y2Ba

摘要目的:gydF4y2Ba本研究旨在确定和协调共同的语义核心数据元素(cd)在临床常规和研究文档,根据现有文件系统元数据的分析模型。gydF4y2Ba

方法:gydF4y2Ba列出相关的数据项的收集和审查两个大学医院的血液学家关于常规文档和几个AML的病例报告形式的临床试验。此外,现有的注册中心和包括国际建议。数据项被编码的医学概念通过统一医疗语言系统(uml)由一个医生和审查由另一个医生。的基础上编码的概念,概念重叠的数据来源进行了分析和识别最常见的概念。最常见的概念被实现为数据元素在临床操作数据模型的标准化格式的数据交换标准的财团。gydF4y2Ba

结果:gydF4y2Ba共有3265名医学概念,其中1414是独一无二的。在1414独特的医学概念,50个最频繁的覆盖26.98%的概念出现在收集AML文档。前100名的概念代表39.48%的概念的出现。实现可用的cd是一个欧洲研究基础设施,可以下载不同的格式重用在不同的电子数据采集系统。gydF4y2Ba

结论:gydF4y2Baresearch-intense信息管理是一个复杂的过程相关联的疾病实体AML和大量的实验室诊断和不同的治疗方案。我们系统UMLS-based分析显示核心数据集和一个模范的存在可重用的实现统一数据捕获是可用在一个元数据存储库。gydF4y2Ba

地中海JMIR通知2019;7 (3):e13554gydF4y2Ba

doi: 10.2196/13554gydF4y2Ba

关键字gydF4y2Ba



背景gydF4y2Ba

医疗文档是复杂和耗时。在常规文档,它占大约25%的医生的工作量,要求尽可能多的时间直接病人护理gydF4y2Ba1gydF4y2Ba和更多的研究情况gydF4y2Ba2gydF4y2Ba]。所有患者急性髓系白血病(AML)治疗在研究中,专家小组建议后(gydF4y2Ba3gydF4y2Ba]。AML患者的数量相对较低的发病率约为3.7每100000人在欧洲gydF4y2Ba4gydF4y2Ba]。5年生存率低于50%gydF4y2Ba4gydF4y2Ba]。诊断和治疗组成复杂、重复的实验室分析不同的标本在不同的时间点,化疗周期和计划,供搜索和选择,干细胞移植,免疫抑制疗法,重复的后续检查,整个年的生存和持续的监控。这些都是表现在不同的网站在德国,欧洲,和在世界范围内,根据医院的设施、供体选择、学习小组等。文档过程的复杂性是显而易见的。2016年,有4 AML在德国学习小组,即gydF4y2BaAML Kooperative GruppegydF4y2Ba,gydF4y2Ba德意志Studieninitiative LeukamiegydF4y2Ba,gydF4y2BaAML研究小组gydF4y2Ba,gydF4y2BaOstdeutsche Studiengruppe毛皮Hamatologie OnkologiegydF4y2Ba。欧洲白血病网络(ELN)包含60多个参与研究中心。2016年,有85成年人持续对AML II或III期试验中列出欧盟临床试验登记德国整个欧洲(236试验)。gydF4y2Ba

临床试验文档本身通常是广泛的和费时的gydF4y2Ba5gydF4y2Ba]。在临床试验中,超过1000的项目,如实验室值,收集每个病人生命体征,诊断测试(gydF4y2Ba6gydF4y2Ba]。的页面数量,以防报表(crf)试验已从55到180在过去的年gydF4y2Ba5gydF4y2Ba]。研究助理受聘重返常规数据手动控,虽然自动比较和转换与较小的限制(在技术上是可行的gydF4y2Ba7gydF4y2Ba]。在我们的例子中,德国的技术助理填写transplant-specific形式Zentrales Knochenmarkspender-Register毛皮死德意志和欧洲社会的血液和骨髓移植(EBMT)与常规数据。研究数据来自控研究联盟的白血病(SAL)转移到萨尔手动注册。这种方法容易出错。由于AML的发病率相对较低,没有质量管理或认证过程是常见的其他实体,如乳腺癌、前列腺癌、结肠癌、或其他癌症。gydF4y2Ba

如今,特殊文档助理采用常规数据转移到软件工具等gydF4y2BaONDISgydF4y2Ba的行政区域,用于Kassenarztliche Vereinigung Westfalen-Lippe。两个大学诊所坐落在这个地区参与这项工作。ONDIS作为一个完整的案例文档的工具和质量管理主要实体肿瘤的表现,但也用于AML,据我们所知,没有其他的选择在市场上提供的出口和流行病学癌症登记处的数据转移。gydF4y2Ba

2013年,里斯et al (gydF4y2Ba8gydF4y2Ba)表示,没有一个现有的德国癌症数据集满足临床文档的现实,即使他们已经用作癌症基础文档,由德国法律要求。据我们所知,有两个数据集在德国,实现一个由法理社会der Epidemiologischen Krebsregister在德国业务,另一个由其德国Tumorzentren (ADT)。他们成立于2008年,2014年修订,正在进行修改。今天,有特殊数据集乳腺癌、前列腺癌、结肠癌、神经胶质瘤,和其他一些癌症,但没有白血病。2018 ADT核心数据集本身并不反映基本实体肿瘤癌症没有表现,比如AML。因此,似乎不存在核心数据集AML的文档。gydF4y2Ba

的布局和内容形式,无论文档上下文,组织,或中等,主要是作为特定组织的知识产权。这适用于标准形式的常规文档在医院,控在临床和流行病学研究由学习小组表演,形式的国家和国际注册中心注册。他们并不对公众开放gydF4y2Ba9gydF4y2Ba]。此外,文档的模式是不同的。病人护理形式通常包括自由文本元素,而临床试验文档结构在一个更高的水平gydF4y2Ba2gydF4y2Ba]。如果信息的重用潜力一般高于原始数据记录在一个结构化的方式gydF4y2Ba10gydF4y2Ba,gydF4y2Ba11gydF4y2Ba]。gydF4y2Ba

文档在不同文档上下文的冗余水平很高(gydF4y2Ba5gydF4y2Ba]。甚至德国卫生部已经认识到,收集大量的数据冗余和成本效益分析是值得推荐的gydF4y2Ba12gydF4y2Ba]。橡皮,数字化的纸质形式不仅可以减少对医生的工作负载在他们的日常生活减少冗余文档(gydF4y2Ba13gydF4y2Ba),但通常也会提高结构化文档的方法,促进提高可访问性、互操作性、和数据分析gydF4y2Ba14gydF4y2Ba]。正在进行的研究的互操作性的标准不同的文档解决方案是很重要的和有价值的标准化结构化文档(gydF4y2Ba13gydF4y2Ba)和二次使用的数据,例如,在研究的范围(gydF4y2Ba15gydF4y2Ba- - - - - -gydF4y2Ba17gydF4y2Ba]。结构化文档通过使用通用数据元素(cd)可以提高数据质量和数据共享gydF4y2Ba18gydF4y2Ba]。详细信息的收集每一个AML情况下患者监测是至关重要的gydF4y2Ba19gydF4y2Ba]。之前的研究已经显示,好处,可以实现如果所有病人的文档语义注释在乳腺癌和前列腺癌gydF4y2Ba2gydF4y2Ba]。gydF4y2Ba

目标gydF4y2Ba

这项工作的目的是寻找cd的AML在临床常规文件,注册表和研究。它关注的方法来创建和提供标准文档和cd。它扩展了以前的骨髓白血病的关键数据元素的集合,它经历了由几个血液学家(临床评价gydF4y2Ba13gydF4y2Ba]现在专注于特定数据项AML基于更大的数据集。gydF4y2Ba

医学概念语义标识符编码文档所需的医疗信息的一个项目。项目gydF4y2Ba病人的性能状态gydF4y2Ba例如,编码的概念gydF4y2BaECOG性能状态,uml C1520224gydF4y2Ba。通过添加的数据类型和可能的值的概念,创建cd的列表(gydF4y2Ba20.gydF4y2Ba]。这个列表是使用文档不同的上下文和协调促进改善健康信息系统之间的互操作性。gydF4y2Ba

系统分析是进行一组不同的形式收集的作者和语义丰富使用统一医疗语言系统(uml)代码gydF4y2Ba21gydF4y2Ba]。AML文档的集合包含集从2德国大学医院、国际临床AML研究由3个学习小组,国家和国际注册表单,和一个事实上的国际标准民族解放军(此前发布的gydF4y2Ba3gydF4y2Ba]。gydF4y2Ba

文档形式的比较的基础上,解决以下问题:gydF4y2Ba

  1. 什么是最常用的医学概念在AML的文档吗?gydF4y2Ba
  2. 度做登记,日常,临床试验文档代表或满足ELN标准?gydF4y2Ba
  3. 做常规到什么程度、临床试验和注册文档重叠?gydF4y2Ba
  4. 做日常文档的设置不同的医院(波鸿和明斯特)有何不同?做数据集注册到什么程度相互匹配(EBMT和SAL) ?gydF4y2Ba

数据收集gydF4y2Ba

不同文档上下文的AML被确定基于先前的报道来表示各种常规和研究文档AML [gydF4y2Ba13gydF4y2Ba中列出的)gydF4y2Ba表1gydF4y2Ba。gydF4y2Ba

收集2015年12月至2016年10月之间的形式进行。总共2大学医院提供他们的电子程序文档形式和我们选择11放电letters-reviewed血液学家和被视为代表产品和完整的文档集合的情况下之前的24个月。他们匿名分析开始之前。总的来说,15例行实验室报告等文档形式,病史,诊断发现,和干细胞移植的医院都是收集和手动对放电相比信件。总共8注释。此外,2学习小组从德国和荷兰提供完整的控7国家或国际研究。此外,3注册不同的大小确定了通过一个基于网络的查询和通过联系hematologist-oncologists。他们的形式收集。所有权利持有人同意的形式和部分的分析形式是公开的。所有文件被2 hematologist-oncologists熟悉AML检查完整性疗法,文档和研究。gydF4y2Ba表1gydF4y2Ba显示了不同的文档上下文的形式被分配到和他们的数量。gydF4y2Ba

表1。在每个领域文档上下文和形式。gydF4y2Ba
文档上下文gydF4y2Ba 数量的来源gydF4y2Ba
常规文档gydF4y2Ba 11全面、放电字母代表2大学医院(常规BOgydF4y2Ba一个gydF4y2Ba+常规女士gydF4y2BabgydF4y2Ba);15形式的常规文档2大学医院(8语义注释)gydF4y2Ba
注册表gydF4y2Ba 2 (EBMTgydF4y2BacgydF4y2Ba,萨尔gydF4y2BadgydF4y2BaamlgydF4y2BaegydF4y2Ba)gydF4y2Ba
研究gydF4y2Ba 3(132年HOVON所有病例报告形式gydF4y2BafgydF4y2Ba,AML-AZAgydF4y2BaggydF4y2Ba,AMLSG 21-13gydF4y2BahgydF4y2Ba)gydF4y2Ba
质量测量gydF4y2Ba 没有(不存在)gydF4y2Ba
建议官员协会gydF4y2Ba 1(欧洲白血病网络推荐(gydF4y2Ba3gydF4y2Ba])gydF4y2Ba

一个gydF4y2BaBochum-Langendreer常规波:大学医院。gydF4y2Ba

bgydF4y2Ba程女士:明斯特大学医院。gydF4y2Ba

cgydF4y2BaEBMT:欧洲社会寄存器的血液和骨髓移植。gydF4y2Ba

dgydF4y2Ba萨尔:白血病研究联盟。gydF4y2Ba

egydF4y2BaAML:急性髓系白血病。gydF4y2Ba

fgydF4y2BaHOVON 132: Haemato肿瘤学基础的成年人在荷兰,132年研究。gydF4y2Ba

ggydF4y2BaAML-AZA:一项随机、多中心II期临床试验评估的有效性5-azacytidine添加到标准的主要治疗老年AML患者进行明斯特大学。gydF4y2Ba

hgydF4y2BaAMLSG 21-13: Deutsch-Osterreichische Studiengruppe Akute Myeloische Leukamie, 21-13学习。gydF4y2Ba

‎gydF4y2Ba
图1所示。创建通用数据元素的过程。AML:急性髓系白血病;ODM:操作数据模型;MDM:医疗数据模型;uml:统一医学语言系统。gydF4y2Ba
把这个图gydF4y2Ba

数据分析gydF4y2Ba

语义注释形式gydF4y2Ba

在说明了整个过程gydF4y2Ba图1gydF4y2Ba。所有收集到的文档模型(见gydF4y2Ba表1gydF4y2Ba)被映射到操作数据模型(ODM),临床数据交换标准定义的财团(CDISC)。医疗门户数据模型(MDM-Portal) [gydF4y2Ba22gydF4y2Ba)作为Web框架创建使用ODM ODM文件编辑器(明斯特大学)(gydF4y2Ba6gydF4y2Ba)规范输入表单和手动添加语义编码表单项目。从uml语义编码选择meta-thesaurus医学专家,基于现有的编码原则(gydF4y2Ba23gydF4y2Ba]。医学概念被手动提取放电信件,自然自由文本信件,然后用uml语义注释代码。编码原则表明,pre和postcoordinated代码每项选择。如果没有precoordinated代码是用于一个医学概念,postcoordination被认为是。项目与无医疗相关数据(如gydF4y2Ba页码gydF4y2Ba)或无关紧要的内容等gydF4y2Ba其他gydF4y2Ba,gydF4y2Ba指定gydF4y2Ba,或gydF4y2Ba进一步的评论gydF4y2Ba被忽略了。gydF4y2Ba

半自动的分析gydF4y2Ba

手动UMLS-coded ODM形式被上传到MDM-Portal和公开。第二个评论,随后UMLS-experienced医生确保编码的质量概念。医生之间的分歧在编码进行了讨论关于编码原则(gydF4y2Ba23gydF4y2Ba)和频率rate-assisted MDM-Portal ODM编辑器使用。编码的ODM形式分析CDEGenerator [gydF4y2Ba13gydF4y2Ba,gydF4y2Ba24gydF4y2Ba),内部实现基于java的Web应用程序。CDEGenerator自动排序医学概念(如药物)现有的数据项根据其频率(通过计算相同的uml代码),也显示了相似的医学概念基于postcoordinated代码重叠的概念,例如,gydF4y2Ba药物治疗开始日期gydF4y2Ba类似于gydF4y2Ba药物治疗结束日期gydF4y2Ba,作为主要的概念gydF4y2Ba药物治疗gydF4y2Ba是相同的。最常见的初始列表医学概念和概念之间的重叠生成所有不同形式。gydF4y2Ba

代常见的数据元素gydF4y2Ba

列表的最频繁的医学概念是由CDEGenerator通过分析所有ODM文件和计算相同的uml代码。概念语义相似(如出生日期/年龄、性别或性,和以前的恶性肿瘤/历史)被分组为一个基于专家的决定。通过添加到每个医疗概念其数据类型和可能的值,例如,codelist项目,一个医学概念也表示一个数据元素(gydF4y2Ba20.gydF4y2Ba]。条理清楚地记录数据元素(例如,收缩压和舒张压)被分为项组。数据元素将被添加到结果集的cd,如果发生至少两次在标准中列出的所有来源或者发表的民族解放军(gydF4y2Ba3gydF4y2Ba]。列表是由一位医学专家检查,以避免丢失任何冗余或重要的医学概念。所有cd和项目组织被映射到文档类别和实现为标准化CDISC-ODM文件并上传到MDM-Portal科学讨论和重用。gydF4y2Ba

两两比较的文档上下文gydF4y2Ba

成对比较不同文档的上下文可以在不同的基地:(1)不同的上下文,如常规的比较和临床试验文档彼此;(2)比较不同来源相同的上下文,如不同的起源/医院的常规文档;(3)之间的重叠ELN标准和其他上下文如常规和临床试验合并在一起。gydF4y2Ba

CDEGenerator是用来识别常见的概念不同来源或上下文和输出百分比重叠的概念。gydF4y2Ba


概述gydF4y2Ba

识别常用的医学概念的语义核心程序和研究文档AML,共有3265名医学概念出现可以UMLS-coded发现其中3245 (99.38%)。后的第二个UMLS-experienced医生,27(0.83%)给予不同的uml概念编码一致的决定。1414年在所有概念出现,独特的医学概念。下一节详细介绍了概念出现的频率。gydF4y2Ba

累积频率gydF4y2Ba

在1414个独特的医学概念,50个最频繁的医学概念覆盖26.98%的概念出现在收集AML文档。前100名的概念代表39.48%的概念出现。gydF4y2Ba图2gydF4y2Ba显示的累积频率。gydF4y2Ba

‎gydF4y2Ba
图2。累积频率覆盖所有不同的概念。50个最常见的概念覆盖大约27%的概念出现,和100年的最频繁的概念覆盖大约39.5%的概念出现。gydF4y2Ba
把这个图gydF4y2Ba

统一医疗语言系统术语和急性髓系白血病gydF4y2Ba

约1% (m = 20)相关的医学概念,没有足够的uml代码可以分配,比如codelist以下的东西:gydF4y2Ba匹配相关的捐赠gydF4y2Ba,gydF4y2Ba匹配无关供体gydF4y2Ba,gydF4y2Ba不匹配的无关供者gydF4y2Ba,gydF4y2BaHLA相同的兄弟姐妹gydF4y2Ba,gydF4y2BaHLA相同的父gydF4y2Ba,gydF4y2Ba2个或更多的抗原不匹配相关的捐赠者gydF4y2Ba(所有属于骨髓移植捐献者)。关于移植物抗宿主病状态等项目gydF4y2Ba决心基线gydF4y2Ba,gydF4y2Ba解决与后遗症gydF4y2Ba,gydF4y2Ba持续的CTCAE品位较高gydF4y2Ba人失踪。由于这些概念的复杂性,对这些概念postcoordination并不适用于避免信息丢失。此外,某些AML-specific词汇也缺失或可能代表uml术语。的gydF4y2Ba人肿瘤分类gydF4y2Ba例如,一个uml代码而不是gydF4y2Ba谁AML分类gydF4y2Ba。uml的概念也失踪后数据库的研究:gydF4y2BaEBMT风险评分gydF4y2Ba,gydF4y2Ba集群的爆炸gydF4y2Ba,gydF4y2Ba−gydF4y2Ba7 q / 7问突变gydF4y2Ba,gydF4y2Ba造血细胞Transplantation-Comorbidity指数(HCT-CI)gydF4y2Ba。一些医学概念有两个不同的代码,例如gydF4y2BaC1516728gydF4y2Ba- - - - - -gydF4y2Ba常见的术语标准的不良事件gydF4y2Ba和gydF4y2BaC3888020gydF4y2Ba- - - - - -gydF4y2Ba常见的术语标准的不良事件gydF4y2Ba,即使是相同的概念。gydF4y2Ba

代常见的数据元素gydF4y2Ba

cd的生成实现了通过计算绝对频率的uml代码在所有收集和注释形式。至少2项代表不同来源是cd的添加到列表中。uml规范只有1单文档源被排除在外,即使重复使用。gydF4y2Ba图2gydF4y2Ba概述文档的类别。所有的cd都实现为CDISC-ODM MDM-Portal与开放获取文件和可用。门户提供了一个数量的转换,如搬运工(研究电子数据捕获)模型和HL7 FHIR (Health Level 7快医疗资源的互操作性)问卷(gydF4y2Ba25gydF4y2Ba]。gydF4y2Ba

我们可以表明,cd出现在所有医疗类别在病人治疗课程。cd存在从始至终的治疗(gydF4y2Ba图3gydF4y2Ba)。gydF4y2Ba

最常用的所有文档上下文的概念gydF4y2Ba疾病的反应gydF4y2Ba。gydF4y2Ba表2gydF4y2Ba展示了一个列表的20个最cd与AML相关治疗,subconcepts,绝对频率概念,和文档上下文的概念出现在。gydF4y2Ba

前30名实验室分别提出的概念gydF4y2Ba表3gydF4y2Ba,类似于gydF4y2Ba表2gydF4y2Ba。手动过滤不具体的数据元素,例如,gydF4y2Ba患者出生日期gydF4y2Ba,gydF4y2Ba性别gydF4y2Ba,gydF4y2Ba患者姓名gydF4y2Ba。所有概念的完整列表中找到gydF4y2Ba多媒体附录1gydF4y2Ba。根据临床数据交换标准实现的数据元素Consortium-Operational数据模型格式是可用的(gydF4y2Ba25gydF4y2Ba]。gydF4y2Ba

‎gydF4y2Ba
图3。文档的通用数据元素(cd)的急性髓系白血病患者。每个圆圈都代表一个文档类别的cd。圆的面积对应类别的数据元素的数量。例如,有45实验室血液面板中的数据元素,代表最大的文档类别。总共212 cd被确定。App.-based成岩作用。:Apparatus-based诊断(如超声和心电图)。gydF4y2Ba
把这个图gydF4y2Ba
表2。前20名的最频繁的频率绝对概念分类的概念。gydF4y2Ba
概念和subconceptsgydF4y2Ba 文档类别gydF4y2Ba ACFgydF4y2Ba一个gydF4y2Ba 文档上下文gydF4y2Ba



例程gydF4y2Ba 注册gydF4y2Ba 研究gydF4y2Ba 民族解放军gydF4y2BabgydF4y2Ba标准gydF4y2Ba
疾病的反应/缓解状态:完全缓解;与不完整的血液恢复完全缓解;局部反应;完整的细胞遗传学缓解;完整的缓解分子;抗疾病;部分缓解复发/复发;和死亡在发育不全gydF4y2Ba 处理细节gydF4y2Ba 42gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba
处理状态:许多疗法自上次访问;治疗以外的一项研究中,姑息+治疗结束后;病人开始协议处理;周期治疗/行动;当前的治疗;额外的治疗自去年跟进;治疗给予自去年报告;疾病治疗(或其他类型的细胞除了供者细胞输注治疗);治疗疾病;和计划(HSCT前计划gydF4y2BacgydF4y2Ba发生)+目前的疗法gydF4y2Ba 处理细节gydF4y2Ba 24gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2BadgydF4y2Ba
不良事件:不良事件;不良事件数量;不良事件指标;和不良事件的描述gydF4y2Ba 处理细节gydF4y2Ba 16gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba
血小板移植:移植日期;血小板自给自足;和血小板> x mg / dLgydF4y2Ba 处理细节gydF4y2Ba 12gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba
中性粒细胞移植:移植日期;中性粒细胞自给自足;和中性粒细胞> x mg / dLgydF4y2Ba 处理细节gydF4y2Ba 11gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba
化疗周期gydF4y2Ba 处理细节gydF4y2Ba 12gydF4y2Ba - - - - - -gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba
伴随药物gydF4y2Ba 处理细节gydF4y2Ba 11gydF4y2Ba - - - - - -gydF4y2Ba - - - - - -gydF4y2Ba - - - - - -gydF4y2Ba - - - - - -gydF4y2Ba
诊断:谁gydF4y2BaegydF4y2Ba分类;工厂gydF4y2BafgydF4y2Ba分类;诊断日期;和第一次诊断gydF4y2Ba 体检/跟进gydF4y2Ba 27gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba
病人表现状态:Karnofsky指数和ECOGgydF4y2BaggydF4y2Ba性能状态gydF4y2Ba 体检/跟进gydF4y2Ba 19gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba
伴随疾病/合并症:合并症;基线伴随疾病;和并发严重和/或不受控制的状态gydF4y2Ba 体检/跟进gydF4y2Ba 17gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba
第二恶性肿瘤/其他肿瘤:以前的肿瘤疾病的历史;先前存在的实体瘤(化疗需要);继发性恶性肿瘤;和第二原发恶性肿瘤gydF4y2Ba 体检/跟进gydF4y2Ba 16gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba
死因gydF4y2Ba 体检/跟进gydF4y2Ba 10gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba
诊断日期gydF4y2Ba 体检/跟进gydF4y2Ba 13gydF4y2Ba - - - - - -gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba
生存状态:活着;死了;和未知(失访)gydF4y2Ba 体检/跟进gydF4y2Ba 12gydF4y2Ba - - - - - -gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba
骨髓疾病的表现gydF4y2Ba 体检/跟进gydF4y2Ba 15gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba
怀孕gydF4y2Ba 体检/跟进gydF4y2Ba 12gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba
药物毒性gydF4y2Ba 体检/跟进gydF4y2Ba 12gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba
HSCT细节:HSCT-indicator;HSCT-type;移植的日期;与捐赠者;和嵌合现象gydF4y2Ba 骨髓移植gydF4y2Ba 16gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba
之前的化疗/放疗,抗肿瘤的协议:一年的化疗/放疗;化疗药物;和放射治疗规范gydF4y2Ba 病史gydF4y2Ba 11gydF4y2Ba - - - - - -gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba - - - - - -gydF4y2Ba
伴随药物gydF4y2Ba 处理细节gydF4y2Ba 11gydF4y2Ba - - - - - -gydF4y2Ba - - - - - -gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba

一个gydF4y2BaACF:绝对频率概念;n = 1057。gydF4y2Ba

bgydF4y2Ba民族解放军:欧洲白血病网络。gydF4y2Ba

cgydF4y2BaHSCT:人类干细胞移植。gydF4y2Ba

dgydF4y2Ba数据元素没有在文档中表示上下文。gydF4y2Ba

egydF4y2Ba谁:世界卫生组织。gydF4y2Ba

fgydF4y2Ba工厂:French-American-British-Classification。gydF4y2Ba

ggydF4y2BaECOG:东部合作的肿瘤组织。gydF4y2Ba

表3。最常见的实验室的前30名的概念按绝对频率的概念。gydF4y2Ba
概念和subconceptsgydF4y2Ba 文档类别gydF4y2Ba ACFgydF4y2Ba一个gydF4y2Ba 文档上下文gydF4y2Ba



例程gydF4y2Ba 注册gydF4y2Ba 研究gydF4y2Ba 民族解放军gydF4y2BabgydF4y2Ba标准gydF4y2Ba
血小板的血液水平gydF4y2Ba 实验室:血液面板gydF4y2Ba 13gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba
血胆红素水平gydF4y2Ba 实验室:血液面板gydF4y2Ba 13gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba
血小板的血液水平gydF4y2Ba 实验室:血液面板gydF4y2Ba 13gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba
白细胞计数/白细胞gydF4y2Ba 实验室:血液面板gydF4y2Ba 12gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba
GPTgydF4y2BacgydF4y2Ba 实验室:血液面板gydF4y2Ba 11gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba
血型gydF4y2Ba 实验室:血液面板gydF4y2Ba 11gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2BadgydF4y2Ba
血清肌酐gydF4y2Ba 实验室:血液面板gydF4y2Ba 10gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba
Lactat脱氢酶gydF4y2Ba 实验室:血液面板gydF4y2Ba 9gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba
印度卢比gydF4y2BaegydF4y2Ba/快速gydF4y2Ba 实验室:血液面板gydF4y2Ba 9gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba
血红蛋白gydF4y2Ba 实验室:血液面板gydF4y2Ba 9gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba
aPTTgydF4y2BafgydF4y2Ba 实验室:血液面板gydF4y2Ba 7gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba
碱性磷酸酶gydF4y2Ba 实验室:血液面板gydF4y2Ba 7gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba
得到了gydF4y2BaggydF4y2Ba 实验室:血液面板gydF4y2Ba 7gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba
尿酸gydF4y2Ba 实验室:血液面板gydF4y2Ba 7gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba
细胞遗传学检查gydF4y2Ba 实验室:细胞学、细胞遗传学、细胞化学gydF4y2Ba 13gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba
爆炸细胞/爆炸gydF4y2Ba 实验室:细胞学、细胞遗传学、细胞化学gydF4y2Ba 15gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba
骨髓检查gydF4y2BahgydF4y2Ba 实验室:细胞学、细胞遗传学、细胞化学gydF4y2Ba 13gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba
单核细胞gydF4y2Ba 实验室:细胞学、细胞遗传学、细胞化学gydF4y2Ba 11gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba
淋巴细胞gydF4y2Ba 实验室:细胞学、细胞遗传学、细胞化学gydF4y2Ba 10gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba
CD34gydF4y2Ba我gydF4y2Ba积极性gydF4y2Ba 实验室:细胞学、细胞遗传学、细胞化学gydF4y2Ba 10gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba
奥氏小体棒gydF4y2Ba 实验室:细胞学、细胞遗传学、细胞化学gydF4y2Ba 9gydF4y2Ba - - - - - -gydF4y2Ba - - - - - -gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba
集群的爆炸gydF4y2Ba 实验室:细胞学、细胞遗传学、细胞化学gydF4y2Ba 9gydF4y2Ba - - - - - -gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba
染色体组型gydF4y2Ba 实验室:细胞学、细胞遗传学、细胞化学gydF4y2Ba 8gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba
嗜酸性粒细胞gydF4y2Ba 实验室:细胞学、细胞遗传学、细胞化学gydF4y2Ba 8gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba
嗜碱粒细胞gydF4y2Ba 实验室:细胞学、细胞遗传学、细胞化学gydF4y2Ba 7gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba
早幼粒细胞gydF4y2Ba 实验室:细胞学、细胞遗传学、细胞化学gydF4y2Ba 7gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba
晚幼粒细胞gydF4y2Ba 实验室:细胞学、细胞遗传学、细胞化学gydF4y2Ba 7gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba
巨细胞病毒gydF4y2BajgydF4y2Ba积极性gydF4y2Ba 实验室:infectiologygydF4y2Ba 10gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba
Ebbstein-Barr病毒积极性gydF4y2Ba 实验室:infectiologygydF4y2Ba 8gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba - - - - - -gydF4y2Ba
尿蛋白gydF4y2Ba 实验室:验尿gydF4y2Ba 7gydF4y2Ba ✓gydF4y2Ba - - - - - -gydF4y2Ba ✓gydF4y2Ba ✓gydF4y2Ba

一个gydF4y2BaACF:绝对概念的频率。gydF4y2Ba

bgydF4y2Ba民族解放军:欧洲白血病网络。gydF4y2Ba

cgydF4y2BaGPT:谷氨酸丙酮酸氨基转移酶。gydF4y2Ba

dgydF4y2Ba数据元素没有在文档中表示上下文。gydF4y2Ba

egydF4y2Ba印度卢比:国际标准化比率。gydF4y2Ba

fgydF4y2BaaPTT:局部血栓形成质激活时间。gydF4y2Ba

ggydF4y2Ba有:谷氨酸草酰乙酸的转氨酶。gydF4y2Ba

hgydF4y2BaSubconcepts:骨髓穿刺;骨髓样本;骨髓抽样日期;和骨髓检查。gydF4y2Ba

我gydF4y2BaCD34:集群分化34。gydF4y2Ba

jgydF4y2Ba巨细胞病毒:Cytomegalie病毒。gydF4y2Ba

表4。重叠的成对文档上下文(A, B)。gydF4y2Ba
一个gydF4y2Ba |gydF4y2Ba一个gydF4y2Ba|gydF4y2Ba BgydF4y2Ba |gydF4y2BaBgydF4y2Ba|gydF4y2Ba | |一个∩BgydF4y2Ba | |∩B / | |, %gydF4y2Ba | |∩B / B | |, %gydF4y2Ba
临床试验文档gydF4y2Ba 752年gydF4y2Ba 常规文档gydF4y2Ba 250年gydF4y2Ba 116年gydF4y2Ba 15.43gydF4y2Ba 46.40gydF4y2Ba
临床试验文档gydF4y2Ba 752年gydF4y2Ba 注册表gydF4y2Ba 428年gydF4y2Ba 117年gydF4y2Ba 15.56gydF4y2Ba 27.34gydF4y2Ba
临床试验文档gydF4y2Ba 752年gydF4y2Ba 民族解放军gydF4y2Ba一个gydF4y2Ba标准gydF4y2Ba 154年gydF4y2Ba 70年gydF4y2Ba 9.31gydF4y2Ba 45.45gydF4y2Ba
ELN标准gydF4y2Ba 154年gydF4y2Ba 常规文档gydF4y2Ba 250年gydF4y2Ba 46gydF4y2Ba 29.87gydF4y2Ba 18.40gydF4y2Ba
ELN标准gydF4y2Ba 154年gydF4y2Ba 注册表gydF4y2Ba 428年gydF4y2Ba 36gydF4y2Ba 23.38gydF4y2Ba 8.41gydF4y2Ba
注册表gydF4y2Ba 428年gydF4y2Ba 常规文档gydF4y2Ba 250年gydF4y2Ba 83年gydF4y2Ba 19.39gydF4y2Ba 33.20gydF4y2Ba
波鸿程gydF4y2Ba 112年gydF4y2Ba 常规明斯特gydF4y2Ba 138年gydF4y2Ba 106年gydF4y2Ba 94.64gydF4y2Ba 76.81gydF4y2Ba

一个gydF4y2Ba民族解放军:欧洲白血病网络。gydF4y2Ba

重叠分析成对比较的文档上下文gydF4y2Ba

表4gydF4y2Ba显示重叠的结果分析。常规文档(250独特的概念),临床试验文档(752独特的概念),注册(428独特的概念),与民族解放军标准的比较(154独特的概念)和显示重叠的9%到46%。gydF4y2Ba

比较常规和临床试验文档gydF4y2Ba

临床试验文档包含752种不同的医疗的概念,而常规文档包含250的概念。此外,46.4%的项目在常规文档中还发现临床试验文档。当然,等项目gydF4y2Ba研究网站标识符/医院IDgydF4y2Bauml C2825164代码中发现研究和注册文档而不是常规文档。更多therapy-specific物品,如gydF4y2Ba不良事件gydF4y2BaC0877248概念,只能发现临床试验文档中。与此同时,一个的存在gydF4y2Ba骨髓表现gydF4y2BaC1868812自然是巨大的医疗利益,因此可以发现在所有领域,存在于所有这些文档。gydF4y2BaEBV-positivitygydF4y2BaC0014644,gydF4y2Batoxoplasmose-positivitygydF4y2BaC0040558或gydF4y2Bac反应蛋白gydF4y2BaC0201657相关大学医院的常规文件但没有包括crf的临床试验。gydF4y2Ba

临床试验文件和注册表gydF4y2Ba

分析了注册中心在428年这项工作使用不同的概念。重叠的临床试验相关文档(752)和注册是15.5%临床试验相关文档和27.3%的注册中心。近三分之一的注册表的数据可以在临床试验文档中找到。gydF4y2Ba伴随药物gydF4y2BaC2347852相关但未提及在临床试验注册中心。再一次,gydF4y2BaEBV-positivitygydF4y2BaC0014644被发现在所有注册中心和常规文档中但没有研究。gydF4y2Ba

对比欧洲白血病与注册网络标准gydF4y2Ba

通过比较ELN标准的注册中心(428)(154),23.3%对注册中心和8.4%的重叠关于ELN标准被发现。这是最低的重叠分析表现在这项研究中发现。管理和组织项目缺少民族解放军的标准。考试往往只提到的标准,但是他们的详细的医学概念,并不是所有的上市为例,gydF4y2Ba血红蛋白gydF4y2BaC0019046中可以找到所有文档字段而不是民族解放军的标准。这也适用于条目相关的治疗。注册中心主要集中在长期等方面疾病的病因或结果/跟踪并更具体therapy-relevant实验室参数。的概念,如血液血红蛋白浓度在注册表中没有提及,但高重要性的疾病的诊断和治疗。gydF4y2Ba

比较常规文档2医院gydF4y2Ba

最后,大学医院的常规文件Bochum-Langendreer和明斯特大学医院的比较,和常规文档包括112年和138年的医学概念,分别。分别的重叠是94.6%和76.8%。这个金额最高的重叠分析本研究。物品如C0019196 C0019159,代表丙型肝炎/积极性,只有一部分在一个2医院的常规文档。这同样适用于gydF4y2Ba肺动脉栓塞gydF4y2BaC2826333,gydF4y2Ba血气分析gydF4y2BaC0005800或gydF4y2Ba氯gydF4y2BaC0008203。gydF4y2Ba

比较的临床试验和欧洲白血病网络标准gydF4y2Ba

将近一半的医学概念的国际标准的文档中找到的临床试验。超过700临床试验文档包括医学概念,4倍大约150欧洲白血病网络标准的医学概念。gydF4y2Ba

对比欧洲白血病网络标准和程序文档gydF4y2Ba

常规文档中,约三分之一的民族解放军的项目标准的代表。五分之一的常规文档条目在ELN标准。例如,gydF4y2Ba出生日期/年龄gydF4y2BaC1704632常规文档和民族解放军中提到的标准。gydF4y2Ba血型gydF4y2BaC0005810,gydF4y2Ba重量gydF4y2BaC0005910,gydF4y2Ba镁gydF4y2BaC0364745常规文档中提到但无法ELN标准。gydF4y2Bat (v; 11) (v; q23处)突变gydF4y2BaC1515810,gydF4y2Ba非特异性酯酶gydF4y2BaC0054741或gydF4y2Ba之前接触有毒代理人gydF4y2BaC0014412发现标准而不是常规文档。gydF4y2Ba


主要研究结果gydF4y2Ba

文档AML的复杂和耗时。肿瘤疾病有复杂的治疗选择,复杂的化疗方案,通常需要准备和干细胞移植的性能。此外,癌症需要匹配文档在德国法律准则和建议。大多数患者在治疗研究武器会导致进一步的文档。不同医疗机构参与文档的过程。的detailed analysis performed in this study could clearly show that the content of AML documentation is often quite redundant. Clinical trial documentation and routine documentation overlap by 42.6%. By establishing interfaces between those documentation contexts, information once gathered could be automatically synced. This clearly reduces the documentation effort.Across all documentation contexts in AML, a basic dataset of 50 CDEs was found to amount for 43.7% of all different medical concepts used. This relatively small number of items could be used as a core dataset. Reusing this semantically annotated dataset would reduce redundancy and costs when it would be made available to all documentation fields for automatic export. In practice, a dynamic database continuously updated with the most recent values of the CDEs could become source for automatic extraction of elements for other documentation arms such as registries, clinical trial documentation, and others. As a small practical example, requesting therapeutic drug levels could work in just 1 click. Today, it is often necessary to fill out forms with病人体重gydF4y2Ba,gydF4y2Ba年龄gydF4y2Ba,gydF4y2Ba性别gydF4y2Ba,gydF4y2Ba肾脏测试值gydF4y2Ba手动。大规模、高百分比的临床试验文档可以自动填写。想象你的手机自动完成/完成的功能。它能增强你填写具体形式和网站更快和更方便的通过预测可能的值,给你选择这些选项。完成模拟特定的数据在电子健康记录是可行的cd的基地。同时,标准化和质量保证也会变得更容易执行,因为文档的透明度。gydF4y2Ba

我们可以表明,几乎整个复杂的医疗实体的语义注释是可行的,通过一个注释率超过98%。语义注释标志着不同,明确医疗文档项目的意义。因此,他们提高数据集成和交换的可能性gydF4y2Ba14gydF4y2Ba,gydF4y2Ba18gydF4y2Ba]。统计工具应用到一个带注释的数据集可以帮助识别丢失的或单独的医学概念。孤独的物品可能是过时的。作为一个例子,在我们的工作中,概念gydF4y2BaEBV-positivitygydF4y2Ba被提及在常规文档和注册但不/不更多的兴趣研究(研究文档)。想更进一步,为重用数据语义注释可以打开门,例如,对于其他研究目的(二次使用)。不仅对科学问题,也为医生的日常工作,一个完整的注释文档的实用价值。自动生成标准化放电字母使用动态填充文本块意味着规则,提高质量和安全通过结构化文档(gydF4y2Ba2gydF4y2Ba]。一个注释文档的附加好处是功能好了,甚至在不同的语言。gydF4y2Ba

我们注意到空白的医疗形式的所有文档上下文很难查找和访问。作为这项工作的力量,个人联系作者的临床试验,常规文档,并注册成立并书面同意使用。更高层次的意识价值的需要。gydF4y2Ba

我们经历了从其他研究已知:显然是没有价值的知识空白crf (gydF4y2Ba9gydF4y2Ba]。gydF4y2Ba

限制和优势gydF4y2Ba

在这部作品中,萃取过程和注释的物品从放电信件被医生和监督执行。这确保了高水平的语义生成的数据的质量。人类医学专业可以提取医学概念的自由文本元素、表格、图形和其他来源。不得不承认医学概念,提取和注释。这种方法需要大量的努力而言,个人资源,最后,显著的成本。gydF4y2Ba

这项工作的目的是创建一个数据集的高质量的常规数据。进一步与新的生物标记和其他相关概念数据模型将在未来出现,另一个步骤是把我们的方法与之前的自然语言处理(NLP)管道自动分析更大的组> 1000文档的来源。gydF4y2Ba

我们的方法是注释手动优质精密的医学概念。技术路线与只在概念上相同的物品而不是类似的可以解释在这个特定的文档上下文比较百分比低于预期。gydF4y2Ba

我们扩展AML数据集有一个高水平的同余一般白血病数据集,以前公布并由独立的国际血液学家完整性和一致性检查(gydF4y2Ba13gydF4y2Ba]。以前的工作Miotto和王gydF4y2Ba26gydF4y2Ba]确定115常见的所有可能的数据项临床试验可行性研究注册Clinicaltrials.gov基于一种计算方法。虽然多数被发现在我们的集合(87.8%),只有20.3%的是Miotto和王的列表的一部分。AML-specific实验室物品没有被发现,这表明具体关注AML在这工作。gydF4y2Ba

实现生成的标准数据集可用于不同的目的:自动生成文本模块放电信件,癌症数据库的自动填充表单,或任何其他。比较与其他实体的数据集的生成和补充一般基本临床试验数据集可能是另一个目标。NLP作为注释crf或其他形式的补充工具可能会加快人工注释过程(gydF4y2Ba27gydF4y2Ba]。注释如果不是手动修改的质量当然是有问题的。gydF4y2Ba

分配uml规范医学概念依赖于人员执行编码(评分者间信协议)和高度的存在类似的代码(gydF4y2Ba27gydF4y2Ba]。在我们的例子中,注释过程或结果的例子/值被质疑。程序员选择C0005821之一gydF4y2Ba血小板gydF4y2Ba,另C0032181达成一致gydF4y2Ba血小板计数测量gydF4y2Ba最后,。我们的数据集可以作为基础为未来的AML crf的注释。gydF4y2Ba

结论gydF4y2Ba

缺乏标准化和文档的语义注释AML患者是显而易见的。高百分比的文档执行自由文本,这使得重用信息不可能没有很多的努力。我们的研究显示,有一个高重叠的临床试验数据和常规文档,以及在临床试验和注册文档。我们确定了语义核心数据项的已实现在一个高度结构化的格式,可以指导基地统一和有效的数据收集和二次使用。gydF4y2Ba

数据集在其他实体cd的好处,不仅肿瘤疾病,是明显的,尤其是普遍存在的疾病,如心血管疾病、中风、神经和其他复杂的需要和/或长期治疗是可以解决的。gydF4y2Ba

确认gydF4y2Ba

这项工作是由德国研究基金会(德意志Forschungsgemeinschaft DFG格兰特DU 352/11-1)。作者感谢罗兰带来和血液学的大学医院Bochum-Langendreer提供常规文档形式。gydF4y2Ba

的利益冲突gydF4y2Ba

没有宣布。gydF4y2Ba

‎gydF4y2Ba
多媒体附录1gydF4y2Ba

所有编码医学概念的列表。gydF4y2Ba

XLSX文件(Microsoft Excel文件),336 kbgydF4y2Ba

  1. Ammenwerth E Spotl惠普。临床文档所需的时间与直接病人护理。医生的工作抽样分析的活动。方法正杂志2009;48 (1):84 - 91。(gydF4y2BaCrossRefgydF4y2Ba][gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  2. 克拉姆R, Semjonow Tio J, Duhme H,伯克尔T,海尔J,等。需要协调结构化文档和二次使用的机会,结果系统分析与自动化的形式比较前列腺癌和乳腺癌。J生物医学通知2014年10月;51:86 - 99 (gydF4y2Ba免费的全文gydF4y2Ba][gydF4y2BaCrossRefgydF4y2Ba][gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  3. 多恩H, Estey呃,Amadori年代,Appelbaum FR,毕希纳T,伯内特AK,欧洲LeukemiaNet。成人急性髓系白血病的诊断和管理:从一个国际专家小组建议,代表欧洲LeukemiaNet。血2010年1月21日,115 (3):453 - 474gydF4y2Ba免费的全文gydF4y2Ba][gydF4y2BaCrossRefgydF4y2Ba][gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  4. 毕希纳T, Schlenk射频,Schaich M,多恩K, Krahl R,德国人J, et al .急性髓系白血病(AML):不同的治疗策略和一个共同的标准的手臂——德国AML群际结合前瞻性分析。J肿瘤防治杂志2012年10月10日,30 (29):3604 - 3610。(gydF4y2BaCrossRefgydF4y2Ba][gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  5. 斯坦利·k .协议设计趋势及其对临床试验性能的影响。RAJ制药2008;5:315 - 316 (gydF4y2Ba免费的全文gydF4y2Ba]gydF4y2Ba
  6. 斯托克纽豪斯P, Dugas M, Meidt M, Varghese j . ODMedit:统一语义注释数据集成在医学上基于一个公共元数据存储库。BMC医学Res Methodol 2016年12月1;16:65 [gydF4y2Ba免费的全文gydF4y2Ba][gydF4y2BaCrossRefgydF4y2Ba][gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  7. Tapuria, Bruland P,德莱尼B, D卡尔拉,Curcin诉之间的比较和转换CDISC ODM和EN13606 EHR标准连接的数据与临床试验研究数据。数字健康2018;4:2055207618777676 [gydF4y2Ba免费的全文gydF4y2Ba][gydF4y2BaCrossRefgydF4y2Ba][gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  8. 里斯M,普罗科什,贝克曼MW伯克尔t .单一肿瘤文档——重用肿瘤数据为不同的目的。Onkologie 36 2013; (3): 136 - 141。(gydF4y2BaCrossRefgydF4y2Ba][gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  9. Dugas M, Jockel KH Friede T, Gefeller用蒙太奇O,黄铁矿M, Marschollek M, et al .备忘录“开放元数据”。开放文档形式和医疗项目目录。方法正地中海2015;54 (4):376 - 378。(gydF4y2BaCrossRefgydF4y2Ba][gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  10. Breil B, Semjonow Muller-Tidow C,弗里茨·F, Dugas m . HIS-based kaplan meier情节——一个单一的方法来记录和重用日常生存信息来源。BMC医学通知决策Mak 2011年2月16日;11:11 [gydF4y2Ba免费的全文gydF4y2Ba][gydF4y2BaCrossRefgydF4y2Ba][gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  11. 希恩J, Hirschfeld年代,福斯特E, Ghitza U, Goetz K, Karpinski J,等。提高临床研究的价值通过使用通用数据元素。12月试验2016;13 (6):671 - 676gydF4y2Ba免费的全文gydF4y2Ba][gydF4y2BaCrossRefgydF4y2Ba][gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  12. 联邦卫生部(德国)。是有我们bisher erreicht吗?URL:gydF4y2Bahttps://www.bundesgesundheitsministerium.de/themen/praevention/nationaler-krebsplan/was-haben-wir-bisher-erreicht.htmlgydF4y2Ba访问[2019-01-17][gydF4y2BaWebCite缓存gydF4y2Ba]gydF4y2Ba
  13. Varghese J, Holz C,纽豪斯P,贝尔纳迪米,波姆,甘塞尔,et al .骨髓白血病的关键数据元素。学生健康抛光工艺通知2016;228:282 - 286。(gydF4y2BaCrossRefgydF4y2Ba][gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  14. Dugas m .失踪语义注释数据库。问题的根源在信息系统数据集成和迁移问题。方法正杂志2014;53 (6):516 - 517。(gydF4y2BaCrossRefgydF4y2Ba][gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  15. Ohmann C, Kuchinke w .未来医学信息学的发展从网络的角度临床研究。互操作性和集成。方法正杂志2009;48 (1):45 - 54。(gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  16. El褪色,兰斯B,卢卡斯N,米德C, Chatellier G, Lastic PY,等。结合临床研究与医疗保健企业:从重用项目EHR4CR平台。J生物医学通知2011年12月,17 (1):44 s94 - 102 (gydF4y2Ba免费的全文gydF4y2Ba][gydF4y2BaCrossRefgydF4y2Ba][gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  17. 绿色AK, Reeder-Hayes客,“RW, Basch E, Milowsky MI, Dusetzina某人,等。项目数据领域倡议:加速癌症研究通过共享数据。肿瘤学家2015,20 (5):464 - e20 [gydF4y2Ba免费的全文gydF4y2Ba][gydF4y2BaCrossRefgydF4y2Ba][gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  18. Schiariti V,福勒E,勃兰登堡我,利维E,麦金太尔,Sukal-Moulton T,等。一个共同的临床研究数据语言:国家神经疾病和中风研究所和美国脑瘫和发展医学学院脑瘫常见数据元素1.0版本的建议。Dev地中海孩子神经2018;12月60 (10):976 - 986。(gydF4y2BaCrossRefgydF4y2Ba][gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  19. 维瑟啊,菌髓,Maynadie M,斯蒂勒C, Marcos-Gragera R, R de旧金山,RARECARE工作组。发病率、生存和髓系恶性肿瘤患病率在欧洲。J癌症2012欧元11月,48 (17):3257 - 3266。(gydF4y2BaCrossRefgydF4y2Ba][gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  20. 国家医学图书馆——国立卫生研究院。CDE是什么?URL:gydF4y2Bahttps://www.nlm.nih.gov/cde/glossary.html cdedefinitiongydF4y2Ba访问[2019-01-17][gydF4y2BaWebCite缓存gydF4y2Ba]gydF4y2Ba
  21. uml术语服务。URL:gydF4y2Bahttps://uts.nlm.nih.gov//home.htmlgydF4y2Ba访问[2019-04-15][gydF4y2BaWebCite缓存gydF4y2Ba]gydF4y2Ba
  22. Dugas M,纽豪斯P, Meidt Doods J,斯托米,Bruland P, et al .门户的医学数据模型:信息基础设施用于医学研究和医疗保健。数据库(牛津大学)2016;2016:pii: bav121 (gydF4y2Ba免费的全文gydF4y2Ba][gydF4y2BaCrossRefgydF4y2Ba][gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  23. Varghese J, Dugas m .频率分析的医学概念在临床试验及其在网格和SNOMED-CT报道。方法正杂志2015;54 (1):83 - 92。(gydF4y2BaCrossRefgydF4y2Ba][gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  24. Varghese J, Fujarski M, Hegselmann年代,纽豪斯P, Dugas M . CDEGenerator:在线学习平台注册从现有数据模型建立模型。论文2018;10:961 - 970 (gydF4y2Ba免费的全文gydF4y2Ba][gydF4y2BaCrossRefgydF4y2Ba][gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  25. 为急性髓系白血病Holz c .通用数据元素。医疗门户2018数据模型。(gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
  26. Miotto R,翁c .临床资格无监督挖掘频繁标签文本索引。J生物医学通知2013年12月,46 (6):1145 - 1151 (gydF4y2Ba免费的全文gydF4y2Ba][gydF4y2BaCrossRefgydF4y2Ba][gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
  27. Lingren T, Deleger L, Molnar K,翟H, Meinzen-Derr J, Kaiser M, et al .评估pre-annotation注释速度的影响和潜在的偏见:自然语言处理黄金标准发展临床命名实体识别的临床试验公告。J是通知协会2014;21 (3):406 - 413 (gydF4y2Ba免费的全文gydF4y2Ba][gydF4y2BaCrossRefgydF4y2Ba][gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba


‎gydF4y2Ba
ACF:gydF4y2Ba绝对频率概念gydF4y2Ba
ADT:gydF4y2BaArbeitsgemeinschaft德国TumorzentrengydF4y2Ba
AML:gydF4y2Ba急性髓系白血病gydF4y2Ba
aPTT:gydF4y2Ba激活局部血栓形成质时间gydF4y2Ba
CD34:gydF4y2Ba集群分化34gydF4y2Ba
CDE:gydF4y2Ba常见的数据元素gydF4y2Ba
CDISC:gydF4y2Ba临床数据交换标准的财团gydF4y2Ba
巨细胞病毒:gydF4y2BaCytomegalie病毒gydF4y2Ba
CRF:gydF4y2Ba病例报告形式gydF4y2Ba
EBMT:gydF4y2Ba欧洲社会的血液和骨髓移植gydF4y2Ba
ECOG:gydF4y2Ba东部合作肿瘤组gydF4y2Ba
民族解放军:gydF4y2Ba欧洲白血病网络gydF4y2Ba
工厂:gydF4y2BaFrench-American-British-ClassificationgydF4y2Ba
有:gydF4y2Ba谷氨酸草酰乙酸的转氨酶gydF4y2Ba
GPT:gydF4y2Ba谷氨酸丙酮酸氨基转移酶gydF4y2Ba
HSCT:gydF4y2Ba人类干细胞移植gydF4y2Ba
印度卢比:gydF4y2Ba国际标准化比值gydF4y2Ba
MDM:gydF4y2Ba医疗数据模型gydF4y2Ba
NLP:gydF4y2Ba自然语言处理gydF4y2Ba
ODM:gydF4y2Ba操作数据模型gydF4y2Ba
萨尔:gydF4y2Ba研究联盟白血病gydF4y2Ba
uml:gydF4y2Ba统一医疗语言系统gydF4y2Ba
人:gydF4y2Ba世界卫生组织gydF4y2Ba


编辑C洛维斯;提交30.01.19;同行评议的H乌尔里希,亚摩斯,问陈,李;评论作者23.03.19;修订版本收到08.05.19;接受31.05.19;发表12.08.19gydF4y2Ba

版权gydF4y2Ba

©基督教霍尔兹、托尔斯滕·凯斯勒,马丁杜佳斯朱利安Varghese。最初发表在JMIR医学信息学(http://medinform.www.mybigtv.com), 12.08.2019。gydF4y2Ba

这是一个开放分布式根据条知识共享归属许可(https://creativecommons.org/licenses/by/4.0/),它允许无限制的使用、分配、和繁殖在任何媒介,提供原工作,首次出版于JMIR医学信息学是正确引用。完整的书目信息,原始发布在http://medinform.www.mybigtv.com/上的链接,以及这个版权和许可信息必须包括在内。gydF4y2Ba


Baidu
map