这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首次发表在《医学互联网研究杂志》上,并适当引用。必须包括完整的书目信息,到//www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。gydF4y2Ba
由于若干技术、伦理和监管问题,共享健康数据具有挑战性。可查找、可访问、可互操作和可重用(FAIR)指导原则已经概念化,以实现数据互操作性。许多研究提供了实施指南、评估指标和软件,以获得符合fair标准的数据,特别是健康数据集。健康级别7 (HL7)快速医疗保健互操作性资源(FHIR)是一种健康数据内容建模和交换标准。gydF4y2Ba
我们的目标是设计一种新的方法,根据FAIR原则提取、转换和加载现有的健康数据集到HL7 FHIR存储库中,开发一个数据管理工具来实施该方法,并对来自两个不同但互补的机构的健康数据集进行评估。我们的目标是通过标准化提高对现有卫生数据集公平原则的遵守程度,并通过消除相关的技术障碍促进卫生数据共享。gydF4y2Ba
我们的方法自动处理给定FHIR端点的功能,并在根据FHIR配置文件定义强制的规则配置映射时指导用户。代码系统映射可以配置为术语翻译,通过自动使用FHIR资源。自动检查创建的FHIR资源的有效性,不允许不合法的资源持久化。在我们的数据转换方法的每个阶段,我们使用特定的基于fhr的技术,以便结果数据集可以被评估为FAIR。我们对来自两个不同机构的卫生数据集的方法进行了以数据为中心的评估。gydF4y2Ba
通过直观的图形用户界面,提示用户根据所选配置文件的限制将映射配置为FHIR资源类型。一旦开发了映射,我们的方法就可以在语法和语义上将现有的健康数据集转换为HL7 FHIR,而不会根据我们的隐私相关标准损失数据效用。除了映射的资源类型之外,在幕后,我们创建了额外的FHIR资源来满足几个FAIR标准。根据FAIR数据成熟度模型的数据成熟度指标和评估方法,我们达到了可查找、可访问和可互操作的最高级别(第5级)和可重用的最高级别(第3级)。gydF4y2Ba
我们开发并广泛评估了我们的数据转换方法,以释放驻留在不同数据孤岛中的现有健康数据的价值,使它们能够根据FAIR原则进行共享。我们表明,我们的方法可以成功地将现有健康数据集转换为HL7 FHIR,而不会损失数据效用,并且就FAIR数据成熟度模型而言,结果是公平的。我们支持机构迁移到HL7 FHIR,这不仅可以实现FAIR数据共享,还可以简化与不同研究网络的集成。gydF4y2Ba
共享健康数据的能力为许多领域带来了新的研究和创新视野,例如综合护理、电子健康记录(EHR)和个人健康记录管理,以及在临床研究和公共卫生研究中二次使用电子健康记录。随着数字卫生技术的发展,越来越多的高质量数据正在卫生保健和卫生研究机构的孤立数据库中积累。最近在分布式数据处理、大数据分析和人工智能方面取得的进展为分析积累的数据创造了巨大的机会,以满足人口日益增长的期望,这促使需要共享健康数据。然而,由于存在大量技术、伦理和监管问题,共享健康数据具有挑战性。gydF4y2Ba
卫生数据共享的技术挑战涉及广泛的互操作性方面,如数据建模、格式化、存储、访问和交换。正在作出许多努力,通过标准化实现互操作性,主要是针对特定领域,例如为研究或公共卫生而二次使用卫生数据。一个主要的方法是采用公共数据元素(Common Data Elements, cde)来标准化内容模型并使它们足够通用。在基于CDE的方法中,阻碍互操作性的主要障碍是缺乏对CDE的管治、CDE互操作性的标准化,以及相关的实现和软件[gydF4y2Ba
可查找、可访问、可互操作和可重用(FAIR)指导原则已经概念化,以实现机器可访问和可操作的数据互操作性[gydF4y2Ba
HL7几十年来一直在开发和维护卫生数据互操作性的国际标准。由于HL7 version 2、HL7 version 3和HL7 Clinical Document Architecture (CDA)的广泛采用[gydF4y2Ba
FHIR受到医疗IT界的广泛欢迎。从Argonaut项目开始[gydF4y2Ba
认识到公平原则在健康数据共享中的重要性,并分析对HL7 FHIR日益增长的兴趣和采用,在本研究中,我们的目标是围绕一种新方法开发一个数据管理工具(DCT),以提取、转换和加载现有的医疗保健和健康研究数据到HL7 FHIR存储库中,并对来自两个不同机构的真实健康数据进行DCT评估。我们的最终目标是帮助健康数据所有者(从事健康研究的组织)创建公平数据,通过在健康领域建立和广泛使用的标准来共享健康数据。除了完整的数据转换方法外,我们研究的主要新颖之处在于我们如何使用FHIR资源来满足FAIR原则的每个标准。gydF4y2Ba
尽管医疗IT系统开始支持FHIR标准,但将驻留在遗留系统或简单电子表格中的现有数据转换为FHIR是一项艰巨的任务。按照FHIR管理回顾性卫生数据需要作出广泛努力;这很耗时,而且执行该操作的领域专家需要对FHIR标准有深入的技术知识。根据我们在之前的研究中提出的FAIR-ification工作流程[gydF4y2Ba
采用迭代方法,我们与来自五个不同卫生保健和卫生研究组织的研究人员和专家密切合作,对DCT进行了需求启发和架构设计过程:(1)安达卢西亚卫生服务(SAS);(2)西班牙Aragón健康科学研究所(IACS),(3)瑞士日内瓦大学医院,(4)葡萄牙波尔图大学,(5)意大利圣心天主教大学。来自几个其他组织(例如,来自作者的附属组织)的研究人员和开发人员也参加了设计和开发期间的协作活动。遵循公平认证工作流程的数据管理和验证步骤的安全-隐私要求和一般设计原则[gydF4y2Ba
在设计和开发期间,根据其快速医疗保健互操作性资源(FHIR)知识进行分类的协作者数量(N=22)。gydF4y2Ba
|
合作者类别gydF4y2Ba | ||
|
没有FHIR知识(n=10), n (%)gydF4y2Ba | FHIR基本知识(n=6), n (%)gydF4y2Ba | FHIR专家(有实施经验;N =6), N (%)gydF4y2Ba |
情景应用程序gydF4y2Ba一个gydF4y2Ba | 1 (10)gydF4y2Ba | 2 (33)gydF4y2Ba | 0 (0)gydF4y2Ba |
大船公司gydF4y2BabgydF4y2Ba | 1 (10)gydF4y2Ba | 1 (17)gydF4y2Ba | 0 (0)gydF4y2Ba |
UNIGEgydF4y2BacgydF4y2Ba | 3 (30)gydF4y2Ba | 0 (0)gydF4y2Ba | 0 (0)gydF4y2Ba |
向上gydF4y2BadgydF4y2Ba | 2 (20)gydF4y2Ba | 0 (0)gydF4y2Ba | 0 (0)gydF4y2Ba |
加州大学gydF4y2BaegydF4y2Ba | 2 (20)gydF4y2Ba | 0 (0)gydF4y2Ba | 0 (0)gydF4y2Ba |
其他人gydF4y2Ba | 1 (10)gydF4y2Ba | 3 (50)gydF4y2Ba | 6 (100)gydF4y2Ba |
一个gydF4y2BaSAS:安达卢西亚保健服务。gydF4y2Ba
bgydF4y2BaIACS:健康科学研究所Aragón。gydF4y2Ba
cgydF4y2Ba日内瓦大学医院。gydF4y2Ba
dgydF4y2BaUP:波尔图大学。gydF4y2Ba
egydF4y2BaUCSC:圣心天主教大学。gydF4y2Ba
如gydF4y2Ba
在我们数据转换方法的每个步骤中,我们通过使用FHIR应用了特定的技术,从而可以将结果数据集评估为FAIR,这是我们工作的主要新颖之处。在gydF4y2Ba
放置数据管理工具(DCT),同时将现有健康数据转换为健康级别7 (HL7)快速医疗保健互操作性资源(FHIR);品牌图标用于说明目的)。gydF4y2Ba
访问快速医疗保健互操作性资源(FHIR)端点并处理CapabilityStatement。如果有概要文件定义,检索并解析它们。否则,继续进行标准资源类型的定义。gydF4y2Ba
指导用户进行映射。为了满足可查找、可访问、可互操作和可重用(FAIR)的所有原则,提示用户根据概要文件定义创建有效的FHIR资源。对于可查找性和可访问性,资源标识符是通过散列生成的,每个资源都可以通过url直接访问。资源之间的交叉引用是通过特定于引用的映射配置处理的。gydF4y2Ba
指导用户进行术语翻译。FHIR应用程序编程接口可用于在本地、自定义(例如,国家标准化、国际但自定义或完全专有)或国际标准的术语系统之间执行翻译。这一步专门处理互操作性和可重用性原则。gydF4y2Ba
通过生成FHIR资源和调用FHIR端点的验证服务来验证映射。对于互操作性和可重用性原则,我们的方法在写入存储库之前检查源数据中的每条记录。gydF4y2Ba
通过写入已经生成的FHIR资源来完成转换。在幕后,自动创建了出处和DocumentManifest资源,生成的FHIR资源进行了版本控制,从而完全覆盖了可重用性原则。gydF4y2Ba
DCT需要一个FHIR服务器端点;因此,在工具验证了FHIR端点之后,用户可以继续进行映射配置和数据转换。CapabilityStatement是描述FHIR服务器实现的功能(即行为和特性)的FHIR资源。DCT检索并处理给定FHIR存储库的abilitystatement,并向用户显示可用的FHIR资源类型和受支持的概要文件,包括后端资源类型受支持的操作。DCT不受特定的FHIR实现指南或配置文件集的约束。机器可处理的概要定义可以由DCT处理,然后由概要定义公开的规则在用户配置映射时被强制执行。因此,从一开始就禁止无效的配置。gydF4y2Ba
在本研究的评估过程中,我们使用了onFHIR [gydF4y2Ba
一旦处理了FHIR存储库的abilitystatement,用户就可以指向CSV或Excel文件,或者连接到关系数据库,开始配置与概要文件定义相关的源数据结构到FHIR资源类型的映射。用户选择一个FHIR资源类型和一个配置文件,然后通过将FHIR元素与所选工作表或表的字段或列进行匹配来配置映射。gydF4y2Ba
DCT的用户应该对HL7 FHIR分类的健康数据实体类型有一个基本的了解,这样他们就可以为数据表或表格选择正确的资源类型(例如,观察、条件和药物声明),从而开始映射过程。此外,用户需要了解代码系统、值集和数据集中编码值的一般概念。除此之外,用户不需要知道任何特定的fir相关细节,例如建模细节、限制机制、序列化格式和应用程序编程接口细节。DCT提供字段名、短描述和长描述(当单击字段名时)和数据类型;给出了它们的基数和值集限制;并在将错误映射配置到资源字段时显示警告。虽然这些细节是隐藏的,但是用户可以通过分析所提供的描述和限制找到每个源字段的正确元素。gydF4y2Ba
在通过GUI配置映射时,我们生成了一个符合内部映射语言的基于json的映射配置。如图所示gydF4y2Ba
显示到快速医疗保健互操作性资源(FHIR)观察资源的完整映射的屏幕截图。gydF4y2Ba
下面生成的基于json的映射配置的一个片段。gydF4y2Ba
匹配FHIR元素和源数据列构成了语法转换。除此之外,我们的设计还使用基于fir的术语服务器通过代码系统映射处理语义转换。在数据管理过程开始时,用户还可以在指向存储库的FHIR端点后指向术语服务器。提供术语服务器是可选的;根据源数据集中使用的代码系统和目标FHIR配置文件强制执行的代码系统,数据转换可能需要也可能不需要术语转换。DCT的术语翻译机制再次依赖于FHIR;codessystem、ValueSet和ConceptMap资源类型可以由DCT自动处理,以在配置期间处理代码系统映射,并在数据验证和转换期间进行术语转换。gydF4y2Ba
在语法上匹配FHIR元素与源数据字段之后,如果需要,用户可以为该匹配配置术语翻译。对于某些数据字段,源数据可以具有专有或自定义的本地代码列表,而对于其他一些字段,可以使用标准代码系统。自定义代码列表的一个很好的例子是Patient资源的性别字段,因为大多数数据集使用它们自己的代码来指示患者的性别。如果Patient资源类型下的目标性别元素强制执行另一个代码系统,例如HL7管理性别代码,那么我们的方法需要将自定义代码到目标代码系统的映射放入连接的FHIR术语服务器中并从该服务器提供服务。的上半部分所示gydF4y2Ba
一个屏幕截图显示了术语翻译的2种不同的代码系统映射配置。gydF4y2Ba
创建有效的FHIR资源不仅取决于正确的映射配置,还取决于源数据本身。在处理映射配置时,用户可以看到该表或电子表格中数据的快照(例如,前10行),并使用这些记录测试创建的FHIR资源的有效性。DCT根据配置这些映射时选择的FHIR配置文件定义检查资源的有效性。其中包括检查是否填充了所有强制元素,是否满足基数限制,以及在必要时配置值集强制执行和术语翻译。gydF4y2Ba
映射完成后,用户可以运行一个完整的验证,其中DCT从数据创建所有FHIR资源,然后在将它们保存到FHIR存储库之前对它们进行验证。在我们的方法中,FHIR标准验证终点用于此目的。根据验证结果,用户可以返回并更新映射,因为电子表格或表格中的单个记录可能导致无效的FHIR资源。否则,无效的资源将不会保存到存储库,而有效的资源将保存到存储库。尽管验证所有记录可能是详尽且耗时的,但这可以确保映射配置符合源数据的性质,并且可以在持久化步骤中直接使用已经创建的资源实例,而无需进行额外的处理。在验证步骤之后,可以将转换后的数据写入FHIR存储库,并结束对所选资源的管理过程。gydF4y2Ba
我们在数据转换和公平性方面评估了我们的方法和DCT。我们测量了数据效用,并评估了转换后数据的公平性水平。我们对西班牙两家不同卫生机构的卫生保健数据集进行了评估:SAS和IACS。我们选择了这两个机构,因为它们是互补的,因为它们来自同一个国家,一些字段和西班牙语非结构化文本字段的代码系统相似,但它们在某种意义上是不同的,SAS是一个卫生保健组织,而IACS是一个卫生研究机构,在语法和语义上都有不同的源数据结构(分别是电子病历和研究数据寄存器)。gydF4y2Ba
根据中描述的体系结构,对SAS和IACS分别执行软件部署gydF4y2Ba
病人gydF4y2Ba
为源数据中的每个患者记录创建了一个Patient资源,以涵盖基本的人口统计信息。gydF4y2Ba
遇到gydF4y2Ba
为每个医院住院创建了一个Encounter资源,并链接到关联的Patient资源。gydF4y2Ba
观察gydF4y2Ba
每项生命体征观察、实验室结果、临床评估评分、吸烟史及吸烟状况等社会观察均建立一个观察资源。“观察”链接到“患者”资源,如果可用,也链接到“邂逅”资源。gydF4y2Ba
条件gydF4y2Ba
为每个临床状况和诊断创建了一个Condition资源,并链接到相关的Patient和(如果可用的话)Encounter资源。gydF4y2Ba
MedicationStatementgydF4y2Ba
为每个处方创建了一个MedicationStatement资源,并链接到相关的Patient资源,如果可用,还链接到Encounter资源。gydF4y2Ba
出处gydF4y2Ba
为一个数据转换会话创建了单个出处资源,以表示在该会话期间创建的资源的出处信息。gydF4y2Ba
DocumentManifestgydF4y2Ba
为数据集创建了一个DocumentManifest资源,以维护作者和许可信息以及其他元数据。gydF4y2Ba
在另一项研究中,从欧洲各组织招募了16名专家,对DCT进行了方法学上的最终用户评估,并通过一系列问卷评估了该工具的可用性[gydF4y2Ba
本研究的伦理批准是由参与的卫生研究机构(即:隶属于SAS和IACS的维珍德尔Rocío大学医院和Aragón卫生研究所[1269-M1-20])根据其地区法规获得的。制定了保障参与者权利和自由的技术和组织措施,包括数据最小化原则、知情同意程序和信息表。每个机构都任命了一名资料保护干事。为了加强对这些伦理方面的适当覆盖,在研究开始时,成立了一个外部伦理咨询委员会,负责审查可交付成果、生成报告并进行演示,以支持FAIR4Health Consortium。gydF4y2Ba
数据效用是指转换数据的分析完整性和有效性。为了度量数据效用,我们首先将源数据上的实体总数与目标数据(即FHIR资源)上的相同数量进行比较,如所示gydF4y2Ba
从快速医疗保健互操作性资源标准获得的资源总数来看,数据实用。gydF4y2Ba
数据效用标准gydF4y2Ba | 对源数据求值,ngydF4y2Ba | 对转换后的数据求值ngydF4y2Ba | ||
|
情景应用程序gydF4y2Ba一个gydF4y2Ba | 大船公司gydF4y2BabgydF4y2Ba | 情景应用程序gydF4y2Ba | 大船公司gydF4y2Ba |
病人gydF4y2Ba | 7873gydF4y2Ba | 7622gydF4y2Ba | 7873gydF4y2Ba | 7622gydF4y2Ba |
招生gydF4y2Ba | 11954年gydF4y2Ba | 12106年gydF4y2Ba | 11954年gydF4y2Ba | 12106年gydF4y2Ba |
观察gydF4y2Ba | 73817年gydF4y2Ba | 11999年gydF4y2Ba | 73817年gydF4y2Ba | 11999年gydF4y2Ba |
条件gydF4y2Ba | 118616年gydF4y2Ba | 78040年gydF4y2Ba | 118616年gydF4y2Ba | 78040年gydF4y2Ba |
处方gydF4y2Ba | 42164年gydF4y2Ba | 70880年gydF4y2Ba | 42164年gydF4y2Ba | 70880年gydF4y2Ba |
一个gydF4y2BaSAS:安达卢西亚保健服务。gydF4y2Ba
bgydF4y2BaIACS:健康科学研究所Aragón。gydF4y2Ba
数据实用性的结果是精细化的指标,涵盖了从快速医疗保健互操作性资源标准创建的所有资源。gydF4y2Ba
数据效用标准gydF4y2Ba | 对源数据求值,ngydF4y2Ba | 对转换后的数据求值ngydF4y2Ba | 准确性,%gydF4y2Ba | |||
|
情景应用程序gydF4y2Ba一个gydF4y2Ba | 大船公司gydF4y2BabgydF4y2Ba | 情景应用程序gydF4y2Ba | 大船公司gydF4y2Ba | 情景应用程序gydF4y2Ba | 大船公司gydF4y2Ba |
女性患者在数据集中最常见的5种情况gydF4y2Ba | 3067gydF4y2Ba | 2193gydF4y2Ba | 3067gydF4y2Ba | 2193gydF4y2Ba | One hundred.gydF4y2Ba | One hundred.gydF4y2Ba |
诊断为慢性阻塞性肺病的患者gydF4y2BacgydF4y2Ba(icd -gydF4y2BadgydF4y2Ba代码:J44、J44.0、J44.1、J44.9)gydF4y2Ba | 1640gydF4y2Ba | 859gydF4y2Ba | 1640gydF4y2Ba | 859gydF4y2Ba | One hundred.gydF4y2Ba | One hundred.gydF4y2Ba |
处方包括≥5种药物的患者gydF4y2Ba | 4089gydF4y2Ba | 4273gydF4y2Ba | 4089gydF4y2Ba | 4273gydF4y2Ba | One hundred.gydF4y2Ba | One hundred.gydF4y2Ba |
出院后30天内再次入院gydF4y2Ba | 919gydF4y2Ba | 1187gydF4y2Ba | 919gydF4y2Ba | 1187gydF4y2Ba | One hundred.gydF4y2Ba | One hundred.gydF4y2Ba |
男性患者血红蛋白(LOINCgydF4y2BaegydF4y2Ba代码:718-7),数值在138至172g /L之间gydF4y2Ba | 381gydF4y2Ba | - - - - - -gydF4y2BafgydF4y2Ba | 381gydF4y2Ba | - - - - - -gydF4y2Ba | One hundred.gydF4y2Ba | N/AgydF4y2BaggydF4y2Ba |
一个gydF4y2BaSAS:安达卢西亚保健服务。gydF4y2Ba
bgydF4y2BaIACS:健康科学研究所Aragón。gydF4y2Ba
cgydF4y2BaCOPD:慢性阻塞性肺疾病。gydF4y2Ba
dgydF4y2BaICD-10:国际疾病分类,第十次修订。gydF4y2Ba
egydF4y2BaLOINC:逻辑观察标识符名称和代码。gydF4y2Ba
fgydF4y2Ba不可用。gydF4y2Ba
ggydF4y2Ba-不适用。gydF4y2Ba
为了衡量转换数据集的公平性水平,我们采用了研究数据联盟(RDA)发布的FAIR数据成熟度模型的成熟度指标和评价方法[gydF4y2Ba
成熟度模型在定义指示器时明确区分了数据和元数据。虽然不可能画出一个严格的数据和元数据之间的界线在一般情况下,我们设计了DCT考虑内容等FHIR modeling-related构造概要或CapabilityStatement本身作为元数据除了固有的元数据结构等基础的meta元素FHIR资源(资源)是谁的名字或资源出处和DocumentManifest等,自动创建的DCT在数据转换。关于每个公平原则的指标,我们总结了我们如何在gydF4y2Ba
遵循每个FAIR成熟度指标的可查找、可访问、可互操作和可重用(FAIR)原则的进度。gydF4y2Ba
可发现的gydF4y2Ba
数据管理工具(DCT)以URL的形式为要在快速医疗保健互操作性资源(FHIR)存储库中创建的每个资源分配一个全局唯一、持久且可解析的标识符。FHIR的强大搜索机制及其onFHIR实现提供了丰富的元数据集来搜索索引字段。gydF4y2Ba
可访问的gydF4y2Ba
由于资源的标识符是url,因此可以通过HTTP(免费协议)手动或自动访问资源,必要时还可以在HTTP中启用身份验证和授权。gydF4y2Ba
可互操作的gydF4y2Ba
DCT使用它们的url创建跨FHIR资源的引用,例如从Encounter资源引用到Patient资源(跨FHIR资源的引用完整性)。内容模型的知识表示使用FHIR标准通过XML或JSON序列化来表示。我们使用标准代码系统,如卫生7级行政性别和国际疾病分类,第十次修订(ICD-10),用于相关数据和元数据字段,以满足各自指标的公平词汇要求。gydF4y2Ba
可重用的gydF4y2Ba
FHIR标准是一种机器可理解的社区标准,根据我们的转换机制,每个资源都与一个出处资源以及许可信息相关联。因此,所有转换后的数据及其元数据都符合社区标准。gydF4y2Ba
评估结果显示,在可重用原则下,我们的实现中只有1个指标没有处理,如图所示gydF4y2Ba
每个FAIR原则对可查找、可访问、可互操作和可重用(FAIR)原则的遵从程度。gydF4y2Ba
在这项研究中,我们证明了我们的方法和我们开发的DCT成功地实现了真实世界健康数据的公平化——在满足健康数据共享的公平原则的同时,可以将数据转换为HL7 FHIR。DCT使领域专家能够通过用户友好的gui将现有健康数据转换为FHIR。评估结果表明,转换后的数据保持了实用性和准确性,可查找、可访问和可互操作原则的公平性达到了最高水平(第5级),可重用原则达到了第3级。gydF4y2Ba
在广泛采用HL7 FHIR作为健康数据交换标准之后,开展了一些工作,将数据从遗留格式转换为FHIR。在下面的段落中,我们将我们的方法与主要的努力进行比较,并介绍本研究的优势。gydF4y2Ba
FHIR临床资产映射程序(CAMP FHIR)是一个开源软件,它将表示为关系数据库视图的cdm(如i2b2、OMOP和PCORnet)转换为旨在表示临床研究数据的一组预定义的FHIR资源[gydF4y2Ba
FHIR转换器[gydF4y2Ba
防火FHIR外墙[gydF4y2Ba
本研究的局限性总结如下。医疗保健数据通常由缺失和不准确的部分组成,这使得在分析过程中协调和使用它们具有挑战性。我们的方法允许使用FHIR配置文件,这可能会对数据字段施加一些限制。如果采用了这种限制性配置文件,并且如果记录不符合配置文件的限制,则出于提供信息的目的记录该记录,并停止对该记录的处理;它不会被持久化到FHIR存储库中。根据源数据集的性质和管理结束时所需的协调级别,可以调整配置文件以处理记录的不准确和不完整级别。gydF4y2Ba
在设计和开发方法和DCT期间,我们与5个不同的卫生保健或卫生研究组织合作。然而,我们对其中的2人进行了评估,这可以被认为是本研究的局限性。尽管这两家机构为评估提供了大量数据集,但考虑到数字卫生系统中使用的实体数量庞大,我们的研究仍然有限。此外,患者使用远程医疗设备或其他来源提供的信息不包括在内。gydF4y2Ba
我们表明,我们的方法满足了2个不同卫生组织的数据转换需求,而在设计和开发期间,我们与来自4个不同国家的5个不同组织合作。虽然我们的方法可以满足不同卫生组织的主要要求,但我们相信,我们的工作仍然可以通过不同卫生研究执行组织的复杂绘图和转换要求得到改进。在映射到单个目标字段时,DCT可能需要通过一些简单或复杂的函数来组合源字段。或者,一个源记录可以导致多个FHIR资源实例。此外,在数据处理吞吐量方面,我们的研究受到参与组织的相对较小的数据集的限制。虽然它成功地验证了我们的方法,但DCT可能会被非常大的数据集淹没,因为它是一个独立的桌面应用程序。然而,我们的数据转换方法可以使用分布式数据处理技术来实现,以处理大量的健康数据集。作为未来的工作,我们的目标是扩展实现,以处理非常大或分布式的数据集,同时致力于内部映射语言的改进版本,以处理不同数据源之间复杂的联合操作。我们的方法还需要得到来自不同国家的更多机构的验证,以满足不同卫生保健和卫生研究环境的许多其他要求。在未来,我们还将致力于内部映射语言的重新设计和更正式的定义和实现,以使其更具外部性和可发布性。gydF4y2Ba
DCT和我们对FHIR的使用支持向HL7 FHIR的制度性迁移,这不仅提高了公平水平,而且简化了采用gydF4y2Ba
在本文中,我们提出了一种DCT和数据转换方法,以释放驻留在不同数据孤岛中的现有健康数据的价值,使它们可以作为FHIR资源根据FAIR原则进行共享。从需求分析开始,我们在GUI模型、软件设计和实现上采用了敏捷方法,迭代地返回给最终用户,并相应地开发DCT。我们使用来自两个不同但互补的西班牙机构的真实数据进行了广泛的评估,其中SAS是一家医院,IACS是一家健康研究机构。我们使用几个标准来评估转换数据的实用性和准确性,这些标准是在尊重数据所有者的隐私问题的情况下创建的。我们证明,DCT可以成功地将现有健康数据集转换为HL7 FHIR,而不会损失数据效用。此外,我们使用RDA发布的数据成熟度指标和FAIR数据成熟度模型的评估方法对转换数据的公平性水平进行了方法学评价。我们的结论是,我们的结果达到了可查找、可访问和可互操作原则的最大公平级别(第5级),而我们达到了可重用原则的第3级,它涵盖了公平度量的基本和重要标准。评价结果表明,DCT通过将健康数据转化为HL7 FHIR,可以使健康数据公平。gydF4y2Ba
研究数据联盟发布的可查找、可访问、可互操作和可重用数据成熟度模型以及我们对每个指标的评估得分如表S1所示。对于每个原则(可查找的、可访问的、可互操作的和可重用的),都有一个唯一的指示符、指示符的描述、它的优先级,以及度量列中的评估分数。gydF4y2Ba
生物医学研究综合领域组gydF4y2Ba
用于快速医疗保健互操作性资源的临床资产映射程序gydF4y2Ba
临床文献架构gydF4y2Ba
公共数据元素gydF4y2Ba
通用数据模型gydF4y2Ba
数据管理工具gydF4y2Ba
电子健康记录gydF4y2Ba
提取、转换和加载gydF4y2Ba
可查找、可访问、可互操作和可重用gydF4y2Ba
符合可查找、可访问、可互操作和可重用原则gydF4y2Ba
快速医疗保健互操作性资源gydF4y2Ba
图形用户界面gydF4y2Ba
健康等级7gydF4y2Ba
整合生物学和床边的信息学gydF4y2Ba
健康科学研究所AragóngydF4y2Ba
国际疾病分类第十次修订gydF4y2Ba
监管活动医学词典gydF4y2Ba
观察性医疗成果伙伴关系gydF4y2Ba
研究数据联盟gydF4y2Ba
安达卢西亚卫生局gydF4y2Ba
医学临床术语系统化命名法gydF4y2Ba
这项工作得到了FAIR4Health项目的支持[gydF4y2Ba
本研究过程中生成和分析的数据集是不可公开的,因为它们包含的信息可能会损害研究参与者的隐私和同意。gydF4y2Ba
没有宣布。gydF4y2Ba