这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品首次发表在《医学互联网研究杂志》上,并适当引用。必须包括完整的书目信息,到//www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。
数字医疗的前景主要取决于电子捕获数据的能力,这些数据可以通过分析来改进决策。然而,有效利用数据的能力已被证明是难以捉摸的,这主要是因为所捕获数据的质量。尽管数据质量(DQ)很重要,但公认的DQ分类法回避了文献。在开发统一框架时,维度通常是分散的,没有考虑维度之间的相互关系或它们的最终影响。
本研究的目的是建立一个统一的数字健康DQ维度和结果(DQ- do)框架,以提供对3个研究问题的见解:数字健康DQ的维度是什么?数字健康DQ的各个维度是如何相关的?数字健康DQ的影响是什么?
根据PRISMA(系统评价和荟萃分析的首选报告项目)指南,对同行评议的主要集中在医院环境中的数字健康DQ进行了一项发展性系统文献综述。共检索227篇相关文章并进行归纳分析,以确定数字健康DQ维度和结果。通过开放编码、持续比较和主题专家卡片分类进行归纳分析,以确定数字健康DQ维度和数字健康DQ结果。随后,进行计算机辅助分析,并由DQ专家进行验证,以确定DQ维度之间的相互关系以及DQ维度与结果之间的关系。分析导致了DQ-DO框架的发展。
数字健康DQ- do框架由DQ的可及性、准确性、完整性、一致性、上下文有效性和流通性6个维度组成;数字健康DQ各维度之间的相互关系,一致性是影响所有其他数字健康DQ维度的最具影响力的维度;5个数字健康DQ成果,即临床、临床医生、研究相关、业务流程和组织成果;数字健康DQ维度与DQ结果之间的关系,一致性和可访问性维度影响所有DQ结果。
本研究开发的DQ- do框架展示了数字健康DQ的复杂性和减少数字健康DQ问题的必要性。该框架进一步为医疗保健管理人员提供了对DQ问题及其结果的全面见解,这可以帮助他们优先考虑首先解决哪些与DQ相关的问题。
由于对卫生信息系统进行大量投资以改善卫生保健结果,全球卫生保健格局正在发生变化[
数字卫生的前景主要取决于以电子方式获取数据的能力,这些数据可以进行分析,以改进地方和国家的决策[
为了评估DQ,学者们开发了许多DQ分类法,这些分类法评估了数字卫生系统中包含的数据坚持多个维度的程度(即DQ的可测量成分)。Weiskopf和Weng [
卫生组织不能充分利用高质量数据将损害本已紧张的卫生保健系统的可持续性[
本文的结构如下:首先,详细介绍了系统文献综述法;其次,根据研究问题,我们提出了3个主要发现:(1)DQ维度,(2)DQ相互关系,(3)DQ结果;第三,我们将研究结果与以往的研究结果进行了比较,并讨论了这项工作的意义。
我们遵循了PRISMA(系统评价和荟萃分析的首选报告项目)指南和Webster和Watson提出的指南[
为确保检讨的完整性[
从搜索中返回的论文通过四个步骤被缩小范围(
PRISMA(系统评价和荟萃分析首选报告项目)纳入过程。电子健康记录。
特别关注数字健康中的数据质量
开发或评估概念框架的实证论文或评论文章
考虑医院环境中的数字健康
在任何时间框架内发表在同行评议的媒体上
英文出版
开发高级分析技术(如机器学习和人工智能)的算法,但不能在医院环境中应用
没有概念框架或实证分析的描述性论文
只注重初级保健(如全科医生)
上线前的考虑事项(例如,软件开发)
论文和非同行评审的出版物(如白皮书和社论)
将相关文章导入NVivo (version 12;QSR International),在那里迭代地执行分析。为确保编码的可靠性和一致性,编码规则手册[
在分析的第一步,研究团队进行了开放编码[
第三步,通过不断的比较[
在确定DQ维度和结果之后,编码的下一个阶段是确定DQ维度之间的相互关系(步骤5)和DQ维度与DQ结果之间的关系(步骤6)。为此,使用NVivo中相关的布尔运算符(AND和NEAR)执行矩阵编码查询函数。矩阵查询的结果由健康领域的专家研究人员进行了审查和验证。
在整个分析过程中,执行了为我们的发现提供可信度的步骤。首先,在开始分析之前,提取逐字编码的研究小组成员最初独立地审查了3篇常见文章,然后召集起来审查编码中的任何变化。此外,他们每周召开多次会议,讨论编码并更新代码本,以确保遵循一致的方法。在整个分析过程中进行编码确证,由2名经验丰富的研究人员独立验证所有逐字编码,直到达成共识[
分析过程。DQ:数据质量。
绝大多数相关文章发表在期刊(169/227,74.4%),其次是会议论文集(42/227,18.5%)和书籍章节(16/227,7%)。169篇期刊文章发表在107种期刊上,其中发表>1篇研究的期刊占12% (n=13)
总的来说,如
在随后的部分中,我们将概述DQ定义、DQ维度、它们之间的相互关系以及DQ结果,以开发统一的数字健康DQ框架。
出版物按年份分列。
文献中讨论了DQ的多种定义(
总共确定了30个子主题,并将其分为6个DQ维度:准确性、一致性、完整性、上下文有效性、可访问性和流通性(
数据质量(DQ)维度的描述。
维 | 描述 | Subthemes |
精度 | “数据揭示所描述事件真相的程度”[ |
有效性、正确性、完整性、一致性、合理性、真实性和准确的诊断数据 |
一致性 | “基于特定的信息需求,表示相同对象的数据项之间不存在差异。在不同数据库间比较时,一致的数据包含相同的数据值" [ |
不一致的数据捕获、标准化、一致性、唯一性、数据可变性、时间可变性、系统差异、语义一致性、结构化和表示一致性 |
完整性 | “在一段时间内的某一时刻或在一段时间内的多个时刻测量数据的缺失”[ |
缺失的数据、完整程度、代表性、碎片和文档的广度 |
语境有效性 | “视乎工作而定”[ |
上下文DQ、使用适用性、粒度和相关性 |
可访问性 | “使用者提取感兴趣的资料是否可行”[ |
可访问DQ和可用性 |
货币 | “从所要求的时间点来看,数据代表现实的程度”[ |
及时性 |
可访问性维度(28/ 227,12.3%)由可访问性(15/ 28,54%)和可用性(13/ 28,46%)两个子主题组成,反映了用户提取感兴趣数据的可行性[
准确性维度(123/227,54.2%)由7个子主题组成,即正确性(42/123,34.1%)、有效性(23/123,18.7%)、完整性(19/123,15.4%)、可信性(17/123,13.8%)、诊断数据准确性(13/123,10.6%)、符合性(7/123,5.7%)和准确性(2/123,1.6%)。准确性指数据在多大程度上揭示了所描述事件的真相[
研究通常将准确度称为“
为了评估准确性,文献经常断言数据必须是
完整性维度(114/227,50.2%)由5个子主题组成:缺失数据(66/114,57.9%)、完整性水平(25/114,21.9%)、代表性(13/114,11.4%)、碎片化(8/114,7%)和文献广度(2/114,1.8%)。一个被广泛接受的数据完整性定义考虑了4个方面:文件化(数据中对患者的观察结果的存在)、广度(所有期望的数据形式的存在)、密度(随时间推移数据值的期望频率的存在)和预测(存在足够的数据来预测结果)[
一些研究提出了提高完整性的技术,包括开发适合用途的用户界面[
在某些情况下,
一致性维度(157/227,69.2%)由10个子主题组成:数据捕获不一致(33/157,21%)、标准化(28/157,17.8%)、一致性(22/157,14%)、唯一性(14/157,8.9%)、数据变异性(14/157,8.9%)、时间变异性(13/157,8.3%)、系统差异(12/157,7.6%)、语义一致性(10/157,6.4%)、结构性(7/157,4.5%)和表征一致性(4/157,2.5%)。
此外,由于结构化数据与非结构化数据的不同,系统内的冗余可能导致数据输入不一致[
上下文效度维度(26/ 227,11.5%)由4个子主题组成:使用适应度(11/ 26,42%),上下文DQ(9/ 26,35%),粒度(4/ 26,15%)和相关性(2/ 26,8%)。上下文效度要求对产生数据的上下文有深刻的理解[
货币维度(18/227,7.9%)由单个子主题组成:
如
一致性影响所有DQ维度。通常,这些关系表现为结构化和一致的数据输入的存在,这促使完整和准确的数据被输入到卫生信息系统中,并在治疗患者时为卫生保健专业人员提供更容易访问的最新数据。正如Roukema等人[
数据的可及性对DQ的货币维度有影响。当数据不容易获得时,它们很少能满足保健或研究目的所需信息的及时性[
此外,完整性影响数据的准确性;如Makeleni和Cilliers [
准确性和语境效度呈现双向关系。文献表明,准确性影响语境效度;但是,不能简单地从结构化表单字段中提取数据,还需要参考自由文本字段。例如,Kim和Kim [
数据质量(DQ)维度之间的相互关系。
对文献的分析确定了五种类型的数字健康DQ结果:(1)临床,(2)业务流程,(3)临床医生,(4)研究相关,(5)组织结果(
我们发现可访问性DQ维度影响临床、临床医生、业务流程、研究相关和组织结果。就…而言
文献表明,数据准确性的影响
一致性DQ维度与所有DQ结果相关。通常报告说,数据的不一致会对
发现不完整的电子病历数据有影响
之间的关系
DQ维度 | 结果一个 | ||||
研究 | 组织 | 业务流程 | 临床 | 临床医生 | |
可访问性 | ✓ | ✓ | ✓ | ✓ | ✓ |
精度 | ✓ | ✓ | |||
完整性 | ✓ | ✓ | ✓ | ✓ | |
一致性 | ✓ | ✓ | ✓ | ✓ | ✓ |
语境有效性 | ✓ | ||||
货币 |
一个复选标记符号表示DQ维度与结果之间的关系在文献中有报道。空白单元格表示没有证据支持这种关系。
综合数字卫生数据质量维度和结果框架。
以下部分描述了本研究的三个主要发现:(1)DQ的维度,(2)DQ各维度之间的相互关系,(3)DQ的结果。如《
总之,我们发现了3个核心发现。首先,我们确定了数字健康领域DQ的6个维度:一致性、可访问性、完整性、准确性、上下文有效性和流通性。这些维度是从文献中描述的30个次级主题合成的。我们发现一致性、完整性和准确性是DQ的主要维度。相对而言,对可及性、流通性和语境效度的研究较少。其次,我们确定了数字健康DQ的这六个维度之间的相互关系(
我们的发现从三个方面扩展了之前关于数字健康DQ的研究。首先,通过我们严格的方法,我们确定了一套全面的DQ维度,这既证实了现有的文献,也扩展了现有的文献。例如,Weiskopf和Weng [
其次,与以往对DQ维度的研究不同,我们还展示了这些维度是如何相互关联的。通过分析这些DQ维度之间的相互关系,我们可以确定一个特定维度如何影响另一个维度,以及这种关系在哪个方向展开。这对数字医疗从业者来说是一个重要的启示,尽管有几项研究已经研究了如何验证[
第三,尽管以前的研究描述了DQ如何影响特定的结果(例如,Weiskopf等人的研究[
这项研究强调了6个DQ维度的重要性:一致性、可访问性、完整性、准确性、上下文有效性和流通性。这些维度在文献中受到了不同程度的关注。虽然我们观察到一些DQ维度,如可访问性、上下文有效性和货币被讨论的频率低于其他维度,但这并不意味着这些维度对评估不重要。这一点在
本研究确定的DQ- do框架是通过严格的系统文献综述过程制定的,该过程综合了与数字健康DQ相关的文献。为了扩展本研究,我们提倡实证混合方法案例研究来验证该框架,包括基于现实数据和咨询各种利益相关者,对DQ维度和DQ结果之间的相互关系进行检查。现有方法可用于识别数字卫生系统日志中存在的与DQ维度相关的问题[
虽然这项研究为更全面地理解数字健康数据的DQ维度及其对结果的影响提供了第一步,但它没有探索这些DQ挑战的潜在原因。不了解这些DQ问题背后的原因,基于证据的卫生保健决策的真正潜力仍未实现。未来的研究应该检查医疗保健数据中DQ挑战的根本原因,以防止此类挑战的发生。Odigos框架可能有助于阐明DQ问题的根本原因,该框架表明DQ问题源自社会世界(如宏观和情境结构、角色和规范)、物质世界(如电子病历系统和技术基础设施的质量)和个人世界(如卫生保健专业人员的特征和行为)[
尽管预防胜于治疗(参见含义3),但并非所有DQ错误都可以预防或减轻。许多医疗保健组织通常会将资源用于数据清理,以便及时获得高质量的数据,这仍然是必要的(尽管希望程度较低)。一些研究(如Weiskopf et al [
本综述的范围是研究在医院环境中产生的数字健康数据,而不是在其他卫生保健环境中产生的数据。这是必要的,因为急诊卫生保健环境和初级卫生保健之间存在巨大差异。未来的研究应寻求调查初级保健机构的数字健康数据,以确定与这些机构相关的DQ维度和结果。此外,本文献综述的范围仅限于同行评议的出版物,排除了可能导致发表偏倚的“灰色”文献。虽然这种范围界定可能导致排除了一些相关条款,但有必要确保数字卫生DQ框架开发背后的质量。我们的方法可能引起的另一个限制是,由于我们搜索返回的文章数量庞大,我们没有执行双重编码(即两个独立的研究人员分析同一篇文章)。为了减轻这一限制,我们采取了一些措施,通过进行编码员确证会议和小组验证来减少偏见,如文章中所述
在本研究中进行的多学科系统文献综述导致了一个整合的数字健康DQ框架的发展,该框架包括6个DQ维度、这些维度之间的相互关系、6个DQ结果以及这些维度与结果之间的关系。我们确定了四个核心启示,以激励未来的研究:具体而言,研究者应该(1)平等地考虑DQ的所有维度,因为维度可以直接或间接地影响DQ的结果;(2)采用混合方法案例研究设计对DQ-DO框架进行实证评估;(3)确定数字健康DQ问题的根本原因;(4)制定干预措施,以减轻DQ问题或防止其产生。DQ- do框架为医疗保健管理人员(如首席信息官和首席临床信息官)提供了关于DQ问题的见解,以及他们对哪些数字健康相关结果有影响,这可以帮助他们优先处理与DQ相关的问题。
关键术语的描述。
搜索策略的验证。
数据编码结构。
发布媒体。
数据质量定义。
每个数据质量维度的子主题的证据。
数据质量各维度之间相互关系的证据。
数据质量结果的证据。
数据质量
数据质量维度和结果
电子健康记录
电子病历
系统评价和荟萃分析的首选报告项目
作者感谢昆士兰科技大学数据科学中心提供的支持。
没有宣布。