JMIR医学信息学-评估用于搜索医学文档的自然语言处理算法对临床任务效率的影响:前瞻性交叉研究

原始论文

¹爱丁堡医学院，医学和兽医学院，爱丁堡，爱丁堡，英国

²欧洲佳能医学研究，爱丁堡，联合王国

^3.联合王国爱丁堡大学亚瑟研究所全球卫生研究中心

⁴爱丁堡大学工程学院，英国爱丁堡

⁵见致谢，英国，联合王国

*这些作者贡献相同

通讯作者:

朴恩秀H, BMedSci

爱丁堡医学院

医学与兽医学院“，

爱丁堡大学

总理大楼

小法兰西新月

爱丁堡，EH16 4SB

联合王国

电话:44 1312426792

电子邮件:e.park-7@sms.ed.ac.uk

背景:从电子健康档案(EHRs)中的自由文本中检索信息既耗时又复杂。我们假设，自然语言处理(NLP)增强的电子病历搜索功能可以使临床工作流程更有效，并减少临床医生的认知负荷。

摘要目的:本研究旨在评估3个级别的搜索功能(无搜索、字符串搜索和nlp增强搜索)在模拟临床环境中从EHR文档的自由文本中支持临床用户IR的有效性。

方法:通过将3组患者记录上传到EHR研究软件应用程序中，并将其与3个相应的IR任务一起呈现，模拟了临床环境。任务包括多项选择题和自由文本题。采用前瞻性交叉研究设计，招募了3组评估者，其中包括医生(n=19)和医学生(n=16)。评估者按照随机分配的小组的顺序使用每个搜索功能执行这3个任务。测量和分析了任务完成的速度和准确性，并在反馈调查中审查了用户对nlp增强搜索的看法。

结果:nlp增强搜索比两种字符串搜索更能促进更准确的任务完成(5.14%;P=.02)及没有查册(5.13%;P=。08)。nlp增强搜索和字符串搜索促进了类似的任务速度，与无搜索功能相比，两者的速度都提高了11.5% (P=.008)及16.0% (P分别= .007)。总体而言，93%的评估人员同意nlp增强搜索将使临床工作流程比字符串搜索更有效，定性反馈报告称nlp增强搜索减少了认知负荷。

结论:据我们所知，这项研究是迄今为止在实际临床工作流程中支持目标临床用户的不同搜索功能的最大评估，具有3个方向的前瞻性交叉研究设计。与不搜索浏览临床记录相比，nlp增强搜索提高了临床EHR IR任务的准确性和速度。与直接搜索词匹配相比，nlp增强搜索提高了准确性，减少了临床EHR IR任务所需的搜索次数。

JMIR Med Inform 2022;10(10):e39616

doi: 10.2196/39616

关键字

临床决策支持；电子健康记录；自然语言处理；语义搜索；临床信息学

背景

从纸质病历存储病人信息到电子健康记录(EHRs)的转变带来的好处一直是医疗保健专业人员争论的话题[1-4］．许多临床医生对他们目前的医院系统表示不满，电子病历的使用一直被认为是临床医生倦怠的一个因素[5-7］．医生大约40%的时间花在记录患者信息上，有证据表明，在实施电子病历后，这一工作负担有所增加[8，9］．然而，从这些文件中快速准确地检索相关信息的困难表明，这些收集到的丰富信息往往没有得到充分利用[10，11］．由于医疗文本的复杂性，浏览EHR文档具有挑战性，其中往往包括频繁的拼写错误、缩写、特定专业的首字母缩写和临床速记[12-15］．从电子病历收集信息费时且不准确，限制了更广泛临床工作流程的效率[16]，部分医生认为检索病人资料的困难会严重影响面对面的病人护理[17］．

尽管通用搜索引擎越来越复杂，但在医疗记录软件中仍然有相对有限的搜索选项。其中一个障碍是需要安全保存患者数据;因此，对计算能力和共享资源的访问可能受到限制。为了具有临床效用，搜索工具必须快速而直观地供时间紧张的临床医生使用，包括经常委托给他们搜索复杂笔记的相对初级工作人员。此外，搜索必须处理上面提到的文本表达式的高可变性。临床文本容易出错;与期刊和其他出版物不同，它没有编辑控制来检查错误。医学术语、首字母缩写和缩写在不同地区和医院之间，甚至在不同的专业之间都有所不同;例如，“CHD”可能与慢性心脏病(心脏病学)、先天性心脏病(儿科学)或先天性髋关节脱位(骨科)有关。由于临床护理是一个高风险的环境，未能找到相关信息可能有很大的影响; to effectively save the time of clinicians, search tools should ideally go beyond document-level results to locate and highlight all relevant sentences or even words within a document. Efforts to achieve easier information retrieval (IR) have included the integration of string search in some EHRs, similar to the “Ctrl-F” or “Find” function that is now frequently available on everyday platforms [18］．然而，字符串搜索对于异质临床文本的有效性有限;因此，也有研究考虑了语义搜索算法[19-22］．对电子病历中搜索的大规模回顾性分析发现，搜索的使用在用户角色之间和内部有很大差异，医生和药剂师是最活跃的用户群体[19］．对电子病历中搜索的使用进行回顾发现，很少有文章关注搜索在临床工作流程中的影响[23];一项针对7名糖尿病专家的研究发现，在寻找相关信息时，基于内容的搜索比传统搜索更快、更准确[20.]，另一项针对10名家庭和内科医生的研究发现，语义搜索可以使IR任务的医疗记录导航更快[21]，最后一项针对4名学生的研究发现，语义搜索工具可以更快地总结临床记录[22］．所述研究中只有一项[20.]采用了交叉研究设计。在本文中，报道了一项更大的研究(n=35个有效任务完成，n=42个定性响应)，其中进行了一项3向前瞻性交叉研究，比较了标准字符串搜索与无搜索以及自然语言处理(NLP)增强搜索。自定义nlp增强的搜索工具将本体与模糊匹配结合起来，以提供搜索功能，它不仅捕获语义相关的术语(例如，同义词和下标)，还捕获语言上的替代拼写和拼写错误以及搜索术语的单词形式。模拟临床环境与目标用户反馈一起使用，以确定搜索工具是否可以使临床工作流程更有效，并减少临床医生在试图查找信息时的认知负担。

目标和假设

本研究旨在定量和定性地比较3种搜索功能对医学自由文本文档IR的有效性，包括准确性、速度和搜索的便利性。

我们假设，搜索工具将允许临床用户比不使用搜索时更快、更准确地执行模拟临床IR任务，使用NLP技术使NLP增强搜索比字符串搜索更有效。

搜索工具

字符串搜索函数是一个开源的JavaScript库实现[24］．NLP增强搜索是一种专有的基于规则的算法(由欧洲佳能医学研究公司开发)，它利用了NLP技术，如编辑距离和与医学知识库相结合的词干，特别是统一医学语言系统语义网络，Metathesaurus [25]，以及维基百科上的医学缩写列表[26]及OpenMD [27］．这些来源用于将原始搜索词扩展为等价词的列表，然后定位到文本中。该工具旨在定位语言变体，如拼写错误和替代拼写、单词形式和缩写，以及其他语义同义词。

搜索工具集成到以患者为中心的查看器(EHR研究软件)中，允许用户输入搜索词并查看检索到的文档子集中突出显示的结果，用户可以滚动浏览。在不进行搜索的情况下，用户将滚动患者的EHR以查找相关信息。图1说明以患者为中心的查看器中两种搜索工具之间的区别。

图1。(A)字符串搜索和(B) nlp增强搜索词“heart”的示例结果。字符串搜索只返回与“heart”(绿色高亮部分)的直接匹配项，而nlp增强搜索也返回语义相关的术语(黄色高亮部分)，例如:“冠状动脉”，将心房(颤动)错误拼写为“atriall”，以及在心力衰竭的缩写“HF”中出现“heart”。NLP:自然语言处理。

模拟临床工作流程

概述

为3个虚构的病人合成了自由文本的医疗文档。这些材料与每个患者对应的10组IR问题配对，以相关和现实的临床场景为基础。患者文档被上传到以患者为中心的查看器。问题被上传到使用Vue.js构建的自定义评估平台上，该平台还为评估者显示了临床场景和特定任务的说明。下面，我们将更详细地描述文档合成和问题生成。

病人文件合成

建立了三个不同年龄、性别、种族背景、社会历史和病史的患者档案。3例患者被分配为呼吸内科、神经内科和肿瘤科的主要医学专业。对于每个患者，通过选择和增加公开可用的匿名医疗文档来创建20个文档[28]，以及手动合成额外的文件，为患者的电子病历提供连贯的临床事件的时间顺序。文件多种多样，包括出院信、门诊信、手术记录和全科转诊信。为了模仿真实世界的医学文本，使用研究者临床经验(作者HW)和参考论文，文本中包括常见的拼写错误、缩写和首字母缩写[13］．

临床场景和问题生成

对于每个任务，临床场景都被设计成专注于现实世界的情况，其中信息可以从患者的笔记中提取出来。为了确保任务在患者(因此干预措施)之间具有可比性，创建了一个包含10个提示IR的主模板，然后根据每个患者的情况进行定制。问题的灵感来自于过去的医疗检查[29和研究者(HW和FM)的临床经验。所请求的信息类似于典型临床工作流程中支持临床决策所需的信息。注意确保任务问题测试的是搜索功能，而不是临床知识或判断;因此，所有的答案都可以通过搜索各自患者的笔记来找到。问题包括多项选择题和自由作答。每个病人的情况和相应的问题的例子可以在表1．

表1。每个患者的临床场景示例及其相应的问答选项。旨在模拟标准临床工作流程的场景，为问题提供上下文。

病人	临床场景示例	例子问题	回答的类型
1	你担心这可能是先前感染的恶化。在送病人去做胸部x光检查并抽血之后，你继续寻找更多的信息。	该患者在2020年12月至2021年2月期间是否有呼吸道感染史?	选择以下其中一项: 是的 ‎ 没有 ‎ 资料不可提供 ‎ ‎
		为什么病人停止服用呋喃妥因?	自由文本 ‎
2	患者神志不清并出现急性中风样症状就诊急诊科。他的儿子报告说以前有过两次“小中风”。你是一名急诊科登记员，按规定让他做个CT头。在等待结果的同时，你搜索他的病史，寻找溶栓治疗的其他禁忌症。	患者在2020年11月至2021年2月(含)期间是否有头部外伤或中风史?	选择以下其中一项: 是的 ‎ 没有 ‎ 资料不可提供 ‎ ‎
		搜索笔记，找到上述“小中风”(如短暂性缺血发作)的日期。	自由文本 ‎
3.	你是诊所新来的肿瘤科医生，为这个病人做复查。在预约之前，你想通过查看她的笔记来检查她的历史，这样你就可以为咨询做好充分的准备。	病人的癌症诊断是什么?	自由文本 ‎
		该患者有下列病史吗?	选择所有适用的: 转移 ‎ 高血压 ‎ 癫痫 ‎ 哮喘 ‎ 以上都不是 ‎ ‎

研究设计

临床评价管道的结构具有前瞻性交叉试验设计;我们已经在图2．评估人员根据其临床经验水平进行分组，然后分配假名评估人员id，用于其余的研究和分析。然后使用随机数发生器在3个研究组中随机分配每个波段的评估者。这产生了3组分层的临床经验水平。每个组都有预先确定的搜索功能顺序;使用分配的搜索顺序完成3个任务后，评估人员被要求填写一份反馈调查，重点关注他们的用户体验。

评估员招聘与培训

该研究的招募是通过专业联系和在社交媒体渠道上做广告来完成的，以接触到来自各种临床专业和多年临床经验的评估人员。

向评估人员提供了一段培训视频，其中包括对研究的简要介绍，以患者为中心的查看器中3种搜索干预的演示，以及如何完成评估的详细说明。还提供了一个病人的例子，他有一小套精心挑选的医疗文件供培训，评估人员可以在这个例子上熟悉不同搜索功能的能力。

数据收集

评估人员可安全远程访问评估环境(图3)，允许从个人设备远程进行评估。使用此设置，评估人员可以查看以患者为中心的查看器和评估平台。答案必须按顺序在评估平台上输入，评估人员在提交答案后不允许返回到某个问题。

在每个任务中，评估者通过评估平台提交任务问题的答案。为了确保准确记录任务时间，评估人员被要求一次性完成每项任务，并在任务之间休息而不是在任务期间休息。评估人员可以自由地在每项任务上花费他们所需的时间。此外，还维护了一个搜索日志，其中记录了评估者输入的搜索词、使用的搜索功能以及花费在每个问题上的时间。

图3。任务期间评估环境的屏幕截图。评估人员只允许查看两个相关站点:以患者为中心的查看器(左)和评估平台(右)。以患者为中心的查看器包含给定患者(在本例中为“Joseph Williams”)的合成患者文档，搜索词为“hba1c”。评估平台详细描述了临床场景、任务特定说明和问答部分。

数据分析

排除标准

如果搜索日志显示评估人员对给定任务使用了不正确的搜索功能，则排除数据。

问题标记

两位临床研究者(EP和HW)对每个问题的正确答案达成了共识。然后，答案会根据它们所在的文档进行聚类，找到正确文档的每个相关区域就会获得分数。例如，如果正确回答一个问题需要2个不同文档中的3个临床信息，那么如果输入了正确答案，则会获得2分，因为评估者已经成功找到了两份文档。问题的权重相同。

统计分析

数据分析使用自定义Python代码执行。对于所有指标，样本都进行了加权，以弥补群体规模的不平衡(见评估者人口统计和群体分层)．成对2-tailedt进行测试，以确定(1)字符串搜索和不搜索，(2)nlp增强搜索和不搜索，以及(3)nlp增强搜索和字符串搜索之间的时间和准确性是否存在显著差异。的显著性水平P=。10was applied.

检索词分析

在研究之后，对搜索词日志进行分析，以提取每种搜索类型的搜索词的数量和模式。

用户感知

用户感知通过反馈调查进行评估(见多媒体附件1)，其中包括李克特量表评分，从“非常不同意”到“非常同意”，以及自由文本回复。我们将自由文本回答按主题聚类;我们已在用户对nlp增强搜索的感知部分，因为它们涉及到4个潜在的问题:“如何感知nlp增强搜索?”;“nlp增强搜索比字符串搜索更好吗?”“nlp增强搜索会使临床工作流程更高效吗?”以及“nlp增强搜索会减少认知负荷吗?”

评估者人口统计和群体分层

总共招募了60名具有不同临床经验的评估人员，从医学院学生到医生，从血管外科到全科医生等9个专业。在60名征聘的评价人员中，44人完成了任务;35个纳入最终分析(表2)，另有9人被排除在外。如果评估者的数据被破坏(n=2)或他们不正确地完成任务(n=7)，则被排除在定量分析之外;例如，对给定的任务使用错误的搜索功能。从最初的每组20名评估者中，我们观察到7名(第1组)，13名(第2组)和15名(第3组)成功完成。对反馈调查有42个回复。表2显示各组临床经验的最终分布。

表2。跨临床组和研究组的分配总结。

临床带			组1		组2		组3		总计
医科学生，n
	临床前(1-3年)	4		3.		3.		10
	临床(4-6岁)	0		4		2		6
医生、n
	1-5年临床经验	0		3.		3.		6
	6-10年临床经验	1		1		4		6
	11年以上临床经验	2		2		3.		7
总n			7		13		15		35

搜索功能对任务完成速度和准确性的影响

结果显示在表3而且4．总体而言，nlp增强搜索比字符串搜索(5.14%)和不搜索(5.13%)更能促进更准确的任务完成。在速度方面，nlp增强搜索和字符串搜索的任务完成速度明显快于不搜索(分别为11.5%和16.0%);字符串搜索与nlp增强搜索之间无显著时间差。

表3。不同搜索功能的准确性和时间，显示跨评估器的平均值(SD值)。

搜索功能	准确度(%)，平均值(SD)	每项任务的时间(分钟)，平均值(SD)
没有一个	83.8 (9.94)	20.2 (10.8)
字符串	83.7 (10.8)	17.0 (5.9)^一个
增强的自然语言处理	88.1 (9.07)^一个	17.9 (7.20)

^一个最好的结果。

表4。不同搜索功能之间的两两比较，显示了评估器之间差异的平均值(SD)值。

搜索功能比较对	准确度增加(%)			时差(分钟)
	差值，平均值(%;SD)	P价值	差值，平均值(%;SD)		P价值
vs string	-0.01 (0.01;14.5)	公布	-3.22 (-16.0;9.78)		.006
None vs nlp增强	4.30 (5.13;13.1)	。08	-2.32 (-11.5;7.64)		.008
字符串vs nlp增强	4.30 (5.14;10.5)	02	0.91 (5.34;5.05)		只要

评价者使用的检索词分析

分析已记录的查册字词(表5)显示，与nlp增强搜索相比，评估者在使用字符串搜索时尝试的搜索词几乎是使用字符串搜索时的两倍，并且字符串搜索的使用略低于nlp增强搜索;也就是说，不进行搜索的问题的百分比在字符串搜索中更高。

字符串搜索所需的搜索词较多，可能直观地解释为用户需要尝试多个同义词来查找相关信息。例如，对于“病人有中风史吗?”的文本中，有4个负面的提及分散在文件中:“看起来不像中风”，“没有TIA或CVA”(即没有短暂性脑缺血发作或脑血管意外)，“没有CVA”和“没有CVA”。nlp增强搜索发现所有提及的搜索词都是“中风”(这是评估者尝试的唯一一个词)，但字符串搜索评估者也尝试了“TIA”、“CVA”、“神经学”、“病史”和“梗死”，以努力找到所有相关信息。有趣的是，我们发现评估者有时会搜索邻近的单词(“历史”或“神经学”)，很可能是为了绕过文本提及中可能的变化。此外，字符串搜索不匹配拼写变量(或拼写错误);因此，评估者有时会尝试不同的拼写;例如，对于“患者目前是否正在接受全剂量抗凝治疗?”“抗凝血剂”和“抗凝血剂”都被评价者使用字符串搜索作为连续搜索词。

该分析还强调，字符串搜索的严格参数设置意味着搜索词只匹配整个单词，而不匹配子字符串;因此，求值器不能使用前缀进行搜索。我们观察到一些评估者适应这种情况的证据——例如，先搜索“抗凝血剂”，再搜索“抗凝血剂”，或者同时搜索“烟”和“吸烟者”——这也增加了尝试搜索词的数量。

表5所示。对已使用搜索词的分析，显示使用搜索的答案的百分比，以及每个答案的搜索词数量的平均值(SD)。

搜索功能	答案使用搜索功能，%	每个答案的搜索字数，平均值(SD)
字符串	83.7	3.51 (2.91)
增强的自然语言处理	95.1^一个	2.05 (1.49)^一个

^一个最好的结果。

用户对nlp增强搜索的感知

我们使用的调查显示多媒体附件1收集用户对nlp增强搜索的感知信息。下面我们将回答分为4个标题。

如何感知nlp增强搜索?

大多数受访者积极地描述了nlp增强搜索的功能，指出它可以识别拼写错误、单词形式和同义词，尽管一些人报告说nlp增强搜索返回了太多的结果(“[nlp增强]搜索非常聪明和彻底，但可以返回100个结果”)．然而，当评估nlp增强搜索的有效性时，76%的受访者认为任何不相关的发现(即假阳性)都不会显著影响搜索算法的有用性。

nlp增强搜索比字符串搜索更好吗?

总体而言，81%的受访者同意nlp增强搜索比字符串搜索更有利于相关IR。然而，许多人评论说，以患者为中心的查看器中的字符串搜索功能比他们在日常设备上习惯的更有限，并指出“字符串搜索太具有歧视性”(参数设置意味着只返回整个单词匹配，而不是子字符串，如中所讨论的那样评价者使用的检索词分析部分)。

nlp增强搜索能使临床工作流程更高效吗?

总体而言，93%的受访者(39/42)同意nlp增强搜索将使临床工作流程比字符串搜索更有效，特别是在诊所和病人助理期间。自由文本反馈反映了这一点，受访者报告说，在检索特定信息时，nlp增强的搜索比字符串搜索或不搜索更有用，更节省时间。一位评估者评论说:“[nlp增强的]搜索工具使我更容易找到我正在寻找的信息，而且速度更快。”另一方面，受访者进一步报告说，在需要对患者进行全面概述的情况下，nlp增强搜索并不总是最佳方法。在这种情况下，使用手动回顾(不搜索)来吸收信息会更有效。一位评估者说:“我觉得使用[nlp增强的]搜索工具意味着我不太关注案例，而只是寻找单词。”一个普遍的意见是nlp增强搜索将是临床任务手动审查的有用补充。

nlp增强搜索会减少认知负荷吗?

受访者经常提到nlp增强的搜索使他们更容易检索他们正在寻找的信息，一位评估者表示，“[nlp增强的]搜索是一种快速过滤相关信息的极好工具。”虽然少数人提到返回的结果太多，但受访者也报告说，查看相关发现比完全手动查看笔记更容易，更可取，手动查看被描述为“乏味”、“艰苦”和“非常容易错过重要信息”。一位评估者评论说，nlp增强的搜索可以“改善已经超负荷工作的职业的工作量”。

主要研究结果

我们的结果显示，与使用字符串搜索和不使用搜索相比，使用nlp增强搜索的准确性显著提高，而nlp增强搜索和字符串搜索都节省了时间。在nlp增强搜索的情况下，评估者认为导航更容易，所需的交互性也有所下降(搜索词的数量比字符串搜索的数量更少)。我们注意到，字符串搜索的严格参数设置意味着搜索词只匹配整个单词，而不是子字符串;与匹配子字符串的字符串搜索版本相比，这增加了计算器使用的术语数量，并可能降低搜索精度。

关于电子病历搜索工具对日常临床护理的潜在影响的文献有限[30.］．我们的研究结果支持了之前的研究[20.-22]，他们报告了语义搜索工具可以在模拟临床工作流程中更快、更准确地完成EHR任务。有关研究[31报道称，人工智能优化的患者记录在保持相同准确性的同时提高了回答临床问题的速度。有趣的是，患者记录搜索引擎MorphoSaurus的影响已经在现实世界的临床环境中得到了衡量。32]，尽管只进行用户调查。这种方法的好处是可以考虑到现实世界的压力，如任务中断和时间压力，以及患者互动的关键因素。然而，重要的是，我们使用受控模拟临床环境的方法使我们能够控制诸如干扰或中断等变量，以及医疗记录的复杂性和长度的变化。此外，我们的交叉设计控制了个体参与者的能力、经验和勤奋程度。这样可以对每种搜索类型的定量和定性数据进行稳健的比较，同时最大限度地减少混杂因素的影响。

总的来说，评估人员的反馈表明，浏览临床记录的最佳方法是手动浏览和搜索的混合，取决于上下文。在现实世界中，nlp增强的搜索可能最好用作辅助工具，以帮助临床用户导航临床记录，从复杂的病史中手动解析和摄取相关事实的能力仍然很重要。

结论

总之，本研究表明，搜索工具对临床IR的测量和感知准确性和易用性都有积极的影响。能够利用NLP技术的搜索工具更有效地从异类医学免费文本中检索所有相关术语。有可能减少临床医生的认知负担，使临床工作流程更有效。未来研究的一个关键方向是评估搜索工具在真实临床实践中的使用。

致谢

我们感谢Keith W Muir教授(格拉斯哥大学神经科学与心理学研究所)在开发自然语言处理(NLP)增强搜索工具期间的临床见解。我们要感谢大格拉斯哥和克莱德国家卫生服务系统(NHS)内的苏格兰西部安全港在创建和提供nlp增强搜索工具开发期间使用的数据集方面的帮助。

非常感谢欧洲佳能医学研究中心的工作人员，他们开发了这项评估所需的基础设施:Yvonne Belton, Michael Corrigan, Vismantas Dilys, Francisco Gomez, Graham Jones, Hamish MacKinnon, David Miller, Emel Muzaç， Paul Norman和Euan Robertson。此外，我们要感谢负责创建nlp增强搜索工具的研究团队:Murray Cutforth, Vismantas Dilys, Matúš Falis, Aneta Lisowska, Hamish MacKinnon, Maciej Pajak, Alison O 'Neil和Hannah Watson。

我们感谢我们的评估人员:Fiona Auld、Anna Barton、Rong Bing、Cameron Brown、Khai Syuen Chew、Jane Yi Chiam、Vanessa Chou、Luisa Ciriello、George Cooper、Iona Cutworth、Jamie Donachie、Vivienne Evans、Magdalena Gabrysiak、Eilidh Gunn、Mohamed Hamed、Hamzah Hanif、Ewen Harrison、Kylla Hernandez、Lana Huang、Katie Hunter、Haider Khan、David Kluth、Niki Kouvroukoglou、Barbora Krivankova、Tommy Le、Charles Leeson-Payne、Alinah sumping Leung、Jenny Lockhart、Jack Lugue、Angus MacLeod、Tomos Morgan、Ellen Murgitroyd、Sarah Murphy, Helen O 'Neil, Yusuke Onishi, Lisa Ragunathan, Nikita Rana, Qi Shun Yong, Lucy Taylor, Evangelos Tzolos, Miriam Veenhuizen, Philippa Veenhuizen, Olivia Yu和Sydney Zides。

我们感谢我们的审前评估人员:Marcus Boyd, Elizabeth Daly, Greta Economides, Keziah Lewis, Abhishek Nambiar, Sumrah Naqvi, Risako Sakatsume, Faye Sikora和Emma Warburton。

我们感谢我们内部的佳能审稿人:威廉·克拉克特、罗素·洪和大卫·米勒。

我们感谢MTSamples允许自由使用和修改其数据以创建患者案例研究。

这项工作是数字诊断人工智能(AI)研究工业中心的一部分，该中心由创新英国代表英国研究与创新(项目104690)资助。FV Mehendale在爱丁堡大学的研究得到了加里东遗传基金会的支持。

作者的贡献

EHP参与设计了研究，参与设计了患者病史，审阅了合成的患者记录，设计了任务，设计了临床反馈调查，组织了评估人员招聘，记录了评估人员的培训材料，对结果进行了初步分析，并贡献了手稿草稿。HIW参与设计了研究，参与设计了患者病史，创建了综合患者笔记，审查了任务，审查了临床反馈调查，支持评估人员招聘，组织了实际评估的基础设施，对分析进行了贡献和审查，并对论文草稿进行了贡献和审查。FVM参与设计了这项研究，回顾了患者的病史，回顾了合成的患者记录，回顾了任务，回顾了临床反馈调查，回顾了分析，并贡献并审查了论文草稿。AQO参与设计了研究，组织提供了nlp增强搜索，审查了任务，审查了临床反馈调查，对分析进行了贡献和审查，并对手稿草稿进行了贡献和审查。

利益冲突

HIW和AQO是欧洲佳能医学研究公司的员工，他们为这项评估提供了软件和算法。EHP是由佳能医学研究欧洲在她的爱丁堡大学2021年春季理学学士研究项目(“用于搜索医疗文档的自然语言处理算法的评估”)赞助的，这是本次评估的基础。EHP之前为nlp增强搜索工具的开发执行了有偿注释工作。

‎

多媒体附件1

评估人员在完成临床任务时被要求填写的反馈调查。

PDF档案(adobepdf档案)，198 KB

荷兰达A，做卡莫E Sá HL，维埃拉A，卡特里布AMF。巴西某卫生区初级保健医生对电子健康记录的使用和满意度。J Med Syst 2012 10月;36(5):3141-3149 [免费全文] [CrossRef] [Medline］
King J, Patel V, Jamoom E, Furukawa MF。使用电子健康记录的临床益处:国家发现。卫生服务决议2014年2月;49(1 Pt 2):392-404 [免费全文] [CrossRef] [Medline］
刘峰，刘志强，刘志强，等。电子健康记录提高了临床记录的质量。美国医学信息学会2015年1月1日;22(1):199-205 [免费全文] [CrossRef] [Medline］
Entzeridou E, Markopoulou E, Mollaki V.公众和医生对电子健康记录的期望和伦理关注:除了信息安全之外，好处大于风险。国际医学杂志2018年2月;110:98-107 [免费全文] [CrossRef] [Medline］
Kroth P, Morioka-Douglas N, Veres S, Babbott S, Poplau S, Qeadan F，等。电子健康记录设计和使用因素与临床医生压力和倦怠的关系。2019年美国医学会网络公开赛8月2日;2(8):e199609 [免费全文] [CrossRef] [Medline］
史达伦J, Tierney W, Williams M, Tang P, Weir C, Koppel R，等。回顾2009年AMIA政策会议的预测和建议:我们是否看到与ehr相关的临床医生倦怠即将到来?J Am Med Inform association 2021年4月23日;28(5):948-954 [免费全文] [CrossRef] [Medline］
闫强，蒋泽，张海峰，李志强，李志强。探索电子健康记录与提供者倦怠之间的关系:系统回顾。美国医学通报协会2021年4月23日;28(5):1009-1021 [免费全文] [CrossRef] [Medline］
辛斯基C, Colligan L，李L, Prgomet M, Reynolds S, Goeders L，等。门诊医师时间分配:4个专科的时间与运动研究。安医学实习生2016年9月06日;165(11):753 [免费全文] [CrossRef］
朱克斯E，阿布汉纳A，柯尼特R，德凯泽NF。在引入结构化和标准化电子健康记录前后，专门用于患者护理和记录任务的时间。应用临床通报2018年1月;9(1):46-53 [免费全文] [CrossRef] [Medline］
Beasley J, Wetterneck T, Temte J, Lapin JA, Smith P, Rivera-Rodriguez AJ，等。初级保健中的信息混乱:对医生表现和病人安全的影响。中国医学杂志2011;24(6):745-751 [免费全文] [CrossRef] [Medline］
bljleven V, Koelemeijer K, Jaspers M.识别和消除信息系统使用中的低效:一个精益的视角。Int J Med Inform 2017 11月;107:40-47 [免费全文] [CrossRef] [Medline］
Meystre S, Savova G, Kipper-Schuler K，障碍J.从电子健康记录中的文本文档中提取信息:最近的研究综述。Yearb Med Inform 2018年3月07日;17(01):128-144。［CrossRef］
辛哈，麦克德莫特，斯里尼瓦斯，霍顿PWJ。医疗保健专业人员使用缩略语:前进的道路是什么?研究生医学J 2011七月;87(1029):450-452 [免费全文] [CrossRef] [Medline］
杜琴，朱俊杰，李国强，李国强。使用流行度分析在没有综合字典的情况下识别拼写错误的单词。AMIA年度会议2007年10月11日751-755 [免费全文] [Medline］
周玲，Mahoney LM, Shakurova A, Goss F，常飞，Bates DW，等。电子病历中有多少医嘱是通过自由文本输入的?——一项降糖药的研究。AMIA年度诉讼程序2012;2012:1079-1088 [免费全文] [Medline］
Farri O, Pieckiewicz DS, Rahman AS, Adam TJ, Pakhomov SV, Melton GB。临床医生合成EHR临床文件的定性分析。AMIA年度诉讼程序2012;2012:1211-1220 [免费全文] [Medline］
格拉本鲍尔L，斯金纳A，温德尔J.采用电子健康记录——也许这不是钱的问题。app clinin Inform 2017年12月16日;02(04):460-471 [免费全文] [CrossRef］
杨林，梅琼，郑凯，达哈诺尔。电子健康记录搜索引擎查询日志分析。AMIA年度会议程序2011;2011:915-924 [免费全文] [Medline］
李文杰，李志强，李志强，等。评估大型综合医疗保健系统中从业者的电子健康记录搜索模式和实践。美国医学会网络公开赛2020年3月2日;3(3):e200512 [免费全文] [CrossRef] [Medline］
Duftschmid G, Rinner C, Kohler M, Huebner-Bloder G, Saboor S, Ammenwerth E. EHR-ARCHE项目:在基于IHE XDS和原型的共享电子健康记录系统中满足临床信息需求。国际医学杂志2013年12月;82(12):1195-1207 [免费全文] [CrossRef] [Medline］
张志刚，张志刚，张志刚，张志刚。利用语义搜索减少电子病历中的认知负荷。2011年发表于:2011年IEEE第13届电子医疗网络、应用和服务国际会议;2011年6月13-15日;密苏里州哥伦比亚市[CrossRef］
朱晓霞，刘娟，刘志军，刘志军，刘志军。基于本体驱动的巴西葡萄牙语临床病历语义搜索。Stud Health technology Inform 2015;216:1022。［Medline］
Hill J, Visweswaran S, Ning X, Schleyer TK。电子健康记录中用于临床的搜索功能的使用、影响、弱点和高级特性:范围综述。应用临床信息2021年5月;12(3):417-428 [免费全文] [CrossRef] [Medline］
mark.js。URL:https://markjs.io/[2022-09-27]访问
Bodenreider O.统一医学语言系统(UMLS):整合生物医学术语。Nucleic Acids Res 2004 Jan 01;32(数据库issue):D267-D270 [免费全文] [CrossRef] [Medline］
医学缩略语列表。维基百科。URL:https://en.wikipedia.org/wiki/List_of_medical_abbreviations[2022-01-31]访问
医学缩略语和首字母缩写。OpenMD。URL:https://openmd.com/dictionary/medical-abbreviations[2022-02-23]访问
医疗文件。MTSamples。URL:https://www.mtsamples.com/index.asp[2022-01-31]访问
PassMedicine。URL:https://passmedicine.com/index.php[2022-01-31]访问
李志强，李志强，李志强，等。电子健康记录搜索工具中临床查询的分析。国际医学杂志2010年7月1日;79(7):515-522 [免费全文] [CrossRef] [Medline］
池艺，池庚，徐春涛，姜勇，贾尔克，库卡尔尼，等。开发和验证一个人工智能系统，以优化临床医生对患者记录的审查。美国医学会网络公开赛2021年7月01日;4(7):e2117391 [免费全文] [CrossRef] [Medline］
Schulz S, Daumke P, Fischer P, Müller M, Müller ML.临床科室系统中文档搜索引擎的评价。AMIA年度Symp Proc 2008年11月6:647-651 [免费全文] [Medline］

‎

患者:脑血管意外

电子健康档案:电子健康记录

红外光谱:信息检索

NLP:自然语言处理

蒂雅:短暂性脑缺血发作

uml:统一医学语言系统

C·洛维斯编辑;提交18.05.22;J Hefner同行评审;对作者15.07.22的评论;修订版本收到01.09.22;接受07.09.22;发表26.10.22

©Eunsoo H Park, Hannah I Watson, Felicity V Mehendale, Alison Q O'Neil，临床评估人员。最初发表在JMIR医学信息学(https://medinform.www.mybigtv.com)， 26.10.2022。

这是一篇开放获取的文章，根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布，允许在任何媒介上不受限制地使用、分发和复制，前提是正确引用了首次发表在JMIR医学信息学上的原创作品。必须包括完整的书目信息，https://medinform.www.mybigtv.com/上的原始出版物的链接，以及此版权和许可信息。

本文内容如下e-collection /主题问题:

评估自然语言处理算法搜索医疗文件对临床任务效率的影响:前瞻性交叉研究