JMIR公共卫生和监测-评估应急通信翻译技术的有用性:基于场景的研究

原始论文

¹美国华盛顿州西雅图市华盛顿大学卫生服务系公共卫生学院

²美国华盛顿州西雅图市华盛顿大学医学院生物医学信息与医学教育系

^3.华盛顿大学工程学院，以人为本设计与工程系，西雅图，华盛顿州，美国

通讯作者:

安妮M特纳，医学博士，MPH, MLIS

公共卫生学院

卫生服务部

华盛顿大学

1959年东北太平洋街

西雅图,华盛顿州,

美国

电话:1 206 221 3615

传真:1 206 616 9415

电子邮件:amturner@uw.edu

背景:在美国，语言障碍对紧急响应中的沟通构成了挑战，并影响了英语熟练程度有限(LEP)的个人的紧急护理交付和质量。紧急医疗服务(EMS)人员对使用自动翻译工具改善与现场LEP人员的沟通越来越感兴趣。然而，目前尚不清楚自动翻译软件能否在EMS环境中成功地用于改善与LEP人员的沟通。

摘要目的:这项工作的目标是使用基于场景的方法，与EMS提供商和非英语母语的用户谁认为自己是LEP(以下简称为LEP参与者)评估两种自动翻译技术在改善紧急通信方面的潜力。

方法:我们开发了模拟紧急情况，并与EMS人员、讲西班牙语和讲中文(普通话)的LEP参与者使用两种自动语言翻译工具:EMS领域特定固定句翻译工具(QuickSpeak)和统计机器翻译工具(谷歌Translate)在模拟会议中实施。在会议结束时，我们通过会后问卷收集了两组人的反馈。EMS参与者还完成了系统可用性量表(SUS)。

结果:我们共进行了5次小组会议(3次中文及2次西班牙语)，参加者包括12名说中文的LEP参加者、14名说西班牙语的LEP参加者及17名医疗服务服务人员。总体而言，EMS和LEP参与者之间的交流仍然有限，即使使用了这两种翻译工具。QuickSpeak的SUS平均得分高于谷歌Translate (65.3 vs 48.4;P= .04点)。虽然这两种工具都被认为不太令人满意，但在理解EMS人员的问题方面，LEP参与者更倾向于具有固定问题的特定领域系统(QuickSpeak)而不是自由文本翻译工具(谷歌Translate)(中文11/12,92% vs . 3/12, 25%;西班牙语12/14,86% vs 4/14, 29%)。虽然EMS和LEP参与者都赞赏自由文本工具的灵活性，但多重翻译错误和难以回答问题限制了它的实用性。

结论:正在出现的技术有可能在紧急反应中协助语言翻译;然而，在这些技术能够在现场安全使用之前，还需要提高准确性和可用性。

JMIR公共卫生监测2019;5(1):e11171

doi: 10.2196/11171

关键字

中国人；紧急医疗服务；应急响应；语言障碍；语言翻译；公共卫生信息学；西班牙语；英语水平有限；翻译技术

美国的语言多种多样，有350多种口语[1］．2016年，大约有6320万美国居民说英语以外的语言。2]，其中约40%(2540万人)被认为英语水平有限[3.］．LEP被定义为主要语言非英语，且英语读、说、写或理解能力有限[4］．

随着在美国出生的外国人口的增长，LEP个体的数量也在增长[5］．从1990年到2010年，美国的LEP人数增加了80%，这意味着在2010年，约有2520万或占美国5岁以上人口的9%被认为是LEP [5］．

该国许多地区的医疗保健提供者可能会经常遇到语言翻译的挑战。在医院环境中，语言障碍造成了LEP患者护理方面的差异，包括住院时间更长、医院获得性感染的风险更大以及出院后再入院的可能性更大[6］．在最坏的情况下，LEP患者会被误诊，并因治疗不当或延误而遭受严重后果[7］．在紧急反应环境中，LEP人员与紧急医疗服务(EMS)人员之间缺乏明确的沟通，可能会影响迅速和准确地派遣援助[8］．语言障碍被列为明尼苏达州EMS服务提供者护理延误的第二大常见原因[9］．虽然建议在涉及LEP人员的紧急情况下使用口译员和电话语言线路，但在与口译员联系方面的时间限制和明显的延误对使用口译员构成了障碍。

随着新技术的出现，与LEP个人交流的选择正在扩大。各种自动翻译工具已经开发出来，以协助语言不一致的个人之间的翻译和口译。在一项研究中，EMS人员报告说，他们使用个人移动设备上的数字应用程序，如谷歌Translate(一种免费的基于web的用于一般翻译用途的系统)，试图与患者沟通[10］．许多消防部门也在现场使用电子工具，如平板电脑[11］．该领域的平板电脑为使用其他翻译软件打开了大门。例如，一些EMS部门正在考虑使用“QuickSpeak”，这是一款基于平板电脑的翻译应用程序，也是少数专为应急响应设计的翻译工具之一。

虽然数字通信设备可能很有前途，但这些工具还没有被EMS系统地评估用于现场，而且几乎没有证据表明这些新策略在促进LEP个人和EMS提供者之间的通信方面的有用性。我们之前的工作和对文献的回顾表明，在临床或公共卫生环境中，大多数自动翻译系统不够准确，无法安全使用[12-19］．

这项研究在华盛顿的金县进行，在最近的一项调查中，78%(96/123)的911调度员报告说，与LEP患者的沟通困难影响了这些呼叫者得到的医疗护理[20.］．在华盛顿，西班牙语和汉语(普通话)是两种最常用的非英语语言。在美国的非英语使用者中，说汉语和西班牙语的人也是英语水平最可能有限的人群。21］．金县地区的许多EMS机构正在考虑使用自动化语言工具来改善与LEP人员的沟通，但担心这些工具在现场的安全性。本研究的目的是收集有关QuickSpeak和谷歌Translate(均被考虑用于King County的EMS人员)在紧急情况下如何执行的证据，在这种情况下，清晰的沟通对于快速识别、治疗和运送患者至关重要。具体来说，我们测试了QuickSpeak和谷歌Translate在模拟紧急响应设置中如何执行，这些设置要求快速EMS响应并将英语翻译为西班牙语和中文(普通话)。

参与者

在我们的研究中，我们重点研究了金县地区LEP人群最常用的两种语言:西班牙语和汉语(普通话)。我们从华盛顿金县的当地社区组织招募了母语不是英语、说西班牙语和汉语的个体，并自认为是LEP(以下简称LEP参与者)。双语研究团队成员与来自金县LEP个人服务项目的社区组织工作人员合作，招募参与者。此外，我们采用便利抽样，通过研究团队成员的个人联系来加强招聘。LEP参与者必须年满18岁，至少会说一些英语，但认为自己有英语沟通困难，更愿意用母语(西班牙语或中文)接受医疗护理，才有资格参加这项研究[22］．考虑到招募和与LEP人员合作的挑战，我们试图将参与者筛选程序的负担降至最低，并且没有在筛选中添加定量语言评估工具。华盛顿大学机构审查委员会批准了所有研究方案和材料。

我们通过方便抽样，从金县当地消防部门招募了EMS人员，包括值班消防员和急救医疗技术人员。研究组与LEP居民较多的地区附近的消防厅长进行了联系，要求在该地区招募消防队员，并进行模拟演习。我们根据何时达到数据饱和和没有其他回应来计算会话数[23］．

工具

金郡弱势人口策略计划[24团队确定了两种翻译工具，QuickSpeak和谷歌Translate, EMS人员正在试用(QuickSpeak)或在极少数情况下使用(谷歌Translate)。我们通过涉及紧急情况的模拟会议，调查了这些工具在改善EMS和LEP人员之间沟通方面的潜在用途。

QuickSpeak

QuickSpeak是一款EMS领域特定的翻译软件，可为EMS人员提供对第一反应人员提出的一组标准英语问题进行内部验证的口头翻译。QuickSpeak是为数不多的专为应急响应设计的翻译工具之一。EMS人员可以使用触摸屏选择书面问题，软件提供所需语言的录音翻译。所有问题都以“是”或“否”的回答形式提出。问题和答案不会被记录或存档。在这项研究中，QuickSpeak可以用7种语言进行应答:西班牙语、意大利语、法语、德语、芬兰语、汉语(普通话)和越南语。图1和2QuickSpeak的截图。

图2。QuickSpeak翻译软件截图(来源:www.esosolutions.com)。

谷歌翻译

谷歌Translate是一款免费的、基于网络和应用程序的翻译软件，允许用户用一种语言编写免费文本，并将其转换为另一种语言的书面或口语文本。谷歌Translate利用基于统计的翻译(统计机器翻译)方法，根据正确的概率生成翻译[25］．目前谷歌Translate可以翻译超过100种语言。谷歌Translate已被用于许多机器翻译研究中进行比较[26，27］．图3谷歌翻译的截图。

研究设计

由于对新的翻译工具进行实地评估会带来后勤和伦理问题，我们借鉴了基于场景的设计来指导这项研究。基于场景的设计是在“可控”但现实的条件下测试和比较新技术有效性的关键方法[28，29］．在基于场景的设计中，潜在的技术用户通过参与现实的、脚本化的场景来评估技术的价值。脚本情景或场景是基于实际事件的知识开发的，通过访谈、焦点小组或对潜在技术用户的观察来揭示。

在我们的研究中，两名研究团队成员(儿科医生AT和急诊医生MT)根据他们的经验和先前对涉及LEP的现实紧急呼叫记录的回顾，创建了三对场景。

制定场景以说明EMS响应过程中发生的常见情况，并描述EMS响应人员需要从LEP个人获得的信息。每个场景都描述了紧急情况、“病人”和“支持人员”(家人或朋友)、突发事件、“病人”的药物和过敏，以及基本的“病人”人口统计数据，如年龄和职业。我们创建了一对相似但不完全相同的场景来测试和比较这两种翻译工具。

当地消防部门的一名营长审查了这些场景，以确保它们反映了现实情况。作为对审查的回应，我们做了一些小的修改。双语研究团队成员将完成的场景翻译成繁体中文和西班牙语。多媒体附件1介绍为本研究创建的场景对。

为了测试QuickSpeak和谷歌翻译的可行性和可用性，我们在参与者方便的地点与说西班牙语和说中文(普通话)的LEP参与者和EMS人员举行了分组模拟会议。有2名适合语言的双语主持人负责招募参与者并组织会议。表1提供会话的摘要。

在每次会议开始时，双语主持人获得LEP参与者的知情同意;收集人口统计数据，包括年龄、教育水平、在美国的年限，以及自我认定的英语口语和书面熟练程度;并阐述了评价的总体目标和语言技术。

在会议之前，我们评估了场景的LEP参与者及其角色。参与者两人一组，其中一名LEP参与者扮演“病人”的角色，在QuickSpeak或谷歌Translate的帮助下回答EMS提供商的问题;另一个LEP参与者扮演朋友或亲戚“支持人”的角色。我们向EMS参与者提供了类似于他们从911调度员那里得到的信息，比如“病人”的地址、年龄、主诉和主要语言。我们没有向EMS人员提供有关LEP“病人”所表现出的潜在健康问题的信息。

每个LEP参与者在涉及这两种技术的场景中扮演“患者”或“支持人员”的角色。EMS人员寻求关键问题的答案，如主诉、症状和药物。

措施

在会议结束时，EMS人员和LEP参与者填写了会后问卷，提供了对翻译技术的反馈(见多媒体附件2)．EMS人员问卷包括定性反馈问题，用他们自己的话收集他们对翻译技术的印象和经验。例如，它要求他们比较两种技术(谷歌Translate和QuickSpeak)，找出他们遇到的问题，并提出改进建议。它还收集了关于他们以前在紧急情况下使用翻译技术的经验的信息。

LEP问卷由母语为双语的研究人员翻译成西班牙语和中文。LEP问卷询问了类似的定性问题，包括参与者使用翻译技术的经历、遇到的问题，以及他们在医疗紧急情况下是否需要翻译。

EMS参与者亦被要求使用系统可用性量表(SUS)工具评估技术的可用性[30.］．SUS通过10个李克特式5分问题对可用性进行量化测量，参与者在这些问题中提供他们同意或不同意的程度。卫生保健系统被广泛用于评估包括移动应用程序和医疗保健监测设备在内的技术的可用性[30.-33]，并在众多研究中证明了有效性、可靠性和敏感性[34-36］．由于SUS衡量可用性，因此仅对EMS参与者进行管理，因为他们是操作翻译工具的主要用户组，而LEP参与者不处理翻译技术并推动交互。

LEP参与者因参与我们的研究而获得25美元的酬金，但EMS参与者作为有偿专业人员，不能接受酬金。

表1。模拟会话概述。

会话	位置	英语熟练程度有限的参与者，n (%)	紧急医疗服务人员，n (%)
西班牙语# 1	当地消防部门	6 (23)	6 (35)
西班牙语# 2	当地消防部门	8 (31)	6 (35)
中国# 1	研究办公室	4 (15)	1 (6)
中国# 2	中国集体住宅	4 (15)	1 (6)
中国# 3	当地消防部门	4 (15)	4 (25)

数据分析

我们使用专题分析来检查对会后问卷中开放式问题的定性答复。自动语言翻译工具是否可以在紧急情况下促进LEP通信这一实际研究问题推动了我们的专题分析。研究人员(YKC, KD, SW, DS)对问卷回答进行独立编码，然后会面讨论确定的代码和主题。通过几轮讨论，我们调和了分歧，将相似的代码进行了分组，形成了有意义的主题类别[37］．

我们使用R软件(R Foundation for statistical Computing)对定量数据进行描述性统计分析[38］．我们还使用Mann-Whitney U检验来调查SUS得分与所评估的两种技术工具之间的关系。

参与者

我们举办了5次小组模拟会议(3次中文及2次西班牙文)，参加者包括12名中文LEP参与者、14名西班牙语LEP参与者及17名医疗服务管理人员。每个环节持续大约1.5-2.5小时，具体时间取决于小组人数。表2总结参与者的特点。本研究中EMS人员的平均年龄为44.2岁，平均工作经验为17.8年。

说中文的LEP参与者的平均年龄为46岁，在美国的平均生活时间为7.3年。说西班牙语的LEP参与者平均年龄为44.7岁，在美国的平均生活时间为13.9年。超过一半说中文的参与者和三分之二说西班牙语的参与者认为自己的英语水平在口语和写作上都处于中等水平。

QuickSpeak和谷歌翻译的比较

Postsession问卷

在17个EMS受访者中，53% (n=9)表示他们更喜欢QuickSpeak而不是谷歌Translate。一些EMS人员(3/ 17,18%)表示，他们想要一种结合了这两种技术特性的工具。有1名EMS参与者表示不会使用任何一个系统。在具体的后续问题中(总结在表3)， 76%(13/17)的EMS参与者表示QuickSpeak帮助他们在模拟过程中获得所需的信息。较少的参与者(10/ 17,59%)报告谷歌Translate提供了所需的信息。除1名EMS参与者外，所有EMS参与者都表示QuickSpeak帮助他们与LEP参与者沟通。相比之下，只有大约三分之二的受访者提到谷歌翻译有助于他们的沟通。

表2。参与者的人口统计数据。

特征		紧急医疗服务(n=17)	中文(n = 12)	西班牙语(n = 14)
年龄(年)，平均值(SD)		44.2 (9.6)	46.0 (25.1)	44.7 (16.1)
年紧急医疗服务经验，平均(SD)		17.8 (11.9)	N/A^一个	N/A
在美国的年数，平均值(SD)		N/A	7.3 (7.5)	13.9 (8.8)
教育程度，n (%)
	低于高中或同等学历	0 (0)	0 (0)	5 (36)
	高中或同等学历	2 (12)	5 (42)	4 (29)
	一些大学生或大学毕业生	13 (76)	2 (17)	3 (21)
	研究生或专业学位	2 (12)	3 (25)	2 (14)
	选择不回答	0 (0)	2 (17)	0 (0)
自述英语水平(口语)，n (%)
	初学者	N/A	4 (33)	3 (21)
	中间	N/A	8 (67)	5 (29)
	先进的	N/A	0 (0)	3 (21)
	选择不回答	N/A	0 (0)	3 (21)
自述英语水平(书面)，n (%)
	初学者	N/A	4 (33)	4 (29)
	中间	N/A	8 (67)	5 (36)
	先进的	N/A	0 (0)	2 (14)
	选择不回答	N/A	0 (0)	3 (21)

^一个N/A:不适用。

表3。紧急医疗服务获得所需信息的能力(n=17)。

紧急医疗服务的后续问题		QuickSpeak, n (%)	谷歌翻译，n (%)
能够获得所需的信息
	是的	13 (76)	10 (59)
	没有	2 (12)	5 (29)
	也许	0 (0)	1 (6)
	选择不回答	2 (12)	1 (6)
帮助沟通
	是的	16 (94)	10 (59)
	没有	0 (0)	3 (18)
	也许	1 (6)	3 (18)
	选择不回答	0 (0)	1 (6)

表4。来自英语水平有限的参与者的课后问卷结果。

标准评估		中文(n=12)， n (%)				讲西班牙语(n=14)， n (%)
标准评估		QuickSpeak		谷歌翻译		QuickSpeak	谷歌翻译
工具整体有用
	是的		12 (100)		5 (42)	11 (79)		2 (14)
	没有		0 (0)		6 (50)	1 (7)		8 (57)
	也许		0 (0)		1 (8)	2 (14)		4 (29)
帮助您了解紧急医疗服务
	是的		11 (92)		3 (25)	12 (86)		4 (29)
	没有		1 (8)		7 (58)	2 (14)		5 (36)
	也许		0 (0)		2 (17)	0 (0)		5 (36)
请与紧急医疗服务联系
	是的		9 (75)		3 (25)	11 (85)		6 (43)
	没有		0 (0)		6 (50)	1 (8)		8 (57)
	也许		3 (25)		3 (25)	1 (8)		0 (0)

表4总结了对LEP参与者进行的会后问卷调查的结果。与EMS类似，说中文和西班牙语的LEP参与者都明显偏爱QuickSpeak。当被问及这些工具的整体用处时，所有12名说中文的LEP参与者和14名说西班牙语的LEP参与者中的11人都认为QuickSpeak很有用。有1位与会者认为有必要使用这一工具。

是的，它在当时很有用。在没有翻译的情况下，这是必要的。
(中文,P3)

相对较少的LEP参与者认为谷歌翻译有用(5/ 12,42%说中文，2/14,14%说西班牙语)。一些参与者解释说，EMS人员使用谷歌翻译的时间太长，他们对翻译的质量没有信心。

翻译既没用也不愉快……我无法表达我所拥有或需要的东西。他们问问题的时间太长了，感觉不安全，也不觉得自己被理解了。
(西班牙语,P2)

同样，与EMS参与者的回答相似，大多数说中文和西班牙语的LEP参与者(分别为11/12,92%和12/14,86%)认为QuickSpeak帮助他们理解EMS人员的问题。另一方面，只有25%(3/12)中文和29%(4/14)西班牙语的LEP参与者认为谷歌翻译有帮助。

在描述他们使用谷歌翻译的经历时，许多LEP参与者提到，由于翻译质量差、含义模糊和措辞不当，他们很难理解正在说的话。

更基本的问题(问题)是可以的，但其他的则不是。语言、词语或语法都不合适。这些词翻译不正确。
(西班牙语,P4)

英语水平有限的参与者对模拟会议中遇到的问题的反馈总结。

QuickSpeak

响应格式限制(是或否)
声音不清楚
沟通过程缓慢
翻译质量差
难以传达时间或身体位置信息

谷歌翻译

响应格式限制(是或否)
不清楚的问题
沟通过程缓慢
尴尬的交互
不安全的
无法回复
猜测是理解的必要条件
质量差
难以理解
很难问问题
文化上不恰当的词语
不一致的

文本框1。英语水平有限的参与者对模拟会议中遇到的问题的反馈总结。

此外，一些参与者提到，他们必须做大量的猜测，才能在翻译不好的单词之间建立联系。

基本上我能理解这些问题，但只是我的猜测和理解。
(中文,P6)

使用不当的词语也被提到与QuickSpeak有关。特别是说西班牙语的LEP参与者提到了词语选择的模糊性，如“喝酒”(饮料或酒精)或“毒品”。

是的，但我相信当它问"你喝酒了吗? "“太笼统了。不同的人可以用不同的方式来使用“毒品”这个词。它可以指:毒品(非法的)、药物、药品或补救措施。
(西班牙语,P2)

LEP参与者还评论了这些工具是否有助于他们回应或与EMS人员交谈。12名说中文的参与者中有9人，14名说西班牙语的参与者中有11人提到QuickSpeak帮助他们与EMS人员交谈。然而，12名说中文的参与者中只有3人认为谷歌翻译对他们有帮助，14名说西班牙语的参与者中只有6人认为谷歌翻译对他们有帮助。许多参与者在使用这两种技术进行详细回答时遇到了困难。

当我们的回答不仅仅是“是”或“不是”时，他们看着我们的表情是“什么?”，脸上带着问号。
(中文,P8)

在会议期间，研究人员注意到，当EMS使用谷歌翻译工具时，他们首先输入开放式问题。然而，因为他们无法理解给出的回答，他们就会问更多“是”或“否”的问题，类似于QuickSpeak。EMS参与者在谷歌Translate中输入问题时，也经常忘记添加问号，影响翻译的理解。文本框1提供LEP参与者对模拟体验中遇到的问题的反馈摘要。

作为工具的主要用户，EMS参与者被要求提供可用性反馈和改进每个工具的建议。对于谷歌翻译，一些EMS人员提到，有一个预先定义的问题列表(像QuickSpeak一样)会很有帮助。具体来说，他们建议在主屏幕上放置4-5个基本问题。一些EMS人员建议增加扬声器按钮的大小，当点击该按钮时，会播放翻译后的音频，以提高可用性。有一位EMS参与者提到，更好的翻译口音有助于理解。另一位建议谷歌翻译创建一个特定于医疗领域的翻译服务。

对于QuickSpeak工具，许多EMS人员建议添加键入和口头表达自己问题的能力，类似于谷歌Translate的自由文本功能。一些人建议，预先确定的问题清单应遵循更合乎逻辑的正常提问流程。具体建议包括:使用决策树辅助选择合适的问题，在屏幕上显示全身图像，允许EMS人员单击身体部位并查看相关问题，一旦被问到的问题从列表中删除，允许EMS人员添加或修改加载在QuickSpeak中的现有问题，以及扩展翻译的语言数量。

一些建议适用于这两种技术。EMS人员建议两种服务都支持语音操作、双向翻译或交流。他们还建议将与LEP患者的实际互动录音，以便记录、教育和问责。中提供了EMS反馈的摘要文本框2．

系统可用性量表评分评估

表5显示了SUS的QuickSpeak和谷歌翻译的结果。SUS仅管理给EMS参与者，因为他们是操作翻译工具的主要用户组。QuickSpeak的平均SUS得分高于谷歌翻译的得分。两种翻译工具之间的差异具有统计学意义(Mann-Whitney U检验，z=−2.1;P= .04点)。中国和西班牙的模拟实验结果相似。然而，参加中文课程的EMS人员对谷歌翻译的评分高于参加西班牙语课程的EMS人员。

紧急医疗服务人员就模拟会议期间遇到的问题提供反馈。

QuickSpeak

响应格式限制(是或否)
不能提出自己的问题
需要更多问题
很难找到一个问题
不能打自己的问题
问题流程组织不良
不具体的问题
低音量
难以获取时间信息
问题太多

谷歌翻译

难以理解有限的英语熟练回答，除非问题以“是”或“否”的形式提出
翻译质量差
沟通过程缓慢
难以构成问题
过多的注意力集中在屏幕上

文本框2。紧急医疗服务人员就模拟会议期间遇到的问题提供反馈。

表5所示。系统可用性量表评分。

语言组织	工具	系统可用性量表评分^一个
语言组织	工具	意思是(SD)	中位数	P价值
整体	QuickSpeak	65.3 (13.7)	65.0	.04点
整体	谷歌翻译	48.4 (25.6)	50.0	.04点
说中文的参与者	QuickSpeak	63.6 (9.8)	65.0	。8
说中文的参与者	谷歌翻译	56.1 (28.1)	62.5	。8
说西班牙语的人	QuickSpeak	66.5 (16.3)	70.0	02
说西班牙语的人	谷歌翻译	43.0 (23.7)	42.5	02

^一个满分为100分。

主要研究结果

我们对两种翻译工具进行的基于场景的评估证实，在医疗紧急情况下，需要更好的工具来协助LEP人员和EMS人员之间的沟通。这与先前的研究结果一致，即EMS人员经常对电话语言翻译感到沮丧，并求助于与旁观者交谈或使用他们碰巧知道的肢体语言和关键词[39］．研究表明，拥有临时口译员(旁观者或家庭成员)的LEP患者比拥有受过医学培训的口译员的LEP患者更不满意，而且更有可能出现可能影响临床护理的错误[40］．改善翻译方案是克服沟通障碍和提高LEP个人急诊护理质量的关键。

尽管这两种翻译工具都不适合在现场使用，但在我们的场景中，LEP和EMS参与者显然更喜欢QuickSpeak的固定问题翻译，而不是谷歌翻译的自由文本翻译。LEP和EMS参与者都认为理想的翻译工具应该具有带前缀问题的准确性和清晰度，但同时具有自由文本工具的灵活性和潜在的双向交流。谷歌翻译目前允许双向通信，但翻译中的不准确性经常与现有系统相结合。使用谷歌Translate和QuickSpeak后EMS和LEP个体之间的沟通略有改善;然而，不准确性和潜在的沟通错误是很大的，而且这两种工具都没有被认为可以在现场使用，任何沟通错误或延迟的风险都很高。我们之前的研究调查了免费的基于网络的翻译系统的潜在用途，如谷歌翻译和微软翻译，表明在健康领域，这些工具需要专业翻译人员仔细编辑以提高准确性[18，41］．显然，这种后期编辑在现场是不可能实现的。然而，机器翻译技术在不断改进。谷歌最近更新了他们的翻译系统，利用复杂的人工智能产生更准确的语言翻译[42］．随着自动化语言翻译技术的发展，需要进一步评估这些工具在卫生环境中的使用情况。

除了提高翻译精度外，未来的应急响应翻译技术还应特别注意LEP人员和EMS人员的需求和设计建议。EMS人员对在快节奏的现实紧急情况下操作设备和使用翻译技术表示担忧。免提，准确的语音识别技术，可以促进双向通信将是理想的。EMS参与者还表示，希望将翻译回答记录下来，以便记录遭遇。然而，将与个人健康信息相关的答案存档需要仔细考虑1996年《健康保险可携带和责任法案》的政策和规则。

目前，双语员工、口译员和语言线能够提供实时、准确的翻译是临床环境中笔译和口译的黄金标准。先前的研究表明，LEP患者对电话口译员的满意度高于对家人、临时或没有口译员的满意度[40］．然而，在与EMS人员的非正式访谈中，由于担心语言线花费太长时间，以及电话口译员可能无法准确评估手头的情况，他们对使用语言线犹豫不决。尽管存在这些障碍，但在没有现场口译员的情况下，语言线仍然是确保快速准确翻译的最佳方法。随着自动语言翻译技术的不断发展，将需要进一步的评估，以评估这些技术是否能够在应急领域为英语使用者和非英语使用者提供安全、有效的交流。

限制

模拟会议的数量有限，而且都发生在华盛顿的金县，这可能会限制我们结果的泛化性。我们评估了西班牙语和汉语普通话，这是我们地区最常见的两种非英语语言。总体而言，谷歌Translate在西班牙语上的表现优于中文或其他较少使用的语言[18，41，43)，所以如果我们测试不同的语言，结果可能会有所不同。此外，我们的研究是在一个时间点上进行的，使用统计机器翻译的翻译工具也在不断发展。我们对翻译工具的评估是基于EMS和LEP参与者之间的模拟会议。尽管我们使用了基于实际EMS响应的场景，但这些会话发生在受控环境中，并不能准确反映这些工具在现场的性能。

文学的新贡献

在美国LEP人口不断增长的背景下，由于语言障碍导致的医疗保健差异，改进翻译技术至关重要。在最近的一篇综述中，Tate(2015)得出结论，“在理解语言障碍和院前护理之间的相互作用方面存在巨大差距”[44］．我们的研究揭示了在院前、急诊护理环境中使用新翻译技术的挑战。虽然在这些环境下，我们非常需要翻译工具来协助翻译，但我们需要继续评估自动翻译技术的发展，以确定它们在可接受性、准确性和效率方面与更传统的电话口译服务相比如何。

致谢

作者希望感谢支持这项研究的Medic One基金会的资助。这项工作也得到了美国国立卫生研究院、美国国家医学图书馆和华盛顿大学生物医学与健康信息培训计划(批准号:No.;T15LM007442)。内容仅为作者的责任，并不一定代表美国国立卫生研究院的官方观点。作者要感谢EMS人员以及西班牙语和汉语母语社区成员慷慨地参与了这项研究。作者也感谢Xiyao Yang在研究中的帮助。

利益冲突

没有宣布。

‎

多媒体附件1

用于模拟会话的场景对。

PDF档案(adobepdf档案)，25kb

‎

多媒体附件2

热身问卷。

PDF档案(adobepdf档案)，21kb

美国人口普查局2015年11月3日。美国人口普查局报告:美国家庭至少使用350种语言http://www.census.gov/newsroom/press-releases/2015/cb15-185.html[访问时间:2018-04-30][WebCite缓存］
美国人口调查局。美国社会特征精选https://factfinder.census.gov/faces/tableservices/jsf/pages/productview.xhtml?pid=ACS_16_5YR_DP02&prodType=table[访问2018-05-25][WebCite缓存］
美国人口调查局。美国社区调查:American Fact Finder网址:https://factfinder.census.gov/faces/tableservices/jsf/pages/productview.xhtml?src=bkmk[访问2018-05-25][WebCite缓存］
英语水平有限。URL:https://www.lep.gov/faqs/faqs.html[访问时间:2018-12-04][WebCite缓存］
潘迪亚C, McHugh M, Batalova J.移民政策研究所，2011年12月，美国有限英语熟练者:数量，份额，增长和语言多样性https://www.migrationpolicy.org/research/limited-english-proficient-individuals-united-states-number-share-growth-and-linguistic[访问时间:2018-04-30][WebCite缓存］
机构FHR。卫生保健研究和质量机构，2012年。为英语水平有限的患者改善患者安全系统网址:https://www.ahrq.gov/professionals/systems/hospital/lepguide/lepguidesumm.html#what[访问2018-05-25][WebCite缓存］
Flores G.美国医疗保健的语言障碍。中华外科杂志2006 7月20日;355(3):229-231。［CrossRef] [Medline］
Meischke HW, calhoure, Yip M, Tu S，画家是。语言障碍对应急响应调度的影响。Prehosp急诊护理2013;17(4):475-480。［CrossRef] [Medline］
Grow RW, Sztajnkrycer MD, Moore BR。在明尼苏达州，语言障碍被报道为院前护理延迟的原因。Prehosp急诊护理2008 8月;12(1):76-79。［CrossRef] [Medline］
Tate RC, Hodkinson PW, Meehan-Coussee K, Cooperstein N.院前服务提供者克服语言障碍的策略。Prehosp急诊护理2016年1月;20(3):404-414。［CrossRef] [Medline］
山田KC，井上S，坂本Y.一个有效的支持系统的紧急医疗服务平板电脑。JMIR Mhealth Uhealth 2015 Feb 27;3(1):e23 [免费全文] [CrossRef] [Medline］
Taylor R, Crichton N, Moult B, Gibson F.一项机器翻译软件的前瞻性观察研究，以克服医疗保健研究中包括种族多样性的挑战。护士公开赛2015年12月;2(1):14-23 [免费全文] [CrossRef] [Medline］
郑崔特勒Q, Kim H, Rosemblat G, Keselman A.多语言机器翻译能否帮助患者更容易理解病历内容?种马健康技术通报2010;60(Pt 1):73-77。［Medline］
艾萨尼，金赛，朱贝尔，大师，D.护患互动的语音翻译。2008年发表于:第22届国际计算语言学会议论文集;2008;英国曼彻斯特，第54-59页。
陈旭，阿科斯塔，巴里。糖尿病教育教材谷歌翻译准确性评价。JMIR糖尿病2016年6月28日;1(1):e3。［CrossRef］
Abreu R, Adriatico T.听力学家的西班牙语:有这样的应用程序吗?展望通信科学CLD流行2015年12月01日;22(3):122-128。［CrossRef］
Albrecht U, Behrends M, Schmeer R, Matthies HK, von Jan U.多语言移动翻译应用在临床环境中的使用。JMIR Mhealth Uhealth 2013年4月23日;1(1):e4 [免费全文] [CrossRef] [Medline］
郭志刚，李志刚，李志刚。公共卫生信息机器翻译的可行性研究。JMIR公共卫生监测2015年;1(2):e17 [免费全文] [CrossRef] [Medline］
王志强，王志强，王志强，王志强。机器翻译在临床应用中的应用。Can Fam医师2013 Apr;59(4):382-383 [免费全文] [Medline］
Meischke H, Chavez D, Bradley S, Rea T, Eisenberg M.与英语水平有限人群的紧急通信。Prehosp急诊护理2010;14(2):265-271。［CrossRef] [Medline］
宗杰，Batalova J.移民政策研究所2015年7月8日。美国精通英语的人数有限网址:https://www.migrationpolicy.org/article/limited-english-proficient-population-united-states#Language%20Diversity[访问2018-05-25][WebCite缓存］
Karliner LS, napels - springer AM, Schillinger D, Bibbins-Domingo K, Pérez-Stable EJ。识别临床护理中英语熟练程度有限的患者。J Gen实习医学2008年10月;23(10):1555-1560 [免费全文] [CrossRef] [Medline］
孙文杰，李志强，李志强，等。定性研究中的饱和:探讨其概念化和操作化。Qual Quant 2018年9月14日;52(4):1893-1907 [免费全文] [CrossRef] [Medline］
公共卫生-西雅图和金县。弱势群体战略倡议网址:https://www.kingcounty.gov/depts/health/emergency-medical-services/vulnerable-populations.aspx[访问时间:2018-05-26][WebCite缓存］
谷歌翻译。URL:https://translate.google.com/[访问时间:2018-12-05][WebCite缓存］
崔玉凯，刘志刚，刘志刚，刘志刚。机器翻译辅助健康信息交流技术的研究进展。J Biomed Inform 2018年9月;85:56-67。［CrossRef] [Medline］
陈旭，阿科斯塔，巴里。机器还是人?糖尿病教育教材翻译手机应用质量评估。JMIR Diabetes 2017 Jun 29;2(1):e13 [免费全文] [CrossRef] [Medline］
Rosson M, Carroll J.基于场景的可用性工程。第四届交互系统设计会议论文集:过程，实践，方法，技术。美国纽约:ACM;2002年发表于:第四届交互系统设计会议:过程、实践、方法、技术;6月25-28th;英国伦敦，第413页。［CrossRef］
里德B，特纳AM。基于场景的设计:将信息系统设计与公共卫生业务和应急管理联系起来的方法。J Biomed Inform 2011 Dec;44(6):978-988 [免费全文] [CrossRef] [Medline］
Brooke J. SUS:一个“快速而肮脏”的可用性量表。入:Jordan PW, Thomas B, Weerdmeester BA。工业中的可用性评估。伦敦:Taylor & Francis;1996:189 - 194。
李文杰，李文杰，李文杰，Rodríguez-Molinero李文杰，等。以人为本的设计研究:提高老年用户使用的集成跌倒风险检测系统中手机应用程序的可用性。JMIR Mhealth Uhealth 2017年5月30日;5(5):e71 [免费全文] [CrossRef] [Medline］
Mohamad Marzuki MF, Yaacob N, Yaacob N.翻译，跨文化适应，和马来版本的系统可用性量表问卷的验证，用于评估移动应用程序。JMIR Hum Factors 2018年5月14日;5(2):e10308 [免费全文] [CrossRef] [Medline］
Alnasser A, Kyle J, Alkhalifah A, Marais D.证据要求，用户期望和实际体验之间的关系:Twazon阿拉伯减肥应用程序的可用性评估。JMIR Hum因素2018年4月17日;5(2):e16 [免费全文] [CrossRef] [Medline］
Sauro J.用系统可用性量表(SUS)测量可用性。2011年2月2日。URL:https://measuringu.com/sus/[访问时间:2018-04-30][WebCite缓存］
系统可用性量表的要素结构。纽约:施普林格;2009年发表于:以人为本设计国际会议论文集;7月19到24;加州圣地亚哥，第94-103页。
班戈，科特姆PT，米勒JT。系统可用性量表的实证评估。国际人机交互杂志2008年7月30日;24(6):574-594。［CrossRef］
社会科学的定性研究方法。英国伦敦:Pearson;2011.
R基金会。统计计算R项目网址:https://www.r-project.org/[访问2018-05-25][WebCite缓存］
Tate RC, Hodkinson PW, Meehan-Coussee K, Cooperstein N.院前服务提供者克服语言障碍的策略。Prehosp急诊护理2016年1月;20(3):404-414。［CrossRef] [Medline］
医疗翻译服务对医疗保健质量的影响:一项系统综述。医疗保健决议Rev 2005 6月;62(3):255-299。［CrossRef] [Medline］
郭晓明，陈晓明，陈晓明。统计机器翻译在公共卫生信息分类中的应用研究。中国医学杂志2011;18(4):473-478 [免费全文] [CrossRef] [Medline］
吴勇，许ster M，陈震，Quoc V, Norouzi M, Macherey W，等。谷歌的神经机器翻译系统:弥合人类和机器翻译之间的差距。arXiv 2016。
吴超，夏峰，李丽娟，宋涛。生物医学文本的统计机器翻译。2011年出席:AMIA年度研讨会;10月22日至26日进行的;华盛顿特区第1290-1299页。
需要更多的院前研究语言障碍:一个叙事回顾。西部急诊医学2015年12月17日;16(7):1094-1105 [免费全文] [CrossRef] [Medline］

‎

EMS:紧急医疗服务

地蜡:英语水平有限

SMT:统计机器翻译

SUS:系统可用性量表

T·桑切斯编辑;提交31.05.18;C Latulipe, X Chen同行评审;对作者04.09.18的评论;修订版本收到10.10.18;接受09.11.18;发表28.01.19

©Anne M Turner, Yong K Choi, Kristin Dew, Ming-Tse Tsai, Alyssa L Bosold, Shuyang Wu, Donahue Smith, Hendrika Meischke。最初发表于JMIR公共卫生与监测(http://publichealth.www.mybigtv.com)， 2019年1月28日。

这是一篇根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布的开放获取文章，允许在任何媒介上不受限制地使用、分发和复制，前提是正确引用了首次发表在JMIR公共卫生和监测上的原创作品。必须包括完整的书目信息，http://publichealth.www.mybigtv.com上的原始出版物的链接，以及此版权和许可信息。

本文内容如下e-collection /主题问题:

评估应急通信翻译技术的有用性:基于场景的研究

评估应急通信翻译技术的有用性:基于场景的研究

原始论文

通讯作者:

摘要

关键字

简介

方法

参与者

工具

QuickSpeak

谷歌翻译

研究设计

措施

数据分析

结果

参与者

QuickSpeak和谷歌翻译的比较

Postsession问卷

英语水平有限的参与者对模拟会议中遇到的问题的反馈总结。

系统可用性量表评分评估

紧急医疗服务人员就模拟会议期间遇到的问题提供反馈。

讨论

主要研究结果

限制

文学的新贡献

致谢

利益冲突

参考文献

缩写