这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布,允许在任何媒体上不受限制地使用、分发和复制,前提是正确引用最初发表在JMIR Serious Games上的作品。必须包括完整的书目信息,http://games.www.mybigtv.com上的原始出版物的链接,以及此版权和许可信息。
用于患者治疗、康复和医疗专业培训的与健康相关的虚拟现实(VR)应用正在兴起。然而,与其他数字健康技术的支持相比,关于如何选择和执行虚拟现实健康干预的可用性评估的指导很少。这篇观点论文的目的是对各种可用性测试方法进行介绍性总结,这些方法可以用于VR应用程序。除了每个资源的概述外,还提供了一个资源列表,供读者获取额外的相关信息。使用之前开发的针对VR环境的分类分类法描述了六类VR可用性评估:(1)认知或任务演练,(2)图形评估,(3)事后问卷或访谈,(4)物理性能评估,(5)用户界面评估,(6)启发式评估。鉴于VR在医疗保健领域的发展,严格的评估和可用性测试在新型VR干预措施的开发和实施中至关重要。本文概述的方法为开展与健康相关的VR应用的可用性评估提供了一个起点;然而,我们也需要超越这些标准,采用游戏行业的标准,对可用性和用户体验进行常规评估。
在过去的十年中,虚拟现实(VR)技术在各种全球背景下的使用有了巨大的增长,包括娱乐(如游戏)、教育、营销和设计。虚拟现实广泛地描述了数字创建的模拟,在这种模拟中,一个人可以沉浸在计算机生成的现实中,完成任务或与虚拟环境互动。像虚拟现实头盔这样的设备,可以让个人体验虚拟世界的声音和景象,通常被用来创造沉浸式体验。
最近,许多特定于健康环境的虚拟现实应用已经被确定和使用[
为了补充虚拟现实应用程序给健康相关环境带来的大量好处,需要保持对卫生信息技术可用性的关注,特别是考虑到用户群(如患者、卫生专业人员、家庭成员等)的不同需求和能力。所谓可用性,我们指的是技术在三个周期或步骤的基础上被个人利用的容易程度[
特别是在VR的背景下,这包括硬件(如耳机)的使用,以及用户感知的沉浸式软件和VR体验。
这篇观点论文的目的是进行以下工作:(1)强调对VR应用程序进行可用性评估的必要性,(2)提供关于潜在可用性评估方法的入门知识,这些方法可以应用于与健康相关的VR环境及其潜在挑战,以及(3)引导读者找到关于该主题的额外信息的几个资源。
VR在健康相关应用中的挑战之一是评估和解决与可用性相关的问题。VR与健康相关的应用可能比非健康相关的应用更值得关注可用性测试,因为用户基础(即那些通常患有疾病、慢性疾病或残疾的用户)在年龄、能力等方面是多样化的,并且在使用技术时可能有特殊需求。此外,与VR相关的最常见问题之一是晕动病,这通常与虚拟空间映射到复制物理设置的质量有关。
用于分析和评估各种VR技术在健康相关应用中的可用性的评估方法通常没有得到充分的研究,而且在研究文献中没有得到很好的描述。我们自己对几个学术数据库进行了粗略的搜索,发现在VR应用程序开发阶段使用的可用性方法的解释有限,关于如何对用于健康目的的VR进行可用性评估的文献更是有限。虽然这种知识差距的原因可能是由于该领域的新生性质,但必须完成进一步的工作,以生成与VR可用性相关的最佳实践,以帮助从业者和研究人员开发和传播这类创新。例如,在虚拟现实环境之外,有大量的文献基础确定了用于健康相关应用的技术的需求
以下部分介绍了在过去的研究中使用的VR可用性评估方法。需要注意的是,这些方法可以混合在一起,以适应每个独特评估的目标,而不是相互排斥的。这些方法是使用Bowman及其同事在2000年开发的虚拟环境可用性方法分类来描述的[
建议一些评估方法应该有利于特定用户组的参与,例如外部用户(即,一组不参与开发过程的测试人员)。一些评估方法需求还需要具有代表性的用户,这意味着用户样本可以反映适当的最终用户群体。以下部分将对每种VR可用性评估方法进行解释。
虚拟现实可用性评估方法概述
方法 | 评估需求一个 | 评估VR方面 | 典型评估输出 | 结果类型 |
认知或任务演练[ |
有代表性的外部用户,开发的任务或场景,以及记录和定时设备 | 环境导航、对象交互和用户系统交互 | 任务表现和用户反馈 | 离散的和描述性的 |
图形评估[ |
多个相关的图形环境, |
图形和图像渲染的质量 | 用户反馈 | 描述性的 |
事后问卷及访谈[ |
外部用户,问卷或访谈指南,以及 |
非特异性的 | 用户反馈 | 描述性的 |
体能表现评估[ |
外部用户、开发的任务或场景,以及 |
物理沉浸和VR表演 | 任务性能、系统性能度量和用户反馈 | 离散的和描述性的 |
用户界面评估[ |
开发的任务或场景, |
VR环境与现实工具、VR性能的融合 | 用户反馈和任务表现 | 离散的和描述性的 |
启发式评价[ |
有经验的用户,开发的任务或场景,调查问卷,访谈指南,以及 |
各种各样的 | 参考启发式评估部分的列表 | 描述性的 |
一个斜体文本表示可选要求,取决于所使用的具体评估方法(例如,只有在采用大声思考方法时才需要记录设备)。
认知或任务演练是一种形成性评估方法,它基于基于任务的VR场景的完成情况、对系统变化的响应以及用户对VR环境的探索和导航来评估用户或假设用户[
执行这种评估的一种方法是采用以下三个周期或步骤。第一个周期评估用户在试图实现目标时的行为[
在第二个循环中,用户探索并在环境中移动,以确定通往感兴趣对象的路径。虚拟现实环境应该允许直观的导航,识别用户的移动,并在用户探索定位感兴趣的对象时响应地适应用户位置的变化[
在第三个周期中,评估用户响应系统倡议的行为[
总而言之,认知或任务演练是一种基于任务的评估,用于评估用户在试图实现目标时的行为(参见
这种评估方法侧重于在VR环境中生成的图形的质量,以及它如何影响用户的体验。这可能包括,但不限于,不同的颜色组合,形状,纹理和渲染将如何影响用户与VR环境和系统的交互[
有许多不同复杂程度的方法用于评估图形。在一种常见的方法中,用户暴露在图形环境的不同迭代中,以更好地理解其对用户体验的影响[
事后调查问卷和访谈通常用于确定用户在使用VR时的总体体验。然而,这些问卷和访谈中的一些可能针对特定的可用性概念,如图形、物理硬件和晕动病[
这种评估方法通常在用户与VR系统的交互结束后执行[
通常,事后调查问卷也会在VR原型设计阶段通过吸引终端用户作为一种迭代质量改进的形式使用,但通常与另一种评估方法结合使用,如认知或任务演练[
VR环境中的物理性能是由硬件和环境的性能定义的。评估虚拟环境的流畅性和质量,就像评估网站的加载时间一样。这种评估方法的性能指标包括滞后时间(即,用户的预期操作和系统在VR中的响应之间的时间延迟)和同步(即,系统是否准确地反映用户的预期操作)。VR应该尽可能让用户觉得逼真,VR系统的物理性能是心理和物理沉浸感的关键决定因素。
为了衡量VR系统的物理性能,可以通过多种方法的组合来获得数据,例如问卷调查、任务性能分数,或者利用后端数据来检查检索和加载时间等因素。简单但对物理要求高的VR精确任务对于这种类型的评估具有很高的信息量。例如,一项涉及用虚拟筷子操作小物体的任务将很快揭示与翻译动作精度相关的任何性能问题。这样的任务可以计时和评分,用户可以被要求描述他们的满意度和感觉,以确定身体表现问题[
UI评估的目的是帮助确定VR系统前端UI的可用性[
无VR:参与者通过键盘和鼠标控制在一个环境中移动;其他活动是在模拟的工作空间设置中使用真实的工具完成的。
Semi-VR:参与者戴着VR头盔在虚拟环境中移动;其他活动是在模拟的工作空间设置中使用真实的工具完成的。现实生活中的工作站还显示VR的当前状态。
全虚拟现实:参与者完全在虚拟现实环境中移动和完成他们的活动。现实生活中的工具被虚拟的等价物(例如,虚拟键盘)所取代,其他现实生活中的显示器(例如,工作站屏幕)虚拟地广播到VR耳机。
对于每次迭代,关于用户偏好的数据可以与离散数据一起收集,例如任务完成时间和错误数量[
用户能否形成或记住任务目标?
环境中适当的对象或部分是否可行?
可以定位必要的对象吗?
用户是否可以执行移动和导航操作?
用户能否识别环境中的物体?
这些问题中的每一个都有助于揭示UI中有改进潜力的特定领域。这种方法可以帮助评估适当的现实生活整合量和所述整合的质量,以便VR干预能够最好地实现其预期目的。如果虚拟和现实工具之间的集成不足,已经证明这种摩擦将导致用户更喜欢
启发式评估是一种UI方法,它涉及多个主题专家或专家评估者,而不是征求直接的用户反馈。VR可用性专家通常会根据公认的可用性原则或已经在文献中发表的标准来评估UI设计。
自然接触
与用户任务和域的兼容性
动作的自然表达
密切协调行动和代表
真实的反馈
忠实的观点
导航和方向支持
明确进出点
一致的离职
支持学习
明确转弯
存在感
然后汇集专家的结果,并用于确定优先行动领域[
额外的资源。
评估方法 | 参考资料及资源 |
认知或任务演练 | [ |
图形化的评价 | [ |
事后调查问卷和访谈一个 | [ |
物理性能评估 | [ |
用户界面评估 | [ |
启发式评估 | [ |
其他 | [ |
一个这代表了许多可用性概念的样本,这取决于要测量的可用性概念。
如前所述,本文中提出的许多方法可以混合或混合在一起,以适应给定VR应用程序评估的目标或需求。它们当然不是相互排斥的。一些方法已经包含了一定程度的杂交,最常见的是包括事后调查问卷或访谈。考虑到各种方法之间缺乏标准化,这就需要未来的研究,以开发一个综合框架,包括多种VR评估方法,至少为那些希望对任何新的VR应用程序进行基线评估的人提供一个战略工作计划。这应该包括整合游戏行业中已经使用的最新方法。应该鼓励那些使用为其他类型的健康信息技术开发的虚拟现实可用性方法的人与更广泛的科学界分享他们的经验,重点是这样做的实际经验。目前的文献基础缺乏如何最好地使用这些方法的实际例子,这可能对那些使用它们的人有很大的用处。
在开发VR干预措施和应用程序时,特别是在健康方面,最终用户的舒适度是至关重要的。除了VR技术的众多好处之外,由于视觉扭曲和异步等影响,VR在使用过程中仍然存在类似于晕车的症状[
使用虚拟现实技术的健康相关应用是一个快速发展的发展领域。与医疗保健领域的所有新兴技术一样,需要确保这些新工具的质量和安全[
总体而言,本文提供了六种不同的当代VR可用性评估方法的描述和讨论。作为一个新兴的研究领域,健康VR应用的成型可用性评估方法的开发是未来发展的重要领域。此外,虽然本文讨论的六种方法是单独讨论的,但应该考虑未来进一步混合各种方法,以开发更健壮和更多维的VR可用性解释。例如,像其他可用性评估方法一样[
鉴于到2021年,仅虚拟现实设备的销售额就预计将增长到90亿美元以上[
国际医学杂志编辑委员会
模拟疾病问卷
任务负荷指数
用户界面
虚拟现实
作者要感谢加拿大多伦多的成瘾和心理健康中心图书馆,为开展这项工作提供了必要的学术资源。
这项工作最初是由GS构想的。所有作者通过反馈和讨论对稿件的写作和编辑做出了贡献,符合ICMJE(国际医学期刊编辑委员会)的作者要求,并批准了最终稿件。
没有宣布。