本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/34768,首次出版
通过运动游戏相互作用的数字生物标志物:探索性研究

通过运动游戏相互作用的数字生物标志物:探索性研究

通过运动游戏相互作用的数字生物标志物:探索性研究

原始论文

1希腊塞萨洛尼基亚里斯多德大学医学院健康科学学院医学物理和数字创新实验室

2葡萄牙里斯本里斯本大学,人文运动学院,人文表演学科交叉研究中心

3.哈利法科技大学,阿布扎比,阿拉伯联合酋长国

4电气和计算机工程,亚里士多德大学塞萨洛尼基,塞萨洛尼基,希腊

通讯作者:

Panagiotis Bamidis博士

医学物理与数字创新实验室

医学院健康科学学院

塞萨洛尼基亚里士多德大学

医学物理与数字创新实验室

塞萨洛尼基,54124

希腊

电话:30 2310999310

电子邮件:bamidis@med.auth.gr


背景:通过新技术对患者状态或福祉进行生态有效的评估是当代老龄人口健康和福祉研究的关键问题。通过用户与严肃游戏(SG)的互动产生的游戏内参数可以潜在地用于预测或描述用户的健康和幸福状态。目前有越来越多的研究将游戏互动作为健康和幸福的数字生物标记。

摘要目的:本文的目的是使用标准临床评估测试的值作为基本事实,从与SG交互期间收集的数据中预测健康数字生物标志物。

方法:数据集是在与帕金森病患者使用webFitForAll exergame平台互动期间收集的,该平台是SG的一个引擎,旨在促进老年人、患者和弱势人群的体育活动。收集的数据被称为游戏参数,代表3D传感器摄像机捕捉到的身体动作,并转化为游戏分析。在与运动游戏长期互动之前和之后收集的标准临床测试(干预前测试和干预后测试)用于提供用户基线。

结果:我们的研究结果表明,游戏内的指标可以有效地将参与者划分为不同认知和身体状态的群体。不同的游戏参数对于特定测试具有更高的描述值,并能够用于预测这些测试的数值范围。

结论:我们的研究结果为游戏内指标作为数字生物标记的价值提供了令人鼓舞的证据,并可以促进对改进游戏内指标的分析,以获得更详细的结果。

JMIR严肃游戏2022;10(3):e34768

doi: 10.2196/34768

关键字



背景及理论依据

严肃健康游戏(SG)是指旨在为玩家提供额外价值的游戏,而不仅仅是娱乐,特别涉及身体、心理和社交健康等方面。1],按照世界卫生组织对健康的定义[2].大多数研究结果表明,促进健康的SG是提高老年人身心健康和福祉的有效干预措施,但在结果和用于证明影响的措施方面存在很大差异[3.4或在游戏过程中评估用户。

评估SG干预效果的常用方法是对每个参与者使用外部问卷,一份在游戏前(测试前),另一份在经历一系列游戏环节后(测试后)。这种方法在健康和福祉领域被广泛接受,用于评估SG的有效性[5]但未能提供更详细和可靠的资料[6]用户的健康和福利状况。此外,测试前和测试后等非原位数据的收集需要人力资源,与更自然的体验相反[7],因为它们通常由临床专家在实验室或临床环境中收集。问卷调查、访谈或连续测试常被用作评估工具,在实施时,会给受访者造成压力,威胁准确性和生态效度[8].相反,SG可以在任何环境下以一种令人愉快的方式进行管理,这一事实说明了一个生态有效的环境,在这个环境中,诊断过程可以变得不那么突兀[9].因此,使用SG评估玩家健康和幸福状态的效率应进一步调查,因为这是SG研究中研究较少的课题之一[10].

数字SG支持现场数据捕获,除了通常的干预结果回顾性分析外,还可以揭示新的见解。这个词游戏内指标通常用于描述在用户与SG交互过程中收集的现场数据。游戏内的指标可以是执行游戏任务所需的时间,也可以是复杂的分数计算,或者更低级别的数据监控用户互动。游戏中的参数可能非常多样化,因为目前还没有关于应该收集哪些数据以及用于何种目的的标准或指导方针。11].游戏内的参数可以用来适应难度[1213],监控用户行为[14],并评估学习进度[15].理解和利用游戏内的指标是具有挑战性的,创造将游戏内指标解释为有意义的见解的新方法可以加强SG的研究和有效性。1617].

生成的游戏内指标是丰富的信息和见解来源,可以用来预测或描述用户的健康和幸福状态。Regan等人[18]支持游戏过程中产生的数据,即游戏内指标,是很有希望的心理健康数字生物标志物,而Staiano和Calvert的研究[19]也论证了SG评估身体健康的潜力。游戏玩法中的偏差或游戏参数与临床数据的相关性都可能是心理或身体衰退的指标。游戏参数的可靠性和有效性还有待进一步调查,以明确它们在多大程度上能够在研究中反映健康和幸福感的变化。这一证据将强化游戏参数作为有效、低调且全面的研究工具的价值,从而衡量参与者的健康状况。

目前的工作是一个扩展的,整体工作的一部分,长期记忆护理(NCT02313935),关于SG为老年人和其他弱势人群的身体和认知改善。长期记忆护理的exergame平台已被证明可以显著提高老年人的力量、灵活性、耐力和平衡能力[20.].此外,Konstantinidis等人此前的一项研究[21]证明了由身体运动与exergame交互产生的游戏内参数在检测认知能力下降方面的价值,Anagnostopoulou等人的研究[22证明了改善成人唐氏综合症患者大脑功能结构的证据。

相关工作

SG已经被用于建模或表征用户行为,而不考虑健康结果。Alonso-Fernández等人的研究[23]使用游戏过程中收集的指标,使用机器学习算法预测后测试结果。Loh等人[24研究了玩家的行动过程,并使用了几种相似度来比较玩家,旨在有效地区分他们,并在SG中创建游戏档案(区分兑现者、探索者和放弃者)。这表明可以根据需要评估的内容,使用游戏内指标来模拟不同的结果。

在健康评估方面,作为评估工具的游戏参数的评估和验证要么与临床诊断进行比较,要么与经过验证的评估测试进行比较。25].游戏界面中的认知测量有助于神经疾病的早期检测[26].Bang等人的研究[27]使用从游戏参数中计算出的指数来检测异质发育障碍儿童,而Kim等人的研究[28]评估了与SG相互作用的动力学变量作为发育障碍的数字生物标志物的使用。

SG的目标是提高玩家的身体能力,正如在本研究中所讨论的,被称为exergames,可以开辟一个新的结果评估类别。运动游戏是一种很有前途的工具,可以不引人注目地测量和评估身体健康状况[1921],并通过将运动游戏的典型游戏内指标(如运动时间和反应时间)与测试单元或跌倒风险的标准化评估测试相关联,主要关注跌倒风险评估[29].Aguilar等人[30.]评估了6周无监督的家庭SG干预对动态姿势控制的影响。他们使用广义线性模型和分类算法来估计Kinect记录的身体动作属于年龄超过60岁的参与者的概率,目的是区分年轻和年长的参与者。然而,关于参与者的幸福状态,并没有提供进一步的见解。Pirovano等人[25]开发了一个SG解决方案,以支持家庭康复。他们的解决方案结合了基于模糊的监测和游戏中的适应,以获取临床医生的知识,并在运动期间提供实时反馈。这些反馈用于调整游戏玩法,但不用于评估,尽管它可能有可能获得用户移动和康复过程的见解。

此外,对现有文献的回顾表明,研究界对使用SG,特别是游戏内指标,作为心理测量工具和指标有浓厚的兴趣。31].Valladares-Rodríguez等人的研究[31]确定了与开发SG用于神经心理学评估相关的研究问题,证明了其作为传统神经心理学检查替代品的潜力。但也有人指出,其信度和效度还有待进一步研究,才能应用于日常临床实践[32].此外,开发者还必须解决投资于可能影响游戏可靠性的技术功能的风险。例如,为了使其具有吸引力,在互动过程中,游戏会激发被称为测量的各自特征,从而将增强特征的目的与其测量的目的交织在一起[33].与此同时,它们提供了许多机会来提高评价过程的可靠性。游戏内指标不仅可以提供与特定测试的性能结果相关的信息,还可以提供与测试过程相关的信息。

研究目标

这项研究调查了使用游戏互动中的游戏参数作为数字生物标志物的可能性。所调查的数字生物标记物来自游戏内的指标分析,旨在支持健康和福祉档案组的创建,以及在没有现场数据的情况下评估用户的身体和认知状态。帕金森病患者与webFitForAll平台互动期间收集的游戏内指标[3435]被用作案例研究,以验证研究目标。


概述

主要分析包括使用定义基本事实的神经心理学和物理临床评估测试对参与者进行聚类。对聚类进行评估,以选择参与者的最佳分组。使用一种分类方法来预测每个参与者所属的组,使用游戏内的指标作为特征。研究人员检查了每个游戏指标与每个临床评估测试的相关性,以确定哪些指标具有更高的分离值。所遵循的方法并不依赖于参数选择或任何关于游戏内参数的先验知识。我们试图成为指标不可知论者,这意味着我们试图找到一种解释,为什么数据与临床评估测试的相关性被排除在外。

webFitForAll平台

这项研究分析了与webFitForAll平台交互过程中捕获的数据[20.].webFitForAll是一个基于网络的平台,为老年人和弱势群体提供专门设计和测试的SG锻炼。用户通过3D深度传感器控制器捕捉到的身体动作与游戏互动。该平台上还有其他游戏由其他类型的用户界面控制,如触摸屏和语音控制。本研究以平台的运动游戏为研究对象,通过身体动作控制运动,以获得统一的运动结果。本研究中使用的游戏如下:(1)钓鱼,(2)运动管弦乐队,(3)采摘柑橘类水果,(4)饮食行为再训练[36].这些游戏采用参与式设计方法,旨在满足帕金森病患者特定的步态、平衡和锻炼需求[36].

在钓鱼游戏中,用户的身体姿势被转换成数字船的方向和速度。身体前倾会导致船向前运动,其加速度与身体倾斜成正比。目标是在特定的时间内收集尽可能多的鱼,方法是将船开向鱼,同时避开障碍物(岩石和鲨鱼),并平衡可能改变方向的风。37].

在动态管弦乐队游戏中,用户尝试将特定的音符组与手势联系起来,如向上、向下或循环移动左手或右手,或抬起右腿或左腿等下身动作。音符组是按顺序呈现的,并给用户一个特定的时间段来识别该音符组,将其与特定的动作相匹配,并执行动作[37].

在采摘柑橘类水果的游戏中,用户在虚拟环境中行走。根据用户需要执行的动作顺序,屏幕上显示了采摘和放下水果的具体说明。用户通过移动左手或右手来摘水果。攀登是通过现场行走来模拟的。目标是在特定的时间内采摘尽可能多的水果。37].

在进食行为的再训练游戏中,用户面对屏幕,或坐或站,假装拿着勺子或叉子。屏幕上会显示一个虚拟角色,并显示正确的移动频率。使用者移动他们的手来模仿把勺子放进嘴里的动作。游戏会监测动作,并将其与屏幕上显示的正确动作相关联。每次用户保持正确的频率,他们就会获得一分。游戏持续了一段时间。37].

数据集

游戏内指标

在参与者与游戏的互动过程中,系统会手动捕捉具有代表性的参数,并为每款游戏提供见解。对于每款游戏,不同的游戏参数对应不同的衡量标准。每个游戏内的指标描述文本框1

游戏中的指标。

钓鱼

  • 分数:这是一种游戏内部指标,能够捕捉用户在特定时间内收集到多少鱼。如果用户遇到障碍(鲨鱼或岩石),分数就会降低。因此,分数是朝着目标(鱼)移动和远离障碍物(鲨鱼和岩石)的组合。
  • 目标时间:从目标鱼出现在屏幕上的时间点到用户捕获鱼的时间点之间的时间。这个持续时间是为用户捕获的每条鱼计算的。对于每个会话(Si),游戏内的指标是表示每个目标实现时间的值序列。

运动学乐团

  • 得分:这个游戏内的指标衡量在有限的时间内正确执行的动作数量。游戏根据音符组和移动之间的匹配来识别用户是否执行了正确的移动,以及用户是否能够快速做出反应。
  • 目标时间:从目标音符组显示在屏幕上的时间点到用户执行正确移动的时间点之间的持续时间。此持续时间仅用于正确执行的移动。对于每个会话(Si),游戏内的指标是表示每个目标实现时间的值序列。

采摘柑橘类水果

  • 分数:这个游戏内的指标记录了用户在特定的游戏时间内收集的水果数量。
  • 目标时间:这是目标水果突出显示的时间点和用户“捕获”水果的时间点之间的持续时间。这个持续时间是为用户捕获的每个水果计算的。对于每个会话(Si),游戏内的指标是表示每个目标实现时间的值序列。

饮食行为的再训练

  • 分数:这个游戏内的指标捕捉了用户在特定游戏时间内执行的正确动作的数量。正确的移动被认为与屏幕上的角色几乎同时发生。游戏允许一个足够小的特定时间窗口,以考虑以相同的频率执行移动。
  • 目标时间:这是角色执行移动的时间点与用户执行移动的时间点之间的差值。对于每个会话(Si),游戏内的指标是表示每个目标实现时间的值序列。
文本框1。游戏中的指标。

在会话期间收集的所有数据都存储在一个SQL数据库中,并对每个参与者进行了伪匿名化和密码保护。数据集从数据库中检索,用于离线分析,并为本研究完全匿名。

临床神经心理和身体评估测试

在每个干预序列之前和之后,在不超过1周的时间窗口内,对每个参与者进行临床神经心理和身体评估测试。这些测试是由专业人士、心理学家和体育教育家进行的。他们被认为是每个参与者在干预前后的认知和身体状态的基本真相。所管理的测试是精心挑选的,以描述受SG影响的所有结构域,以及受帕金森病影响最大的结构域。所选的测试评估不同程度的身体状况以及认知障碍,并满足特定的标准,如有效性、可靠性和客观性。所执行的测试为单腿站立测试[38]、伯格平衡量表[39]、短物理性能电池[40]、社区平衡及活动能力量表(CB&M)、长者体能测验(富尔顿体能测验)[41], bmi [42]、以表现为导向的流动性评估[43]、10米步行、日常生活工具性活动量表[44]、8项帕金森病问卷[45]、秋季风险评估[46]、痴呆症评定量表[47],及符号数字模式测验(符号)[48].

协议

每个参与研究的参与者都必须参加至少16次会议,才不会被视为辍学生。每个会话(Si)由相同的游戏序列(Gi)组成,总共包括20个游戏。这些课程每周在预定的日子进行两次。参与者可以重新参加一项研究,以进行后续的一系列干预。然而,如果随访会议的数据在上一次会议后超过1周的时间内进行,则不视为统一参与者研究。图1显示每个参与者执行的协议的可视化。参与者研究被定义为从连续进行的会话中收集数据,在每个会话中组成相同的游戏序列,并且来自单个参与者。

图1。参与者研究的可视化。G1代表游戏的顺序。
查看此图

从前面提到的游戏序列(Gi)中,有4个被用于分析(钓鱼、运动管弦乐队、采摘柑橘类水果和饮食行为的再训练)。这些对应于exergames,并使用深度传感器摄像机以统一的方式捕获。这些都是需要身体运动与游戏互动的动作,医疗保健专业人员认为这是捕捉患者病情和最常见的帕金森病症状的最具指示性的方法。该方案还包括使用标准化问卷进行临床前和临床后神经心理学和物理评估,如前一节所述。参与者还在实际干预期之前进行了一次测试,以熟悉游戏,并消除由于第一次干预中的误解而导致的不具代表性的游戏测量的影响。

参与者

本研究中用于测试该方法的实验数据集包括i-Prognosis H2020项目中发生的游戏会话[49在“北希腊帕金森病患者和朋友协会”的日托中心。共有13名参与者参与了这项研究方案,他们都被诊断患有帕金森病,平均年龄为64.5岁(SD 9.3岁)。所有参与者都签署了一份知情同意书,并且没有向他们提供经济奖励。参与者每周与webFitForAll平台进行两次互动,每次60分钟。每个参与者平均进行25.9次(SD 5.4次)会话。临床评估测试在进入研究前一周内(评估前)和完成一系列干预疗程后一周内(评估后)进行。

分析方法

进行预处理

平均值和SD值是根据每一回合的游戏内部指标计算出来的。每个用户的结果是每个游戏内指标的时间序列,时间序列中的每个点代表1个会话的值。每个用户都在玩不同的游戏,每款游戏都有不同的游戏参数。中显示了为每个用户收集的数据集的可视化表示形式图2

在收集了所有数据后,我们使用基于四分位方法的IQR去发现并移除每个游戏内指标的异常值[50].IQR是数据上半部分和下半部分的中位数之间的范围。每个游戏中的度量系列总共计算了4个四分位数,IQR计算为IQR=Q3-Q1。如果游戏内指标中的某个点的值超过1.5×IQR的值,就会被视为异常值,然后从数据集中移除。此外,我们还删除了由于硬件分辨率和监控条件而无法正确检测到人体骨骼时产生的极端值。一些极端值还由随后使用系统日志文件识别的软件错误产生。

图2。代表参与者研究的模拟数据集的可视化表示。
查看此图

下一步是从每个游戏内指标时间序列中提取特征。选取时间序列的均值和SD值作为特征。每个游戏内指标时间序列的前5个值(下文称为PRE游戏内指标数据)是为每个游戏内指标功能计算的。前5个阶段被认为是在干预开始前更好地反映参与者的身体和精神状态,吸收了游戏学习过程中的任何人为因素。在分析中只考虑1个博弈点会影响结果的可靠性。

聚类

使用一组神经心理学和身体评估测试作为基本事实,使用聚类分析将参与者分为身体和认知状态更好或更差的组。采用层次聚类算法(HAC)进行聚类。在HAC中,每个观察值最初被认为是一个单独的类。该算法选择彼此最相似的聚类,并将它们合并到一个聚类中,直到所有对象合并到一个聚类中。

分类

我们使用了一种分类方法来预测每个参与者所属的群体,并将其作为游戏内指标的特征。每个特征集由所有游戏内的度量值组成,遵循前面描述的特征提取过程。之所以选择决策树分类器作为分类方法,是因为其内部决策逻辑清晰透明,这是神经网络等黑盒类型算法所不具备的。决策树分类器可以快速训练,并允许捕获描述性决策知识,这些知识可以帮助我们解释结果。决策树分类器产生的决策规则也可以用于其他游戏参数的设计和解释。在本研究中使用的选择指标是基尼指数,它衡量的是一个特定变量在随机选择类别时被错误分类的概率。

为了解决数据量小的问题,采用了遗一法。该方法首先将数据集分成m个数据集,每个数据集包含1个参与者的特征向量。在每次迭代中,保留1个特征向量用于测试,其余m-1个特征向量用于训练模型。当所有的特征向量都被测试1次后,整个过程就完成了。因此,对于每个特征向量,都有一个指定的类,这是预测的类。

分别分析每个游戏内部指标

这一步的目的是确定每个游戏内指标对预测每个评估测试对应的健康状态的贡献。为此,我们为每个用户计算了包含所有会话平均值的特征向量。此外,计算临床评估测试特征向量,对应不同的幸福感状态。该向量由每个评估前和评估后测试的平均值组成。计算了游戏参数和临床评估测试之间的Pearson相关系数。结果被认为是明确哪些游戏参数可以预测哪种评估测试。选择具有强相关性(高Pearson相关系数)的度量标准进行进一步分析。

用单个值表示每个时间序列缺乏关于值的顺序以及它们如何随时间变化的信息,而这些信息可能在整个时间序列中都存在。为了避免这种情况,并考虑每个参与者在整个会议期间的演变,动态时间扭曲(DTW) [51]方法。DTW是一种在时间序列分析中用于度量两个时间序列的相似度的方法,即使它们在速度上有差异。例如,两个时间序列可以具有相同的形式,但在时间长度和数据点上不同。在前面描述的步骤中显示出强相关性的值被用于使用DTW方法计算距离矩阵。然后将该距离矩阵作为HAC分析的输入。

伦理批准

这项研究得到了医学院生物伦理委员会的批准(协议号4.123,17/7/2019)。


首先,我们将呈现所有游戏及其游戏参数的综合分析结果,以及所有临床评估测试。然后,研究结果集中在柑桔类水果采摘评分的游戏度量上,从一般结果来看,该度量具有最高的预测价值。

聚类

使用欧几里得距离度量和ward链接的HAC聚类算法产生了以下组:

  • 0组:p#2, p#6, p#8, p#9
  • 组1:p # 0, p # 1, # 3, # 4, # 5, # 7 p, p # 10, p # 11 # 12

图3呈现聚类后形成的2组不同参与者的临床评估测试箱线图。在大多数情况下,两个形成的组在值的分布上有很大的差异,这表明了良好的组间差异。

一般来说,在大多数测试中,0组的得分低于1组。在富尔顿体能测试(FFT)中,该图像有所不同,BMI和10米步行,但这些测试显示较高的值表明较低的能力。因此,我们可以有把握地得出结论,0组包括身体和认知能力较低的参与者,而1组包括身体和认知能力较高的参与者。

图3。聚类后形成的2个不同组的临床评估测试值。BBS:伯格平衡量表;CB&M:社区平衡与流动;FFT: Fullerton适应度测验;FFT_AC: Fullerton体能测验臂卷度;FFT_BS: Fullerton体能测验背部划痕;IADL:日常生活工具性活动;PDQ-8: 8项帕金森病问卷;POMA:面向绩效的流动性评估方法 SPPB: Short Physical Performance Battery; TONI-2: Test of Nonverbal Intelligence, 2nd edition.
查看此图

分类

决策树分类器(准则=Gini)采用留一法进行评估。我们的目标是预测用户是属于0组(表示身体和认知能力较低),还是属于1组(表示身体和认知能力较高),使用的信息仅来自游戏内的参数。游戏参数的初始测量值(PRE)的平均值被用作预测的特征。较高的分类准确率(0.846)表明游戏内指标能够区分具有与临床评估测试具有可比性的判别值的用户。文中给出了混淆矩阵和评价指标表1

表1。混淆矩阵和分类结果。
正确的标签 预测的标签一个

一个
一个
  • 真正的负
  • 8b
  • 61.54%
  • 假阳性
  • 1
  • 7.69%
  • 假阴性
  • 1
  • 7.69%
  • 真阳性
  • 3.
  • 23.08%

一个精度0.846;记得0.75;精度0.75;F1分数= 0.75。

b绝对数字是真阴性、假阳性等实例,以及实例占实例总数的百分比。

该模型还显示出较高的召回率,精度和F1-得分值,这进一步支持了模型在检测身体和认知能力水平较高和较低的参与者时的敏感性。

参与者p#12被分类器错误地分配到组1,而参与者p#2被错误地分配到组0。

分别分析每个游戏内部指标

游戏内指标系列与临床评估测试的Pearson相关系数在图4.只给出绝对值大于0.6的相关性。与特定测试值高度相关的游戏内指标可以用来构建一个模型,预测评估测试的准确值,而不仅仅是一个将参与者分为较高和较低的身体和认知能力的一般类别。

图4,我们得出结论,采摘柑橘类水果在游戏中的评分指标与大多数临床评估测试有更高程度的相关性。因此,对于进一步研究其与每个临床评估测试的相关性,这个游戏中的指标是最可靠的。尽管采摘柑橘类水果的得分与各种评估测试有很强的相关性,但仅凭这个游戏内的指标不能根据参与者的身体和认知状态将他们分为两类。

使用DTW方法计算距离矩阵,使用每个参与者在游戏中采摘柑橘类水果得分的时间序列。这个距离矩阵使用具有完全链接的HAC,根据它们在特定指标(采摘柑橘类水果得分)中的表现得出3个集群:

  • 第一组:p#9, p#6, p#8
  • 第二组:p#3, p#5
  • 3: p # 7 p # 12, p # 11 # 0, p p # 4, # 2, # 1, # 10

为了进一步评估聚类结果,我们提出了CB&M、FFT臂卷度和FFT 8英尺上升和上升的平均预值和后值与平均采摘柑橘类水果评分相关的游戏度量,这些测试具有较高的相关值,如图所示图5.不同的识别组用不同的颜色表示。

所有3个临床评估测试都与游戏内的指标有很强的相关性(r= 0.82,r=−0.87,r=0.85)和使用整个时间序列创建的3个集群的清晰分离。0组对应能力和表现较低的参与者,1组对应中等表现的参与者,2组包括身体能力较高的最佳参与者。参与者p#6、p#8和p#9被分配到与“优秀”参与者相对应的集群中,这两项研究都只考虑了一个游戏内指标。在所有情况下,参与者p#0都接近低能力组,但根据参与者在采摘柑橘类水果游戏中获得的分数,p#0聚集在中等表现组。参与者p#0被分配到聚类中容量较大的组,这表明了考虑评估的游戏内指标组合的重要性。需要指出的是,相关值较高的3个测试评估的是身体能力,这表明在游戏中加入其他指标来评估认知能力也很重要。

图4。皮尔逊游戏参数系列与评估测试的相关性。BBS:伯格平衡量表;CB&M:社区平衡与流动;FFT: Fullerton适应度测验;IADL:日常生活工具性活动;POMA:面向绩效的流动性评估方法SPPB:短物理性能电池。
查看此图
图5。社区平衡和流动性测试与采摘柑橘类水果的游戏得分(右),富勒顿体能测试(FFT) 8英尺上升和移动测试与采摘柑橘类水果的游戏得分(中),10 FFT手臂弯曲测试与采摘柑橘类水果的游戏得分(左)。标识的组以不同的颜色表示。CB&M:社区平衡与流动;FFT:富勒顿体能测验。
查看此图

主要研究结果

这项研究探索了使用游戏内指标作为数字生物标记的可能性,以获得对参与者身体和认知状态的有意义的见解。分析分为两个不同的步骤:(1)考虑临床评估测试的整个数据集,计算基线,然后根据游戏内的指标对参与者进行分类;(2)评估单个游戏内指标的价值,以预测参与者的身体状态。

分析得到了非常有希望的结果,根据他们在神经前心理和身体评估测试中的表现,区分两组参与者的准确率达到了85%(组0表示身体和认知能力较低,而组1表示身体和认知能力较高)。考虑到从游戏中的指标对参与者进行分类,专业人员可以在相应的认知和身体评估中根据每个组的特征获得参与者概况的想法(图4).所提出的方法可以推广到其他类型的SG和游戏参数中,使用不同的标准测试作为每个用户的基本真相,因为它是度量不可知的。

虽然结合使用游戏内指标作为表征健康状况的数字生物标记物获得了令人满意的结果,但单独使用每个游戏内指标可以为特定的身体和认知能力提供更详细的信息。采摘柑橘类水果在游戏中的得分与多种身体评估高度相关,可以进一步视为表征身体状态的数字生物标志物。挑选柑橘类水果的游戏表现出最高的描述值,目标是提高运动技能、同步和平衡技能[52].它显示出与物理测试的高度相关性,如FFT和CB&M,这些测试可以深入了解人的身体状态和下半身的运动。在采摘柑橘类水果游戏中获得较高分数的原因可以解释为,下半身稳定性和力量较高的玩家有更高的信心,并且能够精确和快速地进行练习。这意味着更高的临床评估分数。

专业人士的见解

共有4名健康和幸福领域的专业专家协助参与者与游戏的日常互动,并进行临床评估。专业人员评估了参与者的表现、整体能力和拟议游戏的价值。专业人士认为钓鱼和采摘柑橘类水果的游戏可以更有效地将参与者分为两组。这支持了本研究的结果,因为这两个游戏与地面真相评估测试产生了更高的相关性。

参与者p#6, p#8和p#9被专业人士认为是能力和表现较高的参与者,这也反映在当前分析的结果中。这些运动员总是被归为认知和身体状态“较好”的一组。与p#12一起工作的专业人士评论说,参与者在会议期间注意力不集中,经常说话。这可能解释了两种分析之间的错误分类结果和不一致的结果。参与者p0根据游戏中采摘柑橘类水果的指标被分配到第1组,尽管它在物理评估测试中得分较低。与该学员一起工作的专业人士表示,除了身体能力较低外,该学员努力了很多,取得了很大的进步。这解释了为什么第1组参与者的DTW距离得分较低,表明有改善的趋势,因此,将参与者分配到该组。

在同时具备干预和评估能力的系统(如webFitForAll)的情况下,参与者的价值可能是两倍。首先,由于体育锻炼是对认知能力下降的预防性干预,因此可以延迟认知能力下降的发生[53].第二,早期发现认知和身体衰退症状将为早期实施现有治疗提供机会,因为干预措施更有效[3454].

所提出的方法可用于对表现非常高和较差的球员进行分类。在整个干预会议过程中,从一个组到另一个组的过渡可能是进一步评估的警报。第一组课程也可以用来收集数据,以指导个性化干预措施的设计,并指定困难领域和对所测试技能的行为反应模式。

与以往研究的比较

越来越多的研究调查了衡量健康、福祉和临床结果的数字工具与现有方法的互补性。类似的研究已经调查了在游戏设计中使用3D深度传感器摄像机(微软Kinect)来识别脊髓性肌肉萎缩患者和健康对照组[55].与我们的结果类似,他们发现了一些可以检测差异的数字生物标志物(例如手的速度),而其他功能上的微小差异则无法检测到。Gielis等人[56]使用休闲纸牌游戏产生的数据组合作为数字生物标志物,以区分轻度认知障碍和健康参与者。他们的结果与我们的相似(准确度为0.792),但无法对两项研究进行直接比较。然而,这两项研究都专注于分析游戏内指标的适用性,以表征参与者的健康和幸福。

游戏中的指标不能替代临床神经心理学和物理评估的使用,但可以作为一种辅助方法,放大和交叉引用传统评估方法的结果。除了SG之外,最近的研究提出了计算机形式的认知评估测试,将结果与相应的笔和纸测试进行比较,后者表现出很强的相关性[26].这些类似游戏的筛选测试主要关注对玩家的评估,而不是干预,因此混淆了“游戏”和“计算机化测试”。此外,一些计算机化认知筛查测试的敏感性和特异性已得到高精度评估[57-59].每个SG由一个多因素刺激和改善特征组成,而评估测试提供了一个专门针对一个因素的结构化评估方法。游戏内的指标可以提供关于过程和参与者进度的详细而丰富的数据,这些数据可以用于随着时间的推移对每个参与者进行单独评估。

尽管SG的数字生物标志物显示出显著的鉴别价值,但每个病例都需要更深入的上下文分析。更好地了解每个目标群体的能力和特点可以导致进一步调整和选择措施。

限制

该研究的一些局限性是参与者数量较少(N=13)和个体因素,如部分症状学和帕金森病的病程,对每个参与者的病情有显著的区别,并且由于样本量小,作为变量在结果的影响中具有很大的权重。由于样本量小,上述将用户分为性能好和性能差两组的方法,在定位性能更具体、性能不稳定的玩家时并不十分敏感。

此外,大多数游戏都是在主持人的帮助下进行的。引导者扮演了辅助角色,但有时他们的评论可能会影响游戏内的指标结果。这种研究方法可以应用于更大的样本,并提供更安全的结果,因为个体内源性和环境因素的影响将会减少。在干预开始时,可以评估诸如犹豫参与、压力或预先存在的抑郁等因素,并可用于衡量个人结果,因为它们会影响每个参与者的参与程度和努力程度。

最后,研究小组最初被设计为干预措施,并不旨在评估参与者。然而,随着它们作为筛查方法的价值变得明显,在这个方向上的重新设计可以支持它们作为决策支持工具的价值。

结论

SG最近被用作关于用户的不引人注目的捕获信息的接触来源,可以推动用于评估健康和福祉的数字生物标记物的创建。这项研究探索了webFitForAll平台的使用,该平台收集游戏过程中用户移动的游戏参数,与临床评估测试创建的基线相比,确定不同的用户档案。结果是有希望的,可以促进分析,以改善游戏内的指标,以获得更详细的结果。在分析过程中可以收集更多游戏参数,特别是针对评估测试的预测。

致谢

作者要感谢协调人Ioanna Dratsiou、Maria Metaxa、Foteini Dratsiou、Maria Karagianni和Sotiria Gylou,他们在整个严肃游戏会议期间支持参与者,并分享了关于性能和玩法的有意义的、个性化的见解。作者还想感谢干预会议期间的参与者。

这项工作得到了CAPTAIN Horizon 2020项目(赠款769830)、i-Prognosis Horizon 2020项目(赠款690494)和SHAPES Horizon 2020项目(赠款857159)的部分支持。

利益冲突

没有宣布。

  1. Wattanasoontorn V, Boada I, García R, Sbert M.健康的严肃游戏。娱乐计算2013年12月;4(4):231-247。[CrossRef
  2. 世卫组织组织法:原则。世界卫生组织,2018。URL:https://apps.who.int/gb/bd/PDF/bd47/EN/constitution-en.pdf[2021-09-01]访问
  3. Lau HM, Smit JH, Fleming TM, Riper H.促进心理健康的严肃游戏:它们是可访问的、可行的和有效的吗?系统回顾和荟萃分析。前沿精神病学2017年1月18日;7:209 [免费全文] [CrossRef] [Medline
  4. 阮TT, Ishmatova D, Tapanainen T, Liukkonen TN, Katajapuu N, Makila T,等。严肃游戏对老年人健康福祉的影响:一项系统综述。在:第50届夏威夷系统科学国际会议论文集。2017年发表于:HICSS '17;2017年1月4日至7日;威科洛亚,嗨,美国。[CrossRef
  5. Calderón A, Ruiz M.关于严肃游戏评估的系统文献综述:软件项目管理的应用。计算教育2015年9月;87:396-422。[CrossRef
  6. Bellotti F, Kapralos B, Lee K, Moreno-Ger P, Berta R.严肃游戏中的评估:概述Adv Human Comput Interact 2013年1月;2013:1-11。[CrossRef
  7. Loh CS, Sheng Y.衡量严肃游戏分析专家的表现:从数据到洞察力上榜:Loh CS, Sheng Y, Ifenthaler D,编辑。严肃游戏分析:表现测量、评估和改进的方法瑞士占姆:施普林格;2015:101 - 134。
  8. 林志刚,李志刚。基于生态瞬态评价的生态有效性研究。2017;14(3):253-270 [免费全文] [CrossRef] [Medline
  9. 马弗里斯,德尚特M,维斯里斯S,弗林斯C,曼德瑞克RL。停止信号任务的有效游戏化:两个受控实验室实验。JMIR Serious Games 2020 10月08日;8(3):e17810 [免费全文] [CrossRef] [Medline
  10. Sajjadi P, Ewais A, De Troyer O.严肃游戏中的个性化:对玩家适应方面文献的系统回顾。娱乐Comput 2022年3月41:100468。[CrossRef
  11. Serrano-Laguna Á, Martínez-Ortiz I, Haag J, Regan D, Johnson A, Fernández-Manjón B.应用标准在严肃游戏中系统化学习分析。Comput Stand Interfaces 2017 Feb;50:116-123。[CrossRef
  12. 阿尔维斯T,伽马S,甜瓜FS。严肃游戏中的心流调整。见:IEEE第六届严肃游戏和健康应用国际会议论文集。2018年发表于:SeGAH '18;2018年5月16-18日;奥地利维也纳,第1-8页。[CrossRef
  13. Borghese NA, Pirovano M, Lanzi PL, Wüest S, de Bruin ED.有效的中风在家康复的计算智能和游戏设计。游戏健康J 2013年5月;2(2):81-88 [免费全文] [CrossRef] [Medline
  14. Froschauer J, Seidel I, Gärtner M, Berger H, Merkl D.沉浸式文化训练严肃游戏的设计与评估。第16届虚拟系统和多媒体国际会议论文集。2010年发表于:VSMM '10;2010年10月20-23日;韩国首尔,第253-260页。[CrossRef
  15. Swarz J, Ousley A, Magro A, Rienzo M, Burns D, Lindsey A,等。CancerSpace:一款旨在提高癌症筛查率的模拟游戏。计算机应用技术,2010;30(1):90-94。[CrossRef] [Medline
  16. Bellotti F, Berta R, De Gloria A.设计有效的严肃游戏:研究的机遇和挑战Int J新兴技术学习2010年11月22日;5(SI3):22-35。[CrossRef
  17. 班帕罗普洛斯G,康斯坦丁尼迪斯E,布拉特萨斯C,巴米迪斯PD。面向exergaming commons:编写exergame本体,用于发布开放游戏数据。J Biomed Semantics 2016 Feb 9;7:4 [免费全文] [CrossRef] [Medline
  18. 曼德瑞克RL,伯克MV。基于游戏的数字生物标志物在心理健康建模方面的潜力。JMIR医疗卫生2019年5月23日;6(4):e13485 [免费全文] [CrossRef] [Medline
  19. Staiano AE, Calvert SL.运动游戏有望成为衡量身体健康的工具。娱乐计算机2011年1月01日;2(1):17-21 [免费全文] [CrossRef] [Medline
  20. Konstantinidis EI, Billis AS, Mouzakidis CA, Zilidou VI, Antoniou PE, Bamidis PD。FitForAll的设计、实施和广泛试点部署:一个易于使用的运动游戏平台,提高老年人的身体素质和生活质量。IEEE生物医学健康信息2016年1月20日(1):189-200。[CrossRef] [Medline
  21. Konstantinidis EI, Bamidis PD, Billis A, Kartsidis P, Petsani D, Papageorgiou SG。用于认知评估的游戏内体能训练指标:来自Fitforall健身游戏平台扩展试验的证据。传感器(巴塞尔)2021年8月26日;21(17):5756 [免费全文] [CrossRef] [Medline
  22. Anagnostopoulou A, Styliadis C, Kartsidis P, Romanopoulou E, Zilidou V, Karali C,等。计算机化的身体和认知训练改善了患有唐氏综合症的成年人的大脑功能结构:一项网络科学脑电图研究。网络神经科学2021年3月1日;5(1):274-294 [免费全文] [CrossRef] [Medline
  23. Alonso-Fernández C, Martínez-Ortiz I, Caballero R, Freire M, Fernández-Manjón B.基于学习分析数据预测学生玩严肃游戏后的知识:案例研究。J compput Assist Learn 2019年12月11日;36(3):350-358。[CrossRef
  24. Loh CS, Li I, Sheng Y.在严肃游戏分析中区分玩家行为和决策的相似性度量的比较。计算人类行为2016年11月;64:562-574。[CrossRef
  25. 韦利,鲁宾逊,曼德瑞克。用于注意力评估的数字游戏的制作和评估:系统回顾。JMIR严肃游戏2021年8月09日;9(3):e26449 [免费全文] [CrossRef] [Medline
  26. 哈格勒S, Jimison HB,帕维尔M.评估执行功能的计算机游戏:认知过程的计算建模。IEEE生物医学健康信息2014 7月;18(4):1442-1452 [免费全文] [CrossRef] [Medline
  27. 方超,南勇,高艳杰,李伟,金波,崔勇,等。一种用于检测异质发育障碍儿童的严重游戏衍生指标:随机对照试验。JMIR Serious Games 2019 10月24日;7(4):e14924 [免费全文] [CrossRef] [Medline
  28. Kim HH, An JI, Park YR.在严肃游戏中通过数字生物标记驱动的深度学习检测学龄前儿童发育障碍的预测模型:发展研究。JMIR Serious Games 2021 Jun 04;9(2):e23130 [免费全文] [CrossRef] [Medline
  29. Schoene D, Lord SR, Verhoef P, Smith ST.一种新颖的基于视频游戏的设备,用于测量老年人的踏步表现和跌倒风险。Arch Phys Med Rehabil 2011七月;92(6):947-953。[CrossRef] [Medline
  30. Soancatl Aguilar V, van de Gronde JJ, Lamoth CJ, Maurits NM, Roerdink JB。根据身体运动的速度和弯曲度来评估运动过程中的动态平衡表现。IEEE神经系统复健工程2018年1月;26(1):171-180。[CrossRef] [Medline
  31. Valladares-Rodríguez S, Pérez-Rodríguez R, Anido-Rifón L, Fernández-Iglesias M.严肃游戏在神经心理学评价中的应用趋势:范围综述。J Biomed Inform 2016年12月;64:296-319 [免费全文] [CrossRef] [Medline
  32. 德克勒克S,加藤PM。严肃游戏的未来价值评估:我们何去何从?应用测试技术2017 10月3日;18(S1):32-37。
  33. 加藤PM,德克勒克S.严肃游戏评估:欢迎来到丛林。应用测试技术2017 10月3日;18(S1):1-6。
  34. 张志刚,张志刚,张志刚,张志刚,等。通过结合认知和体能训练获得认知:训练剂量和神经认知障碍严重程度的作用。前沿衰老神经科学2015年8月7日;7:15 15 [免费全文] [CrossRef] [Medline
  35. Konstantinidis EI, Billis AS, Mouzakidis CA, Zilidou VI, Antoniou PE, Bamidis PD。FitForAll的设计、实施和广泛试点部署:一个易于使用的运动游戏平台,提高老年人的身体素质和生活质量。IEEE生物医学健康信息2016年1月20日(1):189-200。[CrossRef] [Medline
  36. Savvidis TP, Konstantinidis EI, Dias SB, Diniz JA, Hadjileontiadis LJ, Bamidis PD。帕金森病患者的运动游戏:参与式设计如何导致技术适应。种马健康技术通报2018;251:78-81。[Medline
  37. Dias SB, Konstantinidis E, Diniz JA, Bamidis P, Charisis V, Hadjidimitriou S,等。关于支持帕金森病患者:i-预后个性化游戏套件设计方法。见:IEEE第30届基于计算机的医疗系统国际研讨会论文集,2017年发表于:CBMS '17;2017年6月22-24日;希腊塞萨洛尼基,521-526页。[CrossRef
  38. 张志刚,张志刚。单腿姿势平衡试验。医学体育杂志1991年12月;1(4):244-246。[CrossRef
  39. Berg KO, Wood-Dauphinee SL, Williams JI, Maki B.老年人平衡测量:仪器验证。Can J公共卫生1992;83增刊2:S7-11。[Medline
  40. Guralnik JM, Simonsick EM, Ferrucci L, Glynn RJ, Berkman LF, Blazer DG,等。评估下肢功能的短期体能测试:与自我报告的残疾、预测死亡率和养老院入院率相关。老年医学杂志1994年3月;49(2):M85-M94。[CrossRef] [Medline
  41. Rikli RE, Jones CJ。开发和验证社区居住老年人的功能健康测试。中国老年医学杂志1999年4月7日(2):129-161。[CrossRef
  42. Nuttall FQ。身体质量指数:肥胖,BMI,与健康:一个重要的回顾。Nutr Today 2015 5月;50(3):117-128 [免费全文] [CrossRef] [Medline
  43. Tinetti ME, Williams TF, Mayewski R.基于慢性残疾数量的老年患者跌倒风险指数美国医学杂志1986年3月;80(3):429-434。[CrossRef] [Medline
  44. 日常生活尺度的劳顿器乐活动。杂志2008年5月;108(4):52-63。[CrossRef] [Medline
  45. Jenkinson C, Fitzpatrick R, Peto V, Greenhall R, Hyman N. PDQ-8:简短形式帕金森病问卷的开发和验证。《心理健康》1997年12月;12(6):805-814。[CrossRef
  46. Stapleton C, Hough P, Oldmeadow L, Bull K, Hill K, Greenwood K.亚急性和住院老年护理的四项跌倒风险筛查工具:预防跌倒的第一步。Australas J aging 2009 Oct;28(3):139-143。[CrossRef] [Medline
  47. 马蒂斯痴呆评定量表:专业手册。美国佛罗里达州敖德萨:心理评估资源;1988.
  48. 符号数字形态测验。托伦斯,CA,美国:西方心理服务;1973.
  49. Υπηρεσία Φιλοξενίας Ιστοχώρων ΑΠΘ。ΚέντροΗλεκτρονικήςΔιακυβέρνησης——ΑριστοτέλειοΠανεπιστήμιοΘεσσαλονίκης。URL:http://www.i-prognosis.eu/[2022-09-09]访问
  50. 刘志强,李志强。生物医学数据中异常值检测方法的比较。中国医学信息技术,2010;16(4):344 - 344。
  51. 张志刚,张志刚。语音识别的动态规划算法优化。IEEE跨声语音信号处理1978年2月;26(1):43-49。[CrossRef
  52. Dias SB, Konstantinidis E, Diniz JA, Bamidis P, Charisis V, Hadjidimitriou S,等。严肃游戏作为全面支持帕金森患者的手段:i-预后个性化游戏套件框架见:2017年第九届虚拟世界和游戏国际会议论文集。2017年9月6日-8日;希腊雅典,第237-244页。[CrossRef
  53. 张志刚,张志刚,张志刚,张志刚,等。衰老的身体和认知干预综述。神经科学生物行为学2014年7月;44:206-220。[CrossRef] [Medline
  54. Jimison H, Pavel M.嵌入式评估算法在基于家庭的认知电脑游戏练习的老年人。2006年IEEE医学与生物工程国际会议论文集,2006年IEMBS '06;2006年8月30日至9月3日;美国纽约州纽约,第6101-6104页。[CrossRef
  55. 陈曦,sieburg - polster J, Wolf D, Czech C, Bonati U, Fischer D,等。使用微软kinect评估III型脊髓性肌萎缩患者上肢运动的可行性。PLoS One 2017年1月25日;12(1):e0170472 [免费全文] [CrossRef] [Medline
  56. Gielis K, Vanden Abeele ME, Verbert K, Tournoy J, De Vos M, Vanden Abeele V.通过在klondike纸牌中发现的认知表现的数字生物标志物检测轻度认知障碍:一项机器学习研究。数字生物标记2021 Feb 19;5(1):44-52 [免费全文] [CrossRef] [Medline
  57. Gualtieri CT, Johnson LG。神经认知测试支持更广泛的轻度认知障碍概念。中华老年痴呆症杂志2005;20(6):359-366 [免费全文] [CrossRef] [Medline
  58. Ahmed S, de Jager C, Wilcock G.轻度认知障碍评估筛查工具的比较:初步发现。编号2012;18(4):336 - 351。[CrossRef] [Medline
  59. 尚克尔,罗姆尼AK,原J, Fortier D,迪克MB,陈建明,等。提高轻度认知障碍检出率的方法。美国科学院学报2005年3月29日;102(13):4919-4924 [免费全文] [CrossRef] [Medline


DTW:动态时间翘曲
FFT:富勒顿体能测验
工厂:分层聚集聚类
SG:严肃的游戏


N Zary编辑;提交08.11.21;A Teles, M Rammohan同行评审;作者评论07.04.22;修订版本收到23.06.22;接受21.07.22;发表13.09.22

版权

©Despoina Petsani, Evdokimos Konstantinidis, Aikaterini-Marina Katsouli, Vasiliki Zilidou, Sofia B Dias, Leontios Hadjileontiadis, Panagiotis Bamidis。最初发表于JMIR Serious Games (https://games.www.mybigtv.com), 13.09.2022。

这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布,允许在任何媒体上不受限制地使用、分发和复制,前提是正确引用最初发表在JMIR Serious Games上的作品。必须包括完整的书目信息,https://games.www.mybigtv.com上的原始出版物的链接,以及此版权和许可信息。


Baidu
map