卡塔尔世界杯8强波胆分析|卡塔尔世界杯4强波胆分析

期刊

JMIR医学教育

2369 - 3762

卡塔尔世界杯8强波胆分析

加拿大多伦多

v6i1e14428

32163036

10.2196/14428

原始论文

虚拟病人与临床医师-教育者对医学生取病史技能评估的比较:探索性描述性研究

Eysenbach

冈瑟

Edelbring

撒母耳

海格

印加

Woodham

路加福音

这种

Mihnea

塞特拉基安

琼

医学博士 1

学院的职业生涯和职业生涯舍布鲁克大学

3001 12大道北

Sherbrooke, QC, J1H 5N4

加拿大 18193461110 ext 74948 jean.setrakian@usherbrooke.ca

https://orcid.org/0000-0001-5910-9084

附近

吉纳维芙

博士学位 1

https://orcid.org/0000-0001-7368-638X

Bergeron

琳达

妈 1

https://orcid.org/0000-0003-2447-7316

Chamberland

马丁尼

医学博士 1

https://orcid.org/0000-0003-2881-1676

St-Onge

克里斯蒂娜

博士学位 1

https://orcid.org/0000-0001-5313-0456

1 学院的职业生涯和职业生涯舍布鲁克大学

路易斯塔里夫,质量控制

加拿大

通讯作者:Jean Setrakian jean.setrakian@usherbrooke.ca

Jan-Jun 2020

12 3. 2020

6 1

e14428

17 4 2019 1 10 2019 25 11 2019 16 12 2019

©Jean Setrakian, genevi Gauthier, Linda Bergeron, Martine Chamberland, Christina St-Onge。最初发表于JMIR医学教育(http://mededu.www.mybigtv.com)， 2020年3月12日。

2020

这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)条款下发布的开放获取文章，该许可允许在任何媒介上不受限制地使用、分发和复制，前提是原始作品首次发表在JMIR医学教育上，并适当引用。必须包括完整的书目信息，到http://mededu.www.mybigtv.com/上原始出版物的链接，以及版权和许可信息。

背景

虚拟病人(VP)是一个有用的工具，可以促进病史记录技能的发展，而不受床边环境的固有限制。虽然副校长有希望为学生技能的发展做出贡献，但记录和评估通过副校长获得的技能是一项挑战。

客观的

我们提出了一个在VP软件中自动评估病史的框架，然后通过将VP分数与10名临床医生-教育工作者(ce)的判断进行比较来测试该框架。

方法

我们建立了4个要评估的病史领域(广度、深度、逻辑顺序和访谈技术)，并将其应用到特定的副总裁环境中。共有10名ce观看了3名学生的屏幕录音，首先评估他们在全球范围内的表现，然后评估他们在4个领域的表现。

结果

副总裁给出的分数略高，但与首席执行官在整体表现、深度、逻辑顺序和采访技巧方面给出的分数相当。在广度方面，3名学生中有2名的VP得分高于CE得分。

结论

研究结果表明，副总裁评估的结果类似于ce产生的结果。开发一个在特定环境中构成良好历史记录性能的模型，可以让我们深入了解ce通常是如何看待评估的。

虚拟病人病史调查自动评分模拟训练医学教育医学专业的学生教育评估计算机软件病史记录技巧病史记录技能评估

介绍背景

虚拟病人(VPs)越来越多地用于卫生专业教育(HPE) [ 1， 2]，包括诊断推理和访谈的教学[ 3.]。尽管副总裁对学习和技能发展有积极影响[ 4- 7]，它们作为学习工具的有用性和有效性受到了挑战[ 8， 9]，并提出了关于学生通过副总裁培养哪些能力的问题[ 10以及副总裁如何配合和补充HPE课程中的学习成果[ 1， 11]。一个主要的问题是缺乏监测副校长对学生学习的影响的结果措施。

开发和衡量具体的学习成果是具有挑战性的，原因有很多，包括HPE中解决复杂问题的方法的内在可变性[ 12]以及发展和背景观点对技能和能力的影响[ 13， 14]。因此，目前对副总裁的结果测量主要集中在职前满意度、知识或与其他测量或测试的整体相关性[ 15]，它只能提供对能力发展和掌握的部分见解。需要更具体和准确的结果测量来进一步探索和记录副校长对学生学习的潜在积极影响。其中一个衡量结果的标准就是评估的好坏由副总裁可以再现教师对学生表现的评价。

与教师的判断相一致的评估可以成为VP软件使用的一个组成部分(1)由学习者进行个人练习，由VP对表现进行反馈，(2)由教师作为说明和评估的工具。副总裁可用于评估推理和面试技巧[ 16- 19]，并容易为学生所接受[ 20.]。创建一个现实的、可信的、多维度的副总裁是具有挑战性的[ 21]。推理与访谈技能综合评估的复杂性[j]。 22， 23这进一步增加了挑战。

我们的目标是开发并在VP中实现医学生历史记录技能的自动评估，并记录该评估如何与临床医生-教育工作者(ce)的观点相一致。

评估病史记录技能

病史是做出正确诊断的核心，无论是真实的还是模拟的患者[ 24， 25]。良好的历史记录需要熟练的诊断推理和访谈[ 26]。通过观察学生在床边获得病人的病史，ce为教学和评估如何整合这两种技能提供了一个宝贵的(通常也是唯一的)机会。 27， 28]。有几种工具可以用来记录部分病历记录技能，如剑桥-卡尔加里模型[ 29]、历史评定量表(HTRS) [ 30.]、《马斯特里赫特历史记录和咨询清单》(MAAS) [ 31]和布朗面试清单(BIC) [ 32]。

在这些工具中评估的项目是广泛的，需要人类的判断来评估。例如，“拾取线索”是剑桥-卡尔加里模型中“收集信息”部分的一个项目。“收集信息”所涵盖的项目对于ce来说可能是不言而喻的，但是将它们转换为自动评估是很复杂的。例如，VP软件可以用来评估学生是否掌握了语言线索。要做到这一点，必须首先使用模拟中的特定实例对副总裁进行编程，在此过程中，患者给出了必须拾取的口头线索。然后，该软件可以记录学生的信息行为(他或她是否根据线索采取行动?)并将其用作证据他或她确实抓住了线索。获取口头线索是可以以这种方式编程的许多技能之一(例如，实例和行为评估)，并以这种细粒度程度进入历史记录VP。

在副总裁开发自动评估的过程中，需要一个框架，以ce评估历史的方式为模型。然后，从这个框架中，可以将具体的实现规则编程到VP中，以向学习者提供有关表现的反馈(形成性评估)。这种框架一旦确立，最终可能导致开发更多的评价工具(总结性评价)。

我们开发了一个框架，通过将其广泛的组成部分分解为可操作的目标度量，来精确地表达在历史中评估的技能。为了探索这些措施是否可以以前面概述的方式使用，我们测试了它们是否与ce的评估具有可比性。阐明我们如何评估这些技能，进一步加深了我们如何通过卡尔加里-剑桥模型等工具评估床边病史的知识。

本研究的目的如下:(1)提出一个通过VP软件评估病史记录技能的框架;(2)利用该框架检验VP评估与ce评估的一致性。

一个病人病史记录技能的虚拟评估框架

我们的目标首先是澄清对病史采集技能的期望和假设，探索在病史采集背景下可接受的表现范围[ 33]。因此，我们的工作开始于通过确定成功表现的特征，在办案人员一级实施预期的病史记录技能。

基于多年来评估学生床边技能的经验，如HTRS、MAAS、BIC和卡尔加里-剑桥模型所描述的技能，并通过与加拿大大学同事的反复磋商，首席研究员(JS)开始将这些技能分解成一个框架，其中包括可自动化的特定实例和行为，从而可编程为VP。这些被分为4个领域:数据收集的广度、数据收集的深度、问题的逻辑顺序和访谈技巧。然后调整这些域以实现到特定的VP环境中。看到表1框架的定义和实现规则的操作化。

表1

病历记录技能的虚拟病人评估框架。

域		描述	实施规则
宽度
	数据收集的广度	探索的程度，以找到所有相关的问题领域，在病人的情况	确定的症状:占相关症状总数的百分比
深度
	数据收集深度	探索的程度，以找到有关每个问题领域的所有相关细节	询问有关症状的详细信息:在VP中编程的详细信息总数中所占的百分比^一个
逻辑顺序
	问题顺序	通过相关诊断可能性反映思维的逻辑序列	鉴别症状的总体顺序和可选序列的差异评分(见多媒体附录1）
面试技巧
	组成部分(a):适当使用一般性问题	询问适用于每个症状的一般细节，如持续时间、严重程度、病程和诱发因素	一般问题:占总问题的百分比-按行政长官制定的范围评分^b
	组件(b):适当使用转换语句	适当使用过渡语句，如“是”、“不是”、“让我问你几个问题”和“这很正常”。理想的数量因情况而异	开场白和后续问题、打断、是或否的回答、安慰和过渡陈述;- >按行政长官制定的评分范围评分
	组件(c):适当的流程	避免在没有明显理由的情况下从一个主题跳到下一个主题，或者在转移到另一个主题之前没有充分探索某些领域	学生从一类问题(如GI)到另一类问题(如心脏)的通过次数-根据CE设定的可接受数字得分为>
	组件(d):成功处理KIE^c	需要理解隐性交流规则的一系列事件或实例的组合(线索、误解、切题的答案、不完整的答案、模糊的答案、不精确的答案)	如果在任何给定的KIE中遇到事件，则对事件的成功或失败进行二进制评分

^一个VP:虚拟病人。

^bCE: clinician-educator。

^cKIE:面试的关键要素。

前两个领域(即广度和深度)涉及数据收集的完整性。是否获得了患者的所有症状，是否获得了足够的细节?在床边教学过程中，尽管ce不知道患者的所有症状及其细节，但他们通常会对学生的彻底程度做出判断。对于副总统，我们将广度定义为学生确定的副总统症状(如头晕、苍白、疲劳、小便)的百分比，深度定义为确定的程序化症状细节的百分比(例如，头晕持续3周，站立时更糟，第一次，没有失去意识)。

第三个领域，问题的逻辑顺序，反映了ce对学生通过鉴别诊断导航的判断。虽然诊断推理不能直接评估，但通过对症状的一系列质疑，可以对学生的推理进行推断。例如，在发现咳嗽后立即询问发烧，这被视为间接证据，表明学生考虑到咳嗽的传染性原因的可能性。在不将“正确”序列完全限制为专家路径的情况下，VP评估将不同的分数附加到探索2、3、4或5个症状的各种可选序列中，以反映这种诊断推理评估。

第四个领域是访谈技术，它由四个部分组成。前三个组成部分，即通用问题与系统特定问题的组合使用、转换语句和主题之间的跳跃次数，见表1．这3个组件可以很容易地被VP监控。至于第四个组成部分，参与设计副总裁的同事指出，在病史测试过程中出现的特定面试陷阱构成了他们对学生表现评估的关键组成部分:他们是否错过了线索，他们是否被一个切线的答案所误导，或者他们是否能够坚持下去，稍后再回来探索切线?我们通过关键访谈要素(KIEs;看到表1）.这些元素，基于在面试中遇到的常见挑战，被编入足够多的程序，以确保每个学生平均会遇到3或4个实例。

前面描述的4个领域中的每一个都被实现到VP中，以提供4个不同的评分和一个全局评分:虚拟患者广度评分(VP - bs)，虚拟患者深度评分(VP - ds)，虚拟患者逻辑序列评分(VP - lss)，虚拟患者访谈技术评分(VP - its)，以及虚拟患者全局评分(VP - gs)。虽然VP被编程为从其数据中提供领域分数，但是分数组成部分的相对重要性和特定错误的阈值被留下来适应使用的教育背景。

方法研究设计

在这项探索性描述性研究中，我们阐述并测试了一个评估副总裁病史记录技能的框架。首先，我们将这个框架实现到一个特定的副总裁中，然后将副总裁分配的全局和领域分数与10个经验丰富的CE参与者分配的分数进行比较。这项研究得到了我们机构伦理委员会的批准。

参与者

采用方便抽样的方法，共招募了10名来自加拿大医学部的普通内科医生。样本包括6男4女，平均(SD)为16.5年(9.2年)的医学专业实践，平均(SD)为14.3年(8.3年)的评价医学生的历史。没有一个与会者参与导致副主席方案拟订的拟订或协商工作。所有参与者都同意参加这项研究。

材料学生访谈或刺激的屏幕录音

以3名医三学生采访某结肠癌临床病例副总裁的截屏视频作为刺激。采用方便抽样的方式招收学生。这些截图视频是用Camtasia Studio 7制作的，以保护学生的匿名性。共有2名学生在四年制医学课程的前三个月，1名学生在最后三个月。每个学生都单独会见，并签署了一份同意书，授权在研究项目中使用记录的数据。

每个学生首先被介绍给这个软件。对屏幕界面的每个部分以及导航框进行了解释。学生有10分钟的时间自由浏览并熟悉软件。然后，这名学生被邀请从副校长那里获得一份病史，就像他或她在入院时对真正的病人所做的那样。在30分钟的时间限制内，学生被要求按照自己的节奏走，而不是“与时间赛跑”。学生们很容易地使用了软件的所有组件，没有要求进一步的解释。虽然软件允许学生在最后输入他们最可能的诊断，但在他们输入诊断之前，截图记录被中断，因为这不是CE评估的重点。

评级工具

两个团队成员(JS和CS)为CE开发了一个评级工具。评分量表反映了VP中实现的评估方案，具有全局表现分数和每个领域的分数(广度、深度、逻辑顺序和访谈技巧)。每个分数用一个问题来描述。CE参与者必须在描述性10厘米视觉模拟量表上提供3个描述符:两端各1个标记为“低于平均水平”和“高于平均水平”，中间1个标记为“平均”(见多媒体附录2)，这里指的是三年级学生的表现。视觉模拟量表被确定为超过一个百分比的分数，以避免评估人员分配在60%到100%之间的典型分数范围。

评核实务调查

作者进行了一项调查，收集行政会议参与者的集体评估做法。更具体地说，调查记录了(a)全球得分的相对领域权重(广度、深度、逻辑顺序、访谈技巧)，(b)访谈技巧元素的权重(具体实例、陈述句的使用、一般性问题的使用、主题之间的跳跃次数)，以及(c)在(1)陈述句的使用、(2)一般性问题的使用、(3)主题之间的跳跃次数等方面的可接受和理想范围。

为协助行政长官参加者更好地理解所使用的一些术语(例如“具体例子”)，以及如何表达上限和下限，调查包括定义、例子和视觉辅助工具(见多媒体附录3）.

虚拟病人软件

开发VP是为了在病史采集过程中为学生提供诊断推理和访谈技巧方面的反馈。

该软件由作者(JS)开发，涉及三个临床病例，包括一个结肠癌病例，他是一名CE，提供教学设计和内容(例如，问题/回答，小组组成部分)。2002年至2006年期间，蒙特利尔麦吉尔大学教学交流中心提供教学设计、平面设计支持以及Java编程。该软件使用一组预先确定的问题用于面试。视频答案被创建为一组默认答案，由一位女演员提供，用于向医疗采访者提供所有问题。一些烦恼、恼怒或焦虑的反应也被记录下来，使访谈更加真实。对3个临床病例的具体回答被记录下来，根据每个临床情况替换为默认问题。

屏幕界面由各种面板组成(参见图1)，包括:(1)病人的一个视频,(2)一个记事本,症状表现为他们揭示了病人的答案,学生之间可以拖拽一个活跃的和不活跃的问题列表,(3)三个小组的问题(背景问题,一般问题,回顾系统),(4)responses-and-comments面板,(5)一个时钟,(6)一盒允许学生最后诊断,和(7)两个按钮(“主菜单”和“返回”),让学生浏览。

软件中可用的问题(大约500个)分为3个主要类别(由前面显示的不同面板说明)和回复和评论面板。第一类(背景)包括病史、药物、过敏、免疫、家族史、习惯、近期旅行和社会史等问题。第二类列出通用的可以应用于每种症状的问题，从“症状开始前发生了什么?”到“你看过医生治疗这种症状吗?”每个问题都可以应用于患者的每个症状，并且随着学生点击问题列表(在记事本上)上的不同项目，问题的措辞也会发生变化。第三类是对系统的审查，包含350个问题。当学生点击一个系统时，就会出现一个关于所选系统的问题列表。此外，学生可以点击包括过渡陈述、中断陈述和保证陈述在内的回应或评论。一个后续按钮在病人提供答案后显示，并允许选择4个后续问题:“你需要告诉我更多关于那个的信息”、“让我再问你一次”、“什么?”、“你确定吗?”

当病人透露她的症状或她的病史项目时，它们出现在“活动问题”列表中。项目可以随时在“活动问题”和“非活动问题”列表之间移动(拖拽)。当学生准备好了，他或她可以点击“做出诊断”，并在诊断列表中选择一个或多个项目。

图1

虚拟病人屏幕界面。

过程

一名研究助理与行政会议参加者会面2小时。在对模拟和项目进行简要介绍后，CE参与者有5分钟的时间自行浏览模拟软件，以熟悉界面和问题的选择。

然后，向CE参与者提供了关于广度、深度、逻辑顺序和访谈技巧的简明和非定量定义，而没有透露相应的VP操作定义。在看完每个学生的屏幕录音后，他们被要求使用评级工具．他们没有看到学生选择的诊断，因为之前的截图视频被打断了，他们不熟悉副总裁的诊断。之后，他们必须完成评估调查。

分析虚拟患者评分

的数据评估调查随后被用来计算这些组成部分的vp衍生分数。例如，为了计算VP - gs，每个VP领域得分(广度、深度、逻辑序列和访谈技术)乘以CE参与者附加到每个领域的平均权重。此外，为了计算VP-ITS, CE参与者的平均建议截止点用于通用问题与特定问题，过渡语句和主题之间跳转的数量的可接受和最佳范围。

Clinician-Educator分数

每个参与者在视觉模拟量表上的反应被转换成满分100分，用尺子测量被调查者的笔标记的位置，10厘米代表100%。10名CE参与者在评估网格上提供的总体表现、广度、深度、逻辑序列和访谈技术得分的平均值构成CE得分(分别为临床医生-教育者整体得分[CE - gs]、临床医生-教育者广度得分[CE - bs]、临床医生-教育者深度得分[CE - ds]、临床医生-教育者逻辑序列得分[CE - lss]、临床医生-教育者访谈技术得分[CE - its])。

结果

学生的成绩，从VP和CE，呈现在图2．单线表示VP软件评估，箱线图表示CE参与者的评估范围。对于这5个分数，每3个学生的表现都有一个箱线图。这些描述性分析的目标是探索副总裁使用我们的框架提供的评估与金标准(即行政长官提供的评估)相比如何。这样做的目的是使副校长的分数在CE分配给每个学生的分数范围内多媒体附录4）.

总体而言，副总裁提供的分数略高，但与CE分配的整体表现和深度，逻辑顺序和访谈技巧领域的分数相当。在广度方面，VP得分较高，不属于学生A和C的CE分数范围。在面试技巧方面，包括4个组成部分，只有学生C的VP得分不在CE分数范围内。

图2

箱形图显示每个学生和每个分数的虚拟患者和临床医生-教育者分数。

讨论比较虚拟病人和临床医生教育工作者的分数

我们在一个特定的副总裁中实现了一个框架，通过将广泛的技能分解为小的评估点来评估病史，然后根据10个ce的判断对框架进行测试。我们的研究结果表明，通过这样一个框架，VP的评估可以产生类似于CE产生的分数。我们讨论了我们的结果，并就拟议的评估方案及其实施反映了每个领域的相关性。

使用VP内嵌的评估框架来评估病史记录技能的一个优点是评估的可靠性[ 34]。当提到信度时，指的是“测试过程中重复的分数的一致性”[ 34]，很明显，自动化评估有助于提高评估的可靠性。考虑到可靠性通常被认为是评估分数有效性的必要条件，我们想要记录嵌入在VP中的框架是否产生了有效的评估，这是有理由的。因此，我们比较了VP分数与“金标准”，即ce对医学生历史记录技能的评估。

VP-GS是从4个领域得分计算出来的，尽管根据CE参与者的调查校准了相对权重(见多媒体附录4详情)。The CE–GSs were an appraisal by CE of the students’ overall performance and were not derived from the CE’s domain scores. CE’s global appraisals typically have the gestalt quality of a true expert assessment [ 35]，代表了VP-GS的黄金标准。总体而言，VP的整体得分落在ce - gs的范围内，这表明深度、广度、逻辑顺序和访谈技术是适当和充分的领域，可以近似专家的格式塔评估，否则VP - gs和ce - gs可能会有所不同。此外，当ce被问及他们认为重要的其他领域时，他们列出了在屏幕记录中看不到的医疗访谈方面，如学生的同理心、肢体语言和语气;掌握非语言线索等技能;以及在介绍和结论之间组织面试的能力，他们认为副总裁不允许这样做，这是正确的。需要指出的是，评估病史的某些方面不属于卡尔加里-剑桥模型的“收集信息”部分，而其他方面，如收集非语言线索，属于该部分，可以被编程到副总裁(例如，副总裁坐立不安的视频)，但我们的框架没有解决。

3名学生中有2名的副总统广度得分，即对副总统各种症状的全范围识别，高于CE给出的广度得分。VP分数仅仅是学生识别的症状占被编程的症状总数的百分比。与副总裁不同的是，CE不知道所编制的症状总数，并对这类患者可能出现的其他症状做出判断。VP - bss和CE - bss之间的差异可能有两个主要原因:(1)VP可能没有被编入足够多的症状，无法真实地代表这类患者;(2)CE可能期望对一般症状提出更广泛的问题，即所谓的“系统审查”。在学生反复使用该病例并咨询了CE后，我们没有发现遗漏的细节，这些细节本应被编入副总裁的程序，这表明，与其副总裁症状太少，CE更希望将系统审查作为任何病史的一部分。值得注意的是，所有10名CE参与者都是全科内科医生，他们可能在自己的实践中采用这种全科方法。副总裁评价系统没有考虑到对制度的审查。

VP的深度分数，即每个VP症状的详细程度，在ce给出的分数范围内。同样，VP分数只是学生识别的症状细节占编程的症状细节总数的百分比。行政长官的判断与这个简单比率一致的事实表明，行政长官能够估计学生错过或没有错过的症状细节。

逻辑序列的VP分数反映了通过相关诊断可能性进行的系统思维，与CE给出的分数范围很好地一致。副总裁的实现比广度或深度的实现要复杂得多，因为它涉及到为与副总裁症状相关的许多潜在问题序列分配不同的分数。事实上，这个领域需要一套规则，这些规则反映了所有复杂问题解决的存在，不仅仅是一个所谓的专家路径，而是几个可接受的路径来达到诊断。此外，与前两个不同，这个领域的分数不能通过学生简单地点击尽可能多的问题来提高，因为分数取决于问题的顺序，而不是问题的数量。

面试技巧的VP分数是4个组成部分的组合(适当使用一般性问题、过渡、流程和对问题的处理)，在学生a和B的CE分数范围内，学生c的分数略低。这是另一个复杂的衡量标准，它已经使用CE建议的范围进行了校正，以确定主题之间的跳跃次数、过渡语句的使用、以及通用问题和特定问题的使用，似乎提供了低于相应CE分数的VP分数。VP分数是二元的，在CE建议的理想和可接受范围的应用中可能过于限制。

评核实务调查

10位消费者对研究调查的回答记录了他们对总体得分的相对领域权重(广度、深度、逻辑顺序和访谈技术)，他们对访谈技术要素的权重(具体实例、陈述句的使用、一般性问题的使用和主题之间的跳跃次数)，以及他们对陈述句的使用、一般性问题的使用和主题之间的跳跃次数的可接受和理想范围(参见多媒体附录4）.这些调查使我们能够在从VP的原始数据计算分数的最后一步完善框架。这样的迭代过程确保自动评估反映了行政长官在判断学生表现时的优先次序和价值观。

对建议成果措施的反思

开发一个评估历史记录技能的框架，将其编程为VP，并将VP分数与ce的判断进行比较，使我们能够反映所建议的框架及其在特定VP中的实现。例如，当我们反思副总裁如何低估广度分数时，我们知道我们可能错过了由ce定义的广度元素，可能是对系统的更广泛的审查，如前所述。因此，我们正在考虑将学生通过特定问题探索的系统数量的额外组成部分(例如，心血管，肾脏)整合到副校长的领域分数中。类似地，当我们在考虑框架的实现时，我们希望检查如何计算可接受的通用问题或转换语句的数量范围。我们可能需要尝试使用增量截止值来更好地反映CE的判断和结果分数，而不是使用离散截止值(例如，根据CE调查的平均值，小于26.4%的截止值为零)。

许多与副总裁相关的研究都集中在他们对知识获取和技能的影响上[ 36]。本研究的重点是开发一个与教育工作者的评估实践相一致的评估框架。邀请ce的观点[ 1， 37]允许创建符合CE教育目标的副总裁，同时反过来为CE提供更好地了解学生技能发展的机会。在实现之后，正如我们在这里所做的那样，使用ce的判断来验证和测试评估框架，进一步帮助改进实现并与目标保持一致。最终目标是将副总裁更好地融入正式课程，并从副总裁顺利过渡到床边教学，因为很明显，没有副总裁可以取代与患者的真正互动。VP提供的评估必须对学习环境中的所有参与者都有意义，并尽可能忠实地反映当前的评估实践，最终促进绩效的真正改进。

限制

该研究的CE和VP比较结果是初步的，因为它们包括使用单一案例和有限数量的学生表现。我们的结果需要在其他案例和更多的受众中进行测试。实习级别的医学生是这个处理诊断推理和面试技巧的特定VP软件的目标受众，结果可能不适用于不同级别的学生和其他评估，如沟通技巧和肢体语言。除了学生人数少之外，他们的小范围也代表了另一个限制。这3名学生没有出现高质量和低质量的极端表现。使用更大的学生池并有目的地选择特定的表演来验证广泛的表演范围将使我们能够更好地测试VP分数的区分能力。此外，这个副总裁软件并不是为了评估病历记录技能中固有的非语言沟通技巧，而是更多地关注收集信息的其他方面，作为医疗面试的一部分。

结论

我们开发了一个评估病史记录技能的框架，并将其编程到VP软件中，该软件与我们小型观察性研究中ce的评估相一致。通过迭代过程，我们的研究还提供了ce如何评估特定的病史领域的见解，使我们能够进一步完善编程到VP的方案。我们的研究结果表明，一些通常在床边进行评估的技能可以通过软件进行评估，前提是通过一系列逻辑序列而不是“专家路径”来灵活判断推理，并且“获取线索”等广泛的描述性术语可以转化为可操作的，学生和副校长可观察到的行为，然后专门编程，包括要求学生通过参与特定行为来展示这些技能的情况(如澄清，跟踪线索，提出合乎逻辑的问题顺序，使用开放式问题)。随着越来越多的副校长和持续不断的咨询与交流，可以期望产生一代副校长，他们可以向学习者提供反馈，并协助教师评估他们的表现。

多媒体附录1

对症状识别的总体顺序和替代顺序进行差异评分。

多媒体附录2

评级工具。

多媒体附录3

评估实践调查。

多媒体附录4

每个领域和组成部分的平均权重，以及临床医生-教育者参与者给出的领域和组成部分的可接受和最佳范围的平均限制。

缩写

BIC

布朗面试清单

clinician-educator

CE-BS

clinician-educator-breadth得分

CE-DS

clinician-educator-depth得分

CE-GS

clinician-educator-global得分

CE-ITS

临床医生-教育者-访谈技术评分

CE-LSS

临床医生-教育者-逻辑序列评分

HPE

卫生专业教育

htr

历史评定量表

KIE

关键面试要素

MAAS

马斯特里赫特历史记录和建议清单

副总裁

虚拟病人

VP-BS

虚拟病人广度评分

VP-DS

虚拟病人深度评分

VP-GS

虚拟患者整体评分

VP-ITS

虚拟病人访谈技术评分

VP-LSS

虚拟患者逻辑序列评分

这个项目是由舍布鲁克大学的社会组织该机构没有参与这项研究或手稿的撰写。我们要感谢Sìlvia Mamede和Remy Rikers对这个项目设计的帮助。

没有宣布。

伯曼

注

二次

费舍尔

先生

Huwendiek

年代

Triola

毫米

虚拟病人在未来医学教育中的作用

阿德莱德大学的地中海 2016 09 91 9 1217 22

10.1097 / ACM.0000000000001146

26959224

海格

我

Kononowicz

Tolks

Edelbring

年代

Kuehlmeyer

基于系统文献回顾的医疗保健教育中虚拟病人描述的定性分析

BMC医学教育 2016 05 13 16 146

10.1186 / s12909 - 016 - 0655 - 8

27177766

10.1186 / s12909 - 016 - 0655 - 8

PMC4865997

帕森斯

道明

肯尼

里索

用于临床访谈和沟通技巧训练的虚拟病人

第七届虚拟现实与仲裁相关技术会议论文集 2008

ICDVRAT 08年

2008年9月8日至11日

玛雅,葡萄牙

英国

雷丁大学

罗宾逊

柯

艾伦

鹌鹑

米

拜尔比

虚拟病人临床实习提高学生的沟通能力

互动学习环境 2018 1 11

10.1080 / 10494820.2018.1552869

烹饪

达

欧文

Triola

毫米

卫生专业教育中的计算机化虚拟病人:系统回顾和荟萃分析

阿德莱德大学的地中海 2010 10 85 10 1589 602

10.1097 / ACM.0b013e3181edfe13

20703150

Bergeron

香槟

气

迪翁

米

Theriault

Renaud

学生驱动的虚拟患者应用对客观结构化临床检查表现的影响:观察性研究

J Med Internet Res 2018 02 22 20. 2 e60

10.2196 / jmir.7548

29472175

v20i2e60

PMC5843791

莱曼

博斯

嗯

西蒙

一个

Nikendei

Huwendiek

年代

一种创新的混合学习方法，使用虚拟病人作为技能实验室培训的准备:学生和导师的看法

BMC医学教育 2013 02 12 13 23

10.1186 / 1472-6920-13-23

23402663

1472-6920-13-23

PMC3599450

诺曼

多尔

格里尔生家族的

模拟逼真度与学习迁移之间的最小关系

地中海建造 2012 07 46 7 636 47

10.1111 / j.1365-2923.2012.04243.x

22616789

烹饪

达

布里奇斯

Zendejas

Hamstra

Hatala

评估卫生专业人员的技术增强模拟:有效性证据、研究方法和报告质量的系统评价

阿德莱德大学的地中海 2013 06 88 6 872 83

10.1097 / ACM.0b013e31828ffdcf

23619073

McGaghie

Issenberg

某人

Petrusa

呃

Scalese

基于模拟的医学教育研究综述:2003-2009

地中海建造 2010 01 44 1 50 63

10.1111 / j.1365-2923.2009.03547.x

20078756

MED3547

Hamstra

布里奇斯

Hatala

Zendejas

烹饪

达

重新考虑仿真训练中的保真度

阿德莱德大学的地中海 2014 03 89 3. 387 92

10.1097 / ACM.0000000000000130

24448038

附近

Lajoie

在基于案例的教学中，专家临床教师是否对什么是称职的推理表现有共同的理解?

Instr Sci 2014 07 42 4 579 94

10.1007 / s11251 - 013 - 9290 - 5

贝茨

Ellaway

映射上下文的暗物质:一个概念性范围审查

地中海建造 2016 08 50 8 807 16

10.1111 / medu.13034

27402041

Teunissen

Kogan

小

美食

不

Gruppen收购

林嘉德

拉

实践中的学习:时变医学培训情境的评估

阿德莱德大学的地中海 2018 03 93 基于3S能力的时变卫生专业教育 S22 6

10.1097 / ACM.0000000000002070

29485483

00001888-201803001-00005

Botezatu

米

霍特

Tessma

可

福尔斯得到消息

虚拟病人模拟:知识获得还是知识损失?

医学教 2010 32 7 562 8

10.3109 / 01421590903514630

20653378

查普曼

卡尔豪

詹

范Mondfrans

美联社

戴维斯

周

使用虚拟病人模型测量临床推理能力

J临床理性过程能力 2013 03 1 1 9

约翰森

Raij

一个

史蒂文斯

一个

林德

洛克

虚拟人的体验在人际交往能力教育中的有效性

计算系统中人因会议论文集 2007

气' 07

2007年4月28日至5月3日

加州圣何塞，美国

美国

ACM

1049 58

史蒂文斯

一个

埃尔南德斯

约翰森

迪克森

Raij

一个

哈里森

DiPietro

米

艾伦

Ferdig

Foti

年代

杰克逊

胫骨

米

Cendan

沃森

Duerson

米

洛克

科恩

米

瓦格纳

林德

利用虚拟病人来教授医学生历史学习和沟通技巧

我是外科医生 2006 06 191 6 806 11

10.1016 / j.amjsurg.2006.03.002

16720154

s0002 - 9610 (06) 00204 - 2

Triola

毫米

Huwendiek

年代

莱文森

烹饪

达

卫生专业教育电子学习研究的新方向:两次专题讨论会报告

医学教 2012 34 1 e15 20.

10.3109 / 0142159 x.2012.638010

22250691

20.

一厢情愿

Brutlag

血性小子

射击

Zary

福尔斯得到消息

使用虚拟病人来评估医学生的临床技能和推理:对学生接受度的初步见解

医学教 2009 08 31 8 739 42

10.1080 / 01421590903126489

19811211

10.1080 / 01421590903126489

Posel

海岸

Fleiszer

虚拟病例:对作者的要求和看法的定性研究

国际医学教育 2012 3. 175 82

10.5116 / ijme.5038.a1e1

科恩

Colliver

晶澳

玛西

女士

炸

艾德

史瓦兹

用于评估人际和沟通技巧的标准化患者检查表和评定量表的心理测量特性

阿德莱德大学的地中海 1996 01 71 1 5 S87 9

10.1097 / 00001888-199601000-00052

8546794

Cutrer

白平衡

沙利文

弗莱明

提高临床推理能力的教育策略

当前问题儿科青少年保健 2013 10 43 9 248 57

10.1016 / j.cppeds.2013.07.005

24070582

s1538 - 5442 (13) 00094 - 1

彼得森

霍尔布鲁克

•冯•黑尔斯

史密斯

问

股份

病史、体格检查和实验室调查对医学诊断的贡献

西地中海 1992 02 156 2 163 5

1536065

PMC1003190

冢本

Ohira

野田佳彦

高田

Ikusaka

米

医学生病历对模拟病例诊断的贡献

国际医学教育 2012 3. 78 82

10.5116 / ijme.4f8a.e48c

卡里

库尔茨

年代

将临床交流与临床推理和更广泛的医学课程相结合

病人教育委员会 2013 09 92 3. 361 5

10.1016 / j.pec.2013.07.007

23896126

s0738 - 3991 (13) 00283 - 8

阿特金森

Ajjawi

冷却

促进全科实习生临床推理:临床教师的角色

中国教 2011 09 8 3. 176 80

10.1111 / j.1743 - 498 x.2011.00447.x

21851565

瑞斯

Tordoff

曼宁

凹痕

通过门诊医学教学计划促进临床技能发展:一项评估研究

医学教 2013 08 35 8 648 54

10.3109 / 0142159 x.2013.801553

23758182

库尔茨

年代

西尔弗曼

本森

德雷伯

临床方法教学中内容与过程的结合:加强卡尔加里-剑桥指南

阿德莱德大学的地中海 2003 08 78 8 802 9

10.1097 / 00001888-200308000-00011

12915371

30.

埃文斯

甜蜜的

Coman

对医学生交流计划有效性的行为评估

地中海建造 1993 07 27 4 344 50

10.1111 / j.1365-2923.1993.tb00279.x

8412875

Kraan

高频

Crijnen

德弗里斯

兆瓦

Zuidweg

大修

范德维勒滕

医学访谈技巧在多大程度上是可教的?

医学教 1990 12 3 - 4 315 28

10.3109 / 01421599009006637

2095449

诺瓦克

沃尔克

Drossman

达

利普金

米

美国医学院的医学面试与人际交往技巧教学。进步、问题和承诺

美国医学会 1993 04 28 269 16 2101 5

8468764

二次

Artino

基于“增大化现实”技术

Schuwirth

范德维勒滕

澄清假设以增强我们对临床推理的理解和评估

阿德莱德大学的地中海 2013 04 88 4 442 8

10.1097 / ACM.0b013e3182851b5b

23425980

美国教育研究协会美国心理学会全国教育计量委员会

教育和心理测试标准 2014

美国华盛顿特区

美国教育研究协会

霍奇斯

后心理测量时代的评估:学会爱主观与集体

医学教 2013 07 35 7 564 8

10.3109 / 0142159 x.2013.789134

23631408

Kononowicz

Woodham

拉

Edelbring

年代

Stathakarou

戴维斯

Saxena

都铎式汽车

Carlstedt-Duke

车

Zary

卫生专业教育中的虚拟病人模拟:数字卫生教育合作的系统回顾和荟萃分析

J Med Internet Res 2019 07 2 21 7 e14676

10.2196/14676

31267981

v21i7e14676

PMC6632099

附近

在技术介导的问题解决任务中使用教学分析来告知评估实践

第三届学习分析与知识会议论文集 2013

腊克语“13

2013年4月8日至12日

比利时鲁汶