原始论文
摘要
背景:类似于了解血压计是如何测量血压的,医生们很快就必须了解基于人工智能的应用程序是如何得出患者患有高血压、糖尿病或癌症的结论的。尽管有越来越多的用例表明,人工智能正在或可以应用于改善医疗结果,但医生和学生准备在多大程度上利用这一范式尚不清楚。
摘要目的:本研究旨在了解医学生和医生对医学人工智能的熟悉程度,以及他们面临的挑战、障碍和与这种新范式民主化相关的潜在风险。
方法:从文献检索中系统设计了一份网络问卷,包括人口统计、概念和定义、培训和教育、实施和风险五个维度。共有207名参与者完成了这项研究,其中105名(50.7%)医生和102名(49.3%)医学生在各大洲接受过培训,其中大部分来自欧洲、中东、亚洲和北美。
结果:结果显示,医生和学生对人工智能的熟悉程度没有显著差异(P=.91),除了医学生认为医学中的人工智能会给患者和整个医学领域带来更高的风险(P<措施)。我们还发现对人工智能的熟悉程度相当低(医学生=2.11/5;医生=2.06/5),以及接受教育或培训的人数较少。在过去一年中,只有2.9%(3/105)的医生参加了人工智能课程,相比之下,9.8%(10/102)的医学生参加了人工智能课程。医学领域的复杂性被认为是最大的挑战之一(医生=3.5/5;医学生=3.8/5),而医生技能的降低是最重要的风险(医生=3.3;医学生= 3.6;P= 03)。
结论:问题不在于人工智能是否会应用于医学,而在于它何时会成为优化医疗保健的标准实践。在这项研究中发现,人们对人工智能的熟悉程度较低,因此需要在医学院和医院实施特定的教育和培训,以确保医疗专业人员能够利用这种新范式并改善健康结果。
doi: 10.2196/34973
关键字
介绍
背景
公共新闻和科学文章都普遍认为,人工智能最终将颠覆医学,以及未来医生和医疗专业人员的执业方式。
, ]。有一些有影响力的研究证明了人工智能在医学(AIM)中的潜力,例如,对x射线等图像进行分类[ ]。人工智能不仅被用于图像处理和分析,还被用于预后评估[ - ],治疗[ - ],以及病人监察[ , ]以及其他用途。此外,人工智能算法也已应用于许多消费健康产品,如可穿戴设备和移动设备[ ]。从医学的角度来看,这意味着基于人工智能的算法已经在为患者和医生提供建议,并代表他们做出决定。因此,医生了解这种方法是如何工作的以及软件供应商和医院确定医生需要什么来促进其实施是至关重要的。到目前为止,证据还不太令人放心。当被问到“你对人工智能有多熟悉?”“(在669名参与者的样本中)在首尔接受培训的医生和医生中,只有6%的人回答是肯定的[ ]。在最近的另一项研究中,法国医学专家报告称,人工智能是一个“模糊的概念”[ ]。为了评估收集到的关于医生(MDs)和医学生(MSs)对AIM的理解水平的经验证据的数量,我们进行了系统的文献研究。从Scopus收集的96篇文章中,我们只确定了9篇(9%)研究( ( , , - ),调查了医疗专业人员,其他的要么超出范围,要么是文献综述。从现有的实证研究中,我们发现了以下几点。首先,大多数研究调查了来自一所大学或一个国家的医学专业人员。其次,三分之一的研究集中在人工智能在放射学中的应用。第三,现有的研究没有一个旨在评估对AIM的理解水平。目标
由于该课题的重要性,在本研究中,我们打算通过调查来自世界各地的医学博士和硕士在当前文献中讨论最多的AIM课题来缩小这一差距。在文献检索的基础上,我们的问卷包括以下部分:(1)对AIM的熟悉程度,(2)与AIM相关的教育和培训,(3)在临床环境中实施人工智能相关的挑战和障碍,以及(4)与AIM相关的风险。
方法
数据通过基于网络的问卷收集,问卷是根据Burgess [
],以及Fowler的七步法[ ]。步骤1:明确你的研究目标
在现有文献的基础上,我们确定了有限的经验数据,包括医生和医生对AIM的理解水平、他们对AIM教育的参与程度、AIM实施相关的挑战和障碍,以及临床环境中AIM民主化相关的潜在风险。
步骤2:确定总体和样本
我们特别感兴趣的是比较随着技术发展而成长的MSs和有临床经验但可能较少接触技术的执业医生(例如,30-60岁)。考虑到学习和就业的地点与一个人获得的知识和专业知识有直接联系,我们将6大洲作为调查对象,以广泛代表人口。参与者是通过作者(TB、FAN和HR)的LinkedIn和Twitter资料源中的个人电子邮件和帖子招募的。使用这种技术是为了避免让来自同一所医学院或医院的参与者接受相同的教育或培训,从而在数据中产生偏差。为了检测潜在的偏见,我们使用毕业年份和大学名称来识别来自同一队列的参与者。当我们找到来自同一所学校和毕业年份的参与者时,我们随机选择了其中5人。基于本研究的目标,即调查两个独立人群(MDs和MSs)之间的差异,我们的数据样本不应小于176。这个数字是根据中等效应量(Cohend)为0.5,指现有的经验证据有限[
]。功率设置为0.95,分配比为1。步骤3 -决定如何收集回复
通过基于网络的问卷调查(微软表格)收集数据后,数据集中在大学的平台上。
4 .设计问卷
从我们对以前工作的回顾中,我们发现现有的问卷都不是按照系统的方法构建的。在大多数研究中,AIM因素的选择是基于研究动机。为了系统地涵盖最相关的AIM因素,我们按照PRISMA(系统评价和元分析首选报告项目)指南进行了系统的文献检索[
]。为此,我们使用关键字在Scopus数据库上执行标题和关键字搜索“人工智能”和医学或“机器学习”和医学还有“人工智能”和医疗保健或“机器学习”和医疗保健。我们没有进行抽象搜索,因为有大量不相关的文章。搜索结果是837篇论文。经2名独立研究人员进行一致性审查后,9.3%(78/837)的研究被保留用于我们的定性分析;在78项研究中,只有9项(12%)使用了问卷调查。共提取244个断面和405个亚断面。后者由两名独立的研究人员根据它们的相似性聚类。从11个组中,我们创建了4个不同的组:(1)概念和定义,(2)培训和教育,(3)实施,(4)风险。大多数问题采用李克特5分制,需要明确回答的问题采用下拉菜单。更具体地说,概念和定义因素中的问题显示了以下量表:(1)我从未听说过它,(2)我听说过它几次,(3)我理解它,(4)我有可能解释它,(5)我可以自信地解释它。 We defined the AIM’s level of familiarity by calculating the mean across the different factors (questions 1.1-1.10 of ).培训教育因素中的问题表现出以下量表:(1)非常不同意,(2)不同意,(3)一般,(4)同意,(5)非常同意。实施和风险因素中的问题与培训和教育因素中的问题表现出类似的量表,但增加了选项(0),我不知道。最后,每个年龄组的临床经验(仅MDs)如下:20 ~ 29岁=1,30 ~ 39岁=2,40 ~ 49岁=3,50 ~ 59岁=4,60 ~ 69岁=5。问卷可以通过 。因素 | 医学博士一个,平均值(SD) | 女士b,平均值(SD) | P价值 | |||||
1.熟悉AIMc | ||||||||
1.1 | 人工智能d | 3.1 (1.0) | 3.3 (1.0) | 。 | ||||
1.2 | 毫升e | 2.7 (1.1) | 2.8 (1.2) | .46 | ||||
1.3 | 监督毫升 | 2.0 (1.2) | 2.1 (1.2) | .77点 | ||||
1.4 | 无监督毫升 | 1.9 (1.1) | 2.0 (1.2) | .87点 | ||||
1.5 | 深度学习 | 2.2 (1.1) | 2.4 (1.2) | 只要 | ||||
1.6 | 神经网络 | 2.2 (1.1) | 2.5 (1.2) | .14点 | ||||
1.7 | 模糊逻辑 | 1.6 (0.9) | 1.5 (0.9) | 的相关性 | ||||
1.8 | 支持向量机 | 1.5 (0.9) | 1.4 (0.8) | .37点 | ||||
1.9 | 过拟合或欠拟合 | 1.6 (1.1) | 1.5 (1.0) | 点 | ||||
1.10 | 特征选择 | 1.7 (1.1) | 1.8 (1.1) | .64点 | ||||
2.教育及培训 | ||||||||
2.1 | 上次参加AIM课程 | 1.4 (1.0) | 1.98 (1.5) | .006f | ||||
2.2 | 更好地理解人工智能的主要概念 | 4.0 (1.0) | 4.3 (0.8) | 。08 | ||||
2.3 | 总体上探索人工智能提供的机会 | 4.1 (1.1) | 4.2 (0.9) | 36 | ||||
2.4 | 探索AIM和你所在领域提供的机会 | 4.1 (1.1) | 4.3 (0.8) | .14点 | ||||
2.5 | 了解更多现有的商业解决方案 | 3.8 (1.1) | 4.0 (0.9) | 23) | ||||
2.6 | 创建我自己的人工智能算法或应用程序 | 3.8 (1.1) | 3.7 (1.1) | .40 | ||||
3.AIM实施面临的挑战 | ||||||||
3.1 | 人工智能算法的结果难以追踪或理解(黑盒综合症) | 2.8 (1.7) | 2.9 (1.7) | 正 | ||||
3.2 | 医学领域的复杂性 | 3.5 (1.5) | 3.8 (1.3) | 点 | ||||
4.3 | 高质量数据样本的可用性 | 3.7 (1.4) | 3.3 (1.7) | 综合成绩 | ||||
3.4 | 人工智能的自主程度(人工智能应该做什么,不应该做什么) | 3.7 (1.4) | 3.7 (1.4) | .96点 | ||||
3.5 | 与人工智能实施相关的成本 | 3.4 (1.6) | 3.75 (1.4) | 16 | ||||
3.6 | 数据隐私或机密性 | 3.7 (1.5) | 3.7 (1.5) | .79 | ||||
4.AIM实施的障碍 | ||||||||
4.1 | 比较研究的可用性 | 3.7 (1.4) | 3.3 (1.7) | 13。 | ||||
4.2 | 安全使用人工智能 | 3.9 (1.3) | 4.0 (1.4) | 公布 | ||||
4.3 | 在人类和人工智能之间建立信任 | 3.7 (1.5) | 3.7 (1.5) | 多多 | ||||
4.4 | 法规和立法的可用性 | 3.7 (1.6) | 3.8 (1.6) | 综合成绩 | ||||
4.5 | 最高管理层的理解水平 | 3.8 (1.5) | 3.6 (1.6) | 。45 | ||||
5.与AIM实施相关的风险 | ||||||||
5.1 | 医疗保健的非人化 | 3.3 (1.2) | 3.5 (1.1) | 点 | ||||
5.2 | 医生技能的降低(例如,医生可能执行更少类型的任务) | 3.3 (1.2) | 3.6 (1.0) | 03f | ||||
5.3 | 人工智能最终会伤害患者 | 2.3 (0.9) | 2.8 (1.0) | <措施f | ||||
5.4 | 医生可能会变得多余 | 2.6 (1.1) | 3.0 (1.1) | .008f |
一个MD:医生。
b我是医科学生。
c目标:医学领域的人工智能。
dAI:人工智能。
eML:机器学习。
f显著差异。
5 .进行先导调查
问卷由来自6个不同地区(亚洲、大洋洲、北美、中东、欧洲和东欧)的15名ms和17名医生完成。内部信度的Cronbach α系数值达到0.85,高于公认的0.70阈值[
]。拆开包装后,概念与定义、培训与教育、实施、风险四个量化部分的内部信度系数分别达到:(1).91、(2).94、(3).81、(4).81。我们采用主成分分析来检验问卷的因素结构。Kaiser-Meyer-Olkin (KMO)因子充分性在四个因素(概念和定义、培训和教育、实施和风险)之间没有相关性。但是,我们确实发现了以下相关性:(1)KMO=0.72, (2) KMO=0.75, (3) KMO=0.58, (4) KMO=0.62。跟随Kaiser和Rice [ ],超过0.5的数值是可以接受的。步骤6主勘测
参与者使用LinkedIn和Twitter帖子中显示的链接打开问卷。登录页显示了同意书,内容包括研究的目的和性质、风险和收益、补偿和成本、机密性、参与(包括退出的权利)、联系方式和说明。只有在选择“我接受”后,参与者才被重新导向问卷。招募和问卷调查于2020年8月至12月开放。
7 .数据分析
我们使用描述性统计来描述和比较人口统计数据,以及在四个不同因素(概念和定义、培训和教育、实施和风险)中MDs和MSs的分布情况。然后,我们使用未配对的2尾检验了MDs和MSs之间的显著差异的描述性统计t试验(95%可信区间)。我们还建立了一个线性回归模型来探索AIM带来的风险相关因素(风险因素)。P<。05被认为有统计学意义。所介绍的方法是按照有关的指导方针和规定进行的。我们依赖于要求我们的调查工具的功能,以确保参与者没有遗漏任何问题。因此,没有观察到缺失的数据。
伦理批准
本研究由穆罕默德拉希德医学与健康科学大学的机构审查委员会根据MBRU-IRB-2020-024批准,并获得所有参与者的知情同意。分布式调查的cherry(互联网电子调查结果报告核对表)包括在
( ]。结果
人口统计资料
共收到207份完整问卷。207份问卷中,具有医学学位的执业医师105份(50.7%),硕士102份(49.3%)。男女之间的重新划分在某种程度上是均衡的,如图所示
。虽然大多数参与者来自中东(100/207,48.3%),但其中只有24.3%(51/207)在中东接受过培训或正在接受医学教育(机构名单可在 ).欧洲和亚洲紧随其后,24.8%(52/207)的受访者曾在欧洲接受或正在接受教育,15.8%(33/207)的受访者在亚洲接受教育,17.4%(36/207)的受访者在欧洲接受教育,18.8%(39/207)的受访者在亚洲接受教育。参与者的分布可以在 。完成问卷的平均时间为12分钟。人口统计资料 | 医学博士一个, n (%) | 女士b, n (%) | 总计,n (%) | |
参与者 | 105 (50.1) | 102 (49.9) | 207 (100.0) | |
性 | ||||
男人 | 62 (59.1) | 43 (40.9) | 105 (50.1) | |
女性 | 43 (42.1) | 59 (57.9) | 102 (49.9) | |
年龄(年) | ||||
< 20 | 0 (0) | 19日(18.6) | 19日(9.2) | |
为20 - 29 | 18 (17.1) | 82 (80.4) | 100 (48.3) | |
- 39 | 27日(25.7) | 1 (0.9) | 28日(13.3) | |
40至49 | 26日(24.8) | 0 (0) | 26日(12.6) | |
50-59 | 26日(24.8) | 0 (0) | 26日(12.6) | |
60 - 69 | 8 (7.6) | 0 (0) | 8 (3.9) | |
> 70 | 0 (0) | 0 (0) | 0 (0) | |
最高医学学位在哪里获得 | ||||
亚洲 | 14 (13.3) | 19日(18.6) | 33 (15.9) | |
非洲 | 4 (3.8) | 3 (2.9) | 7 (3.4) | |
中美洲 | 0 (0) | 0 (0) | 0 (0) | |
北美 | 11 (10.5) | 10 (9.8) | 21日(10.1) | |
南美 | 1 (0.9) | 0 (0) | 1 (0.5) | |
欧洲 | 29 (27.6) | 23日(22.6) | 52 (25.1) | |
东欧 | 0 (0) | 1 (0.9) | 1 (0.5) | |
中东 | 9 (8.6) | 42 (41.2) | 51 (24.6) | |
大洋洲 | 1 (0.9) | 2 (1.9) | 3 (1.4) | |
参与者在哪里 | ||||
亚洲 | 15 (14.3) | 24 (23.5) | 39 (18.8) | |
非洲 | 1 (0.9) | 4 (3.9) | 5 (2.4) | |
中美洲 | 2 (1.9) | 0 (0) | 2 (0.9) | |
北美 | 11 (10) | 9 (8) | 20 (9) | |
南美 | 0 (0) | 0 (0) | 0 (0) | |
欧洲 | 15 (14.1) | 21日(20.6) | 36 (17.4) | |
东欧 | 0 (0) | 1 (0.9) | 1 (0.5) | |
中东 | 59 (56.2) | 41 (40.2) | 100 (48.3) | |
大洋洲 | 2 (1.9) | 2 (1.9) | 4 (1.9) |
一个MD:医生。
b我是医科学生。
主要的结果
如
,人工智能(1.1)是大多数参与者理解的唯一概念,MSs的平均值为3.27 (SD 1), MDs的平均值为3.11 (SD 1)。其次是机器学习(1.2)、神经网络(1.6)和深度学习(1.5)。有监督机器学习和无监督机器学习(1.3和1.4)是医学中广泛使用的两个概念,得分不高。人工智能核心原理之一的过拟合和欠拟合概念(1.9)得分最低。除问题1.7、1.8和1.9外,MSs的理解水平高于MDs
。然而,在两个群体之间的统计比较显示,在人工智能概念上没有显著差异,如图所示 。我们问:“你上次参加AIM课程是什么时候?”(2.1),大部分医学博士和硕士从未参加过AIM课程,而今年(即2020年)或去年(
).统计显著性检验显示2个群体之间的差异,如 。![](https://asset.jmir.pub/assets/2d1fe5b8ebe947e99d286036f5b8dc8c.png)
![](https://asset.jmir.pub/assets/cf8d507bac27db8f5ff0c5bd39443de1.png)
对于博士和硕士来说,首要任务是进一步探索人工智能在各自领域和整体领域所提供的机会,并更好地理解人工智能的主要概念。尽管医学博士具有临床专业知识,因此对潜在机会有更好的了解,但与医学博士没有显著差异。然而,医学博士更渴望学习如何创建自己的人工智能算法或应用,这一事实可能证实了他们比医学博士看到了更多的临床潜力,如图所示
。从医学博士的角度来看,与数据隐私和机密性相关的挑战是最大的挑战,其次是高质量数据样本的可用性和人工智能的自主水平,如图所示
。从MS的角度来看,医学领域的复杂性是最大的挑战,这可以解释为他们有限的专业知识和临床经验。其次是与人工智能实施相关的成本,以及人工智能的自主水平以及与数据隐私和机密性相关的挑战。“黑盒综合症”引发的挑战受到的关注最少。在不同的挑战中,MDs和MSs之间没有统计学差异。除了与AIM实施相关的挑战之外,我们还在文献中确定了一些可以阻止AIM实施的障碍,如
。从MD和MS的角度来看,人工智能的安全使用是最重要的,其次是法规和立法的可用性,以及人与人工智能之间必须建立的信任。只有最高管理层的理解水平被MDs的评价高于ms。对于这些因素,我们也没有发现MDs和MSs之间有显著差异。在与临床环境中使用人工智能相关的风险中,MDs和MSs认为医生技能的潜在降低最高,如图所示
。MDs评分为3.29分,MSs评分为3.62分,统计学差异检验为显著阳性。第二高的得分是与医疗保健非人性化相关的风险,md为3.27分,ms为3.52分。MSs也比md更担心医生可能会变得多余,人工智能最终会伤害患者,并且两组之间都显示出统计差异(P=。008年和P<措施,respectively).问卷以以下问题结束:你能想象作为同事与人工智能算法一起工作吗?如图所示,大多数参与者回答“是”
。我们很想知道更多这一选择背后的潜在原因,因此要求参与者给出答案。
介绍收集到的反应的摘录。我们感兴趣的是调查对AIM的熟悉程度、临床经验和风险感知之间的关系。如
,对AIM的熟悉程度与医疗保健非人性化的风险、医生技能的降低以及医生可能成为冗余的风险之间存在显著的负相关关系。换句话说,md和MSs对AIM了解得越多,他们就越不认为这些因素是风险。对AIM的熟悉程度和最终伤害患者的风险之间没有显著差异。同样,临床经验与人工智能最终伤害患者以及医生变得多余的风险之间存在显著的负相关关系。在人工智能将使医疗保健非人化或降低医生技能的风险方面,没有发现显著差异。![](https://asset.jmir.pub/assets/215cfb45c9e5d36e6f73192e069f3b9a.png)
![](https://asset.jmir.pub/assets/342fe06f9c272935a171576e0f614d91.png)
![](https://asset.jmir.pub/assets/1454877df595f90a256ecc6759544c56.png)
![](https://asset.jmir.pub/assets/fbe4b305b5051cf49f95826a7d2f4598.png)
![](https://asset.jmir.pub/assets/d3c2236738b6e38034abd7429a470a6b.png)
为什么你能(不能)与人工智能作为同事一起工作?参加者的回答。
是的
- “这就是未来——更安全、有保障、更少的情感驱动、更可靠。”
- “简化工作,准确诊断,改善病人护理,减少工作量。”
- “这将是非常高效和有用的,因为信息将被即时处理和传递,出错的空间更小。”
- “因为人工智能将有助于减少人为错误,如险些漏诊或误诊。它看到的越多,就会学到越多,并会像我们医学院学生一样适应病人的表现。”
- “发展速度是指数级的,目前的状况相当令人印象深刻。”
没有
- “医生正在被削弱,最终会被中层医疗机构和人工智能所取代。”
- “因为尽管我们已经在处理在学术学习中有潜力成为人工智能算法的‘算法’。在实践中,我还没有遇到过很多采用这种线性思维方式的医生。对他们来说,直觉在临床判断中发挥着更大的作用。”
- “我认为,人工智能只应该被颐指气使,而不应该被视为一个可以独立思考的同事,因为人工智能本身不可能拥有道德或情感价值,而是来自一个管理或控制它的人类老板。”
- “人工智能可以用于假设生成,例如提出可能被遗漏的罕见诊断,但不能取代与知识渊博的同事的动态互动。”
- “我不认为在我有生之年,人工智能能够像我的同事那样交流。”
相关的因素 | 估计(SE;SD) | t测试(df) | P价值 | ||||
医疗保健的非人化 | |||||||
熟悉AIM | −0.28393 (0.09757;1.146) | −2.91 (205) | 04b | ||||
临床经验 | −0.08585 (0.0608;1.164) | −1.415 (205) | 16 | ||||
医生技能的下降 | |||||||
熟悉AIM | −0.27568 (0.09252;1.087) | −2.98 (205) | .003b | ||||
临床经验 | −0.10175 (0.05743;1.102) | −1.772 (205) | 。08 | ||||
人工智能最终会伤害患者 | |||||||
熟悉AIM | −0.0949 (0.08102;0.952) | −1.171 (205) | 。 | ||||
临床经验 | −0.12819 (0.04897;0.940) | −2.618 (205) | .009b | ||||
医生可能会变得多余 | |||||||
熟悉AIM | −0.21163 (0.09575;1.125) | −2.21 (205) | 陈霞b | ||||
临床经验 | −0.14515 (0.05846;1.122) | −2.483 (205) | . 01b |
一个目标:医学领域的人工智能。
b显著差异。
讨论
主要研究结果
本研究以网络问卷的方式,评估医学博士和硕士对AIM的了解程度。它的目的是补充有限的实证研究这一关键主题。当被问及人工智能的基本原理时,参与者提供了不一致的答案。如果大多数md和MSs将人工智能作为一个概念来理解,那么不清楚为什么他们只听说过几次过拟合和欠拟合,尽管这两个概念是理解人工智能算法的结果及其影响的关键[
]。同样,有监督和无监督算法的概念对于MDs或MSs都没有达到很高的熟悉程度,而深度学习和神经网络,这两种在监督环境中使用最多的算法类型,得到了更高的分数。令人欣慰的是,深度学习(1.5)和过拟合或欠拟合(1.9)之间以及神经网络(1.6)和过拟合或欠拟合之间都存在很强的正相关。这意味着那些对深度学习和自然网络有很好的理解的人,也对过拟合或欠拟合有很好的理解。当在聚合水平上进行分析时(问题1.1-1.10),我们的结果没有显示出MDs和MSs之间有任何显著差异,这是出乎意料的,因为年轻人群在谈到技术和创新时具有很高的好奇心。在全球范围内,这种对人工智能的低熟悉程度并不令人惊讶,因为博士或硕士参加过人工智能课程的人数很少(
).我们的分析还表明,参加过人工智能课程的参与者对人工智能的熟悉程度在统计上具有显著性(P<措施)。根据最近的一项研究,绝大多数教师认为人工智能应该成为医学培训的一部分[ ],尽管很少有医学院提供这样的课程[ ]。当涉及到与AIM实施相关的挑战时,我们没有预料到两组之间有统计学上的显著差异。我们期望临床经验和对临床组织的理解将在评估潜在挑战中发挥作用。这也可以解释为对人工智能的熟悉程度较低,这可能会限制md理解AIM可以在哪里带来新的机会。也没有预料到黑盒不会被认为是一个更大的挑战(MDs=2.82;海量存储系统(MSs)中= 2.92)。这种透明度的缺乏正是医学界所不希望看到的,也被许多学者和从业者认定为高风险[
- ]。这些结果也与md和MSs对在人工智能和人类之间建立信任的高度重视相矛盾,由于算法缺乏透明度,这是非常具有挑战性的。医学博士和医学硕士还对人工智能的安全使用以及现有的法规和立法表示担忧。一些努力正在进行,例如,作为医疗设备的基于人工智能/机器学习的软件修改的拟议监管框架。美国食品和药物管理局(fda)发布了这份文件的草案,征求专家的反馈意见[ ]。发现MSs确实比md更厌恶风险也是非常有趣的。他们担心人工智能可能会降低医生的技能,最终伤害病人,让医生变得多余。这些结果可以部分地用风险和多年经验之间的相关性来解释。如 在美国,花在诊所的时间越多,人工智能带来的感知风险就越低。在分析为什么医学博士和医学硕士愿意与人工智能作为同事合作时,似乎人工智能提供的改善患者护理和减少人为错误的机会是最普遍的。相反,那些表示自己无法使用人工智能算法的参与者并不一定不同意使用人工智能,而是赞成将人工智能视为同事,因为他们认为,技术既不能拥有与人类相同的情感,也不能拥有与人类相同的思维和互动方式。限制
我们的研究,特别是数据样本的一些局限性应该被考虑。首先,我们的招募技术限制了问卷调查的范围,参与者是作者网络的一部分。因此,世界上一些区域的代表人数不足。此外,它不允许我们系统地计算响应率。其次,虽然样本量在统计上足以满足我们的研究目标,但它不允许我们进一步调查不同变量之间的差异,如地区、年龄组、教育程度(例如,本科课程vs研究生课程)或医学专业。
与以往工作的比较
本研究与现有研究不同[
, , ]通过其方法和数据样本的多样性。通过基于文献搜索构建我们的问卷,我们确保了最常见的AIM主题包含在我们的问卷中。这种方法在基于未知标准选择AIM范围的类似研究中是独一无二的。因此,与现有的研究相比,我们的问卷也更加具体。例如,在他们的研究中,Oh等人[ 问,“你同意你对人工智能很熟悉吗?”(非常)同意,中立,(非常)不同意。”相反,我们用10个特定的子主题将同一个问题从机器学习解耦到深度学习。除了更薄的抽象层之外,它还允许我们在一些答案中识别出一些不一致的地方,一些参与者应该能够自信地解释机器学习,但他们从未听说过无监督算法,这是非常不可能的。此外,与现有的大多数工作不同,我们将定量数据与定性数据相结合,这使我们能够了解为什么。就我们的数据样本而言,它的特征也是独一无二的。更具体地说,我们的数据样本比现有研究的数据样本更加多样化,参与者在6大洲的128所不同大学学习过(或正在学习)。相反,在Santos等人的一项研究中[ ], 263个答案仅来自3所大学。参与者接受相同教育的可能性相当高,这给数据带来了潜在的偏差。基于这些原因,我们认为我们的数据样本和这项研究提供了人口的相关代表。实际意义
尽管越来越多的医疗应用程序嵌入了基于人工智能的算法或代理,但软件开发人员必须考虑到医生对人工智能的熟悉程度不高。例如,当一位放射科医生询问一位同事对病人x光片的看法时,不管他们来自哪里,他们都被认为都上过医学院,都是医生,都接受过特定的放射学培训。然而,当同事是人工智能算法时,情况就会发生巨大变化。为了让医生充分利用基于人工智能的应用程序,我们认为软件开发人员应该考虑以下因素:
- 提供关于如何构建基于人工智能的算法或软件的一般信息。一些主题将包括有关流程的信息,以及在培训和测试阶段使用的数据类型和数据量。它将使医生获得理解和信任。
- 根据对人工智能的熟悉程度,将不同的用户(医生)档案与动态水平的指导结合起来。熟悉程度较低的医生将需要更多关于软件处理数据的过程的信息。相比之下,一个熟悉这个话题的医生只需要置信度等关键信息。
- 描述导致每个结果或决定的路径以及信心水平。这将使医生了解推理和结果在多大程度上可以支持他或她的决定。
- 让医生做最后的决定,尽管软件从医学角度提供了这个决定的影响。然后,决策的文档将用于提高算法的准确性。
结论
基于目前利用人工智能进行的临床试验的数量[
],问题不在于人工智能是否会在临床环境中实施,而在于它何时会成为医疗优化的标准。在不久的将来,执业医生将需要具备适当的知识和技能,以确定基于人工智能的建议诊断或治疗是否合适。因此,医生很好地理解人工智能背后的关键概念是至关重要的。我们认为,改变首先应该来自医学院,他们应该将AIM整合到他们的课程中,既解释AIM的起源和基础,又将AIM研究整合到从病理学到外科、内科、急诊医学和精神病学等临床主题中。通过检查AIM的各个组成部分,我们的研究为现有的研究提供了信息,这些研究强调需要定义在本科医学教育中应该教授什么AIM内容[ ]。这反过来又要求大学教师对他们的教材进行培训,使其适应这种动态的范式。通过教育未来的医生,他们将成为未来职业变革的驱动力。与此同时,医院和诊所必须强调辅助医疗的重要性,通过持续医学教育或持续专业发展的方式,为医务人员提供强制性培训。为了规范和鼓励医学院和医院培训(未来的)医生,政府也可以通过提供明确的法规、指导方针和资源发挥关键作用。一些国家,如阿拉伯联合酋长国,已经实施了国家计划[
帮助各行各业整合和监管人工智能。因此,我们预见未来的研究将侧重于评估现有干预措施(如讲座、模块和培训计划)的结果,以支持医学院、医院和政府实施教育计划,使医疗专业人员具备相关的人工智能技能。致谢
作者非常感谢Ivan James Prithishkumar, Laila Zarnegar, Catherine Kellett和Stefan Du Plessis,他们帮助分发了问卷。
利益冲突
没有宣布。
现有的基于问卷调查的研究。
DOCX文件,26 KB
问卷调查。
DOCX文件,24kb
樱桃(因特网电子调查结果报告核对表)核对表。
DOCX文件,18kb
机构参与。
DOCX文件,33 KB参考文献
- 沃尔什·f·AI在诊断乳腺癌方面“优于”医生。BBC新闻,2020年。URL:https://www.bbc.com/news/health-50857759[2022-03-14]访问
- Laï MC, Brian M, Mamzer MF。医疗保健中人工智能的认知:来自法国参与者的定性调查研究结果。J Transl Med 2020年1月09日;18(1):14 [免费全文] [CrossRef] [Medline]
- 杨波,朱凯,杨波,段涛,等。Chexnet:利用深度学习在胸部x光片上检测放射科医生级别的肺炎。arXiv 2017 [免费全文]
- alghani M, Al-Jumeily D, Aljaaf A, Khalaf M, Mustafina J, Tan S.人工智能技术在医疗保健中的应用:系统综述。2019年应用计算支持产业:创新与技术国际会议论文集发表于:应用计算支持产业:创新与技术国际会议论文集;2019年9月15日至16日;伊拉克拉马迪,第249-261页。(CrossRef]
- 李志强,李志强。机器学习在医学中的应用。中华医学杂志2019年4月04日;38(14):1347-1358。(CrossRef]
- 李志强,李志强,李志强。人工智能在医学中的应用。Ann R Coll外科英语2004九月01;86(5):334-338 [免费全文] [CrossRef] [Medline]
- 李D, Kulasegaram K, Hodges BD.为什么我们不必害怕机器:机器学习世界中的医学机遇。中国医学杂志2019;44(5):623-625。(CrossRef]
- 项勇,赵磊,刘震,吴旭,陈杰,龙娥,等。人工智能在医学中的实施:现状分析与发展建议。Artif Intell Med 2020年1月;102:101780。(CrossRef] [Medline]
- Yeasmin S.人工智能在医学中的好处。见:第二届计算机应用与信息安全国际会议论文集(ICCAIS)。2019年出席:第二届计算机应用与信息安全国际会议(ICCAIS);2019年5月1日至3日;沙特阿拉伯利雅得,p. 2-6。(CrossRef]
- 李志强,李志强。人工智能在医学中的应用。代谢2017年4月;6s:36-40。(CrossRef] [Medline]
- Komorowski M, Celi LA。人工智能是否会导致医疗领域的过度使用?重症监护医学2017;45(5):912-913。(CrossRef]
- Turakhia MP, Desai M, Hedlin H, Rajmane A, Talati N, Ferris T,等。一项基于应用程序的大规模研究的原理和设计,使用智能手表识别心律失常:苹果心脏研究。Am Heart J 2019 1月;207:66-75 [免费全文] [CrossRef] [Medline]
- 吴珊珊,金志辉,崔文文,李海杰,洪杰,权绍华。医生对人工智能的信心:基于移动网络的调查。J Med Internet Res 2019 3月25日;21(3):e12422 [免费全文] [CrossRef] [Medline]
- 比斯达斯,托普利亚努C, Zakrzewska Z, Irimia A, Shakallis L, Subhash J,等。医学中的人工智能:关于医学和牙科学生认知的多国多中心调查。前线公共卫生2021;9:795284 [免费全文] [CrossRef] [Medline]
- Galán GC, Portero FS。医学生对人工智能在放射学中的影响的看法。放射学(英文版)2021年4月29日。(CrossRef] [Medline]
- Castagno S, Khalifa M.医疗保健人员对人工智能的认知:定性调查研究。Front Artif Intell 2020;3:578983 [免费全文] [CrossRef] [Medline]
- 李文杰,李志强,李志强,等。医学生对人工智能的态度:多中心调查2019年4月29日(4):1640-1646。(CrossRef] [Medline]
- Kasetti P, Botchu R.人工智能在放射学中的影响:由医科学生感知。中国电子学报,2020;10(4):179-185。(CrossRef]
- 朴佳杰,李永平,李永平。医学生对人工智能对医学实践影响的看法。中国中医药大学学报(自然科学版);(CrossRef] [Medline]
- 对调查研究中问卷设计的一般介绍。信息系统服务,利兹大学,利兹,2001。URL:http://users.sussex.ac.uk/~grahamh/RM1web/Burgess_2001_Survey_design.pdf[2022-03-14]访问
- 小福勒。调查研究方法。加州千橡市:Sage Publications;2013.
- 行为科学的统计权力分析。第二版。纽约:劳特利奇;1988.
- 李利提,陈志强,陈志强,陈志强,等。PRISMA用于报告评估卫生保健干预研究的系统回顾和元分析的声明:解释和阐述。PLoS Med 2009 7月21日;6(7):e1000100 [免费全文] [CrossRef] [Medline]
- 心理学测量导论。纽约:McGraw-Hill;1978.
- 李志刚,李志刚。教育与心理测评,2007(1):1 - 7。(CrossRef]
- 提高网络调查的质量:互联网电子调查结果报告清单(樱桃)。J medical Internet Res 2004 9月29日;6(3):e34 [免费全文] [CrossRef] [Medline]
- 杨玉军,邦晨晨。人工智能在胃肠病学中的应用。World J Gastroenterol 2019 april 14;25(14):1666-1683 [免费全文] [CrossRef] [Medline]
- 帕拉贾佩K, Schinkel M, Panday R, Car J, Nanayakkara P.人工智能训练在医学教育中的应用。JMIR Med Educ 2019 Dec 03;5(2):e16048 [免费全文] [CrossRef] [Medline]
- 医学中的人工智能:对其出现和早期功能的个人回顾。见:ACM医学信息学历史会议论文集。1987年出席:美国计算机学会医学信息学历史会议;1987年11月5日至6日;美国马里兰州贝塞斯达第199页。(CrossRef]
- Reddy S, Fox J, Purohit议员。人工智能支持的医疗保健服务。J R Soc Med 2019 Jan 03;112(1):22-28 [免费全文] [CrossRef] [Medline]
- Shortliffe呃。医学中的人工智能:衡量成就、炒作和承诺。2019年8月25日;28(1):257-262 [免费全文] [CrossRef] [Medline]
- 赛迪-吉本斯JA,赛迪-吉本斯CJ。医学中的机器学习:实用介绍。BMC Med Res methodo2019 Mar 19;19(1):64 [免费全文] [CrossRef] [Medline]
- Sun TQ, Medaglia R.绘制公共部门人工智能的挑战:来自公共医疗保健的证据。治理Inform Q 2019年4月;36(2):368-383。(CrossRef]
- Diamond M.提议的将基于人工智能/机器学习的软件修改为医疗设备(SAMD)的监管框架。美国食品和药物管理局,2020年。URL:https://www.fda.gov/media/135713/download[2022-03-14]访问
- 范伟,刘杰,朱山,帕达罗斯PM。探讨医疗人员采用人工智能医疗诊断支持系统(AIMDSS)的影响因素。安操作决议2018年3月19日;294(1-2):567-592。(CrossRef]
- Benjamens S, Dhunnoo P, Meskó B.基于人工智能的fda批准的医疗设备和算法的现状:一个在线数据库。NPJ数字医学2020年9月11日;3(1):118 [免费全文] [CrossRef] [Medline]
- 李娟,吴安,李东,李志强。人工智能在医学本科教育中的应用。学院医学2021年11月01日;96(11S):62-70。(CrossRef] [Medline]
- 国家人工智能计划:为阿联酋的下一波(编码)人才赋能。阿联酋人工智能办公室。2021.URL:https://ai.gov.ae/[2021-11-15]访问
缩写
目的:医学领域的人工智能 |
KMO:Kaiser-Meyer-Olkin |
MD:医学博士 |
女士:医科学生 |
N Zary编辑;提交15.11.21;同行评审:K Wac, N Thalange, MF Alwashmi;对作者17.01.22的评论;修订版本收到14.02.22;接受17.02.22;发表12.04.22
版权©Thomas Boillat, Faisal A Nawaz, Homero Rivas。最初发表于JMIR医学教育(https://mededu.www.mybigtv.com), 12.04.2022。
这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用最初发表在JMIR医学教育上的原创作品。必须包括完整的书目信息,https://mededu.www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。