原始论文gydF4y2Ba
摘要gydF4y2Ba
背景:gydF4y2Ba度量弱点的常用方法是用弱点指数(FI)表示缺陷的累积。fi可以很容易地适应许多数据库,因为使用的参数没有规定,而是反映提取的特征(变量)的子集。不幸的是,许多数据库的结构不允许直接提取一个合适的子集,需要额外的努力来确定和验证每个记录的特征值,从而显著增加成本。gydF4y2Ba
摘要目的:gydF4y2Ba我们的目标是描述一种称为部分遗传算法的人工智能(AI)优化技术如何被用于细化用于计算FI的特征子集,并偏爱具有最小获取成本的特征。gydF4y2Ba
方法:gydF4y2Ba这是对从澳大利亚昆士兰的10家机构汇编的一个住宅护理数据库的二次分析。该数据库包括常规收集的管理数据和592名75岁及以上居民的非结构化病历。初步研究从36个合适的特征中计算出电子脆弱指数(eFI)。然后,我们对遗传算法进行结构修正,从2组特征中找到计算出的eFI(0.21阈值)的最佳预测因子。部分遗传算法用于优化4种基础分类模型:逻辑回归、决策树、随机森林和支持向量机。gydF4y2Ba
结果:gydF4y2Ba在基础模型中,逻辑回归被发现在几乎所有场景和特征集大小下产生最好的模型。最好的模型是使用所有的低成本特征和只有10个高成本特征构建的,它们表现得足够好(灵敏度89%,特异性87%),可以考虑进行低成本的虚弱筛选测试。gydF4y2Ba
结论:gydF4y2Ba在本研究中,在一个老年护理数据库上演示了一种系统的方法,该方法可以选择一组最优的特征,具有较低的获取成本和性能,可与检测脆弱的eFI相媲美。部分遗传算法已经证明在系统识别弱点的成本和准确性之间提供权衡是有用的。gydF4y2Ba
doi: 10.2196/38464gydF4y2Ba
关键字gydF4y2Ba
简介gydF4y2Ba
遗传算法是一种受自然界进化机制启发而产生的通用计算优化方法。它们是最受欢迎的元启发式搜索算法之一,已被用于各种应用,包括合成数据生成、特征选择和求解复杂方程[gydF4y2Ba
].在这项研究中,遗传算法被应用于识别在成本和准确性之间提供适当权衡的特征。gydF4y2Ba在全球人口老龄化的背景下,生命中很大一部分时间将处于虚弱状态的老年人数量正在迅速增加[gydF4y2Ba
].由于与该综合征相关的风险增加,包括健康状况不佳,虚弱对老年人和他们所生活的社会都是一个问题[gydF4y2Ba ]及额外使用健康及长者护理服务[gydF4y2Ba -gydF4y2Ba ],导致医疗费用虚高[gydF4y2Ba -gydF4y2Ba ].然而,最新的研究表明,虚弱是一个高度动态的过程。gydF4y2Ba ,gydF4y2Ba 以及在适当干预下可能改变的状态[gydF4y2Ba ,gydF4y2Ba ].建议对早期发现进行筛查,以增加减轻虚弱最严重影响的可能性[gydF4y2Ba ,gydF4y2Ba ,gydF4y2Ba ].gydF4y2Ba有两种主要的方法来识别虚弱:虚弱表型(FP)和虚弱指数(FI) [gydF4y2Ba
].然而,这些已建立的方法有已知的缺点,需要大量的时间投资、面对面的互动和收集特定的数据项[gydF4y2Ba ].最近,电子脆弱性指数(eFI)被提出[gydF4y2Ba ],当应用于行政数据集时,该模型有可能比面对面模型获得更高的效率,但需要确保符合预先指定标准的项目的最小集合,这仍然是实现的障碍。例如,先前的研究表明,尽管可以基于老年护理管理数据集计算和构建eFI,但有相当大比例的项目需要人工计算以确保准确性和提高质量[gydF4y2Ba ].显然,最好是确定能够提供相当精度和质量但效率更高的自动化技术。因此,本研究旨在应用复杂的遗传算法技术来确定计算eFI的最佳预测因子。gydF4y2Ba方法gydF4y2Ba
研究设计、参与者和环境gydF4y2Ba
本回顾性研究利用了以前编译的数据集[gydF4y2Ba
]从澳大利亚昆士兰州10家安老院舍的行政数据库中提取。如果参与者年龄在75岁或以上,并在过去3年内完成了老年护理资助工具(ACFI)评估,则纳入研究。gydF4y2Ba道德的考虑gydF4y2Ba
澳大利亚托伦斯大学人类研究伦理委员会(申请H11/19)放弃了对初步研究的同意,由于研究的实用性,该委员会根据国家声明5.1.22(二次使用识别的行政数据)宣布该研究豁免。因为这是对相同数据的二次研究,所以批准延伸到本研究。此外,本研究遵循澳大利亚国家人类研究伦理行为声明。gydF4y2Ba
脆弱的结果测量gydF4y2Ba
该数据之前计算过eFI [gydF4y2Ba
]基于克莱格等人最初指定的公式[gydF4y2Ba ].谨慎地确保纳入的赤字符合Searle及其同事建议的标准[gydF4y2Ba ],结果35个缺陷中有32个是从非结构化病历中提取的,只有3个是从ACFI数据中提取的。二元脆弱性分类使用0.21阈值(即脆弱性定义为>0.21)得到[gydF4y2Ba ].gydF4y2Ba筛选试验施工gydF4y2Ba
遗传算法是一种优化技术[gydF4y2Ba
]应用于机器学习中,用来过滤一组用于构建分类模型的特征。在训练过程中,在训练集中调优分类算法,然后通过测量测试集中的分类误差来验证获得广义预测算法的成功。gydF4y2Ba遗传算法利用观察到的结果,即当分类模型在可用特征的子集上进行训练时,它们往往表现得更好。然而,使用哪个功能子集并不明显。遗传算法从随机生成的特征子集(染色体)开始,这些特征子集都被独立地用于生成分类模型。来自产生最佳模型的种群的染色体被允许结合,或繁殖,形成新一代的种群,而表现最差的那些被完全删除。该过程将继续进行,直到训练了预定义数量的代或模型的性能达到稳定状态。训练完成后,只使用可用特性中自然选择的子集部署性能最好的模型。gydF4y2Ba
虽然遗传算法擅长于选择特征的最优子集,但它们选择特征的基础是最大化生成模型的分类精度。获取各种功能的成本并没有被考虑到功能的选择中,即使较便宜的功能的性能与较昂贵的功能的性能接近。在这项研究中,一个特性的成本是努力、金钱成本和捕获价值所涉及的耐心风险的组合。我们希望尽量减少选择来组成模型的昂贵特性的数量,但允许尽可能多的低成本特性被使用,以获得模型可接受的性能。gydF4y2Ba
为实现在分类模型中包含低成本特征,标准遗传算法训练配置如gydF4y2Ba
修改如gydF4y2Ba .gydF4y2Ba这种修改是在每次训练一个模型的每个成员的种群由遗传算法试验。当遗传算法训练一个模型时,它将可用训练记录的子集传递给分类模型的训练算法。在开始训练之前,需要将每个记录的低成本特征值添加到所选的训练记录中。遗传算法使用训练记录的不同子集多次训练每个染色体的分类模型,并使用训练该实例时未使用的记录来确定每个模型的性能。与训练记录一样,需要将低成本的特性添加到用于确定模型性能的记录中。染色体的性能是由训练记录的不同子集构建的所有模型的平均性能计算出来的。这个过程被称为n倍交叉验证,其中n是建立的模型的数量。在这项研究中,使用了3倍交叉验证,因为它确保了性能和构建模型所需时间之间的良好平衡。gydF4y2Ba
采用部分遗传算法优化了四种类型的分类模型:逻辑回归、支持向量机、随机森林和决策树。这些算法是分类的流行选择,因为它们已被证明在为广泛的应用生成广义模型方面是成功的[gydF4y2Ba
].逻辑回归是一种统计建模技术,在训练过程中发现输入特征的线性组合,它对二进制结果处于真实状态的概率的对数进行建模。支持向量机(SVM)的目标是学习一个多维超平面,它分离给它训练的记录集。预测是通过将候选记录放在同一个多维分类空间中并确定它映射到超平面的哪一侧来实现的。支持向量机是在20世纪90年代开发的,自那以后在许多实际应用中都取得了成功,包括模式识别[gydF4y2Ba ,文本分类[gydF4y2Ba ),和生物信息学。决策树采用分而治之的策略。树是由节点组成的,如果变量是连续的,每个节点执行单个输入特征和阈值的比较,如果特征是离散的,则执行状态的比较。比较的结果决定了下一个节点的选择,该节点要么执行新的比较,要么用给定的分类终止树。在训练过程中,使用训练记录集在每个节点上寻找比较,通过最大程度地减少结果中的熵来获得最多的信息。后续的训练预测是通过将记录输入根节点并确定记录退出树的终止节点的分类来实现的。随机森林是决策树的一种元形式,它的输出是由许多树之间的投票决定的。这些树是用不同的方法构建的,以确保它们不是彼此的复制品。gydF4y2Ba软件是用Python编写的,模型是使用sklearn模块(版本1.0.2)和来自sklearn-genetic(版本0.5.1)的genetic_selection模块构建的。gydF4y2Ba
结果gydF4y2Ba
模型生成gydF4y2Ba
在考虑的69个特征中,34个直接从ACFI评估中提取,35个是用于计算eFI的值。ACFI的两个特征,精神老年评估量表(PAS)评分和康奈尔量表,被排除在外,因为它们有很高的缺失率(PAS评分36%,康奈尔量表42%)。其余32个ACFI评估特征没有缺失值,被归类为低成本采收特征。在用于计算eFI的35个特征中,32个是通过在非结构化病历中自动搜索关键词提取的,然后由临床医生进行人工检查和验证。这些被归类为拥有较高的获取成本。其余3个用于计算eFI的特征是ACFI特征的直接组合。由于这些功能的计算可以完全自动化,所以它们包含在低成本功能中。共考虑了4组低成本特征:(1)ACFI特征+低成本eFI特征;(2)低成本eFI特征;(3)无低成本特性; and (4) a set of features chosen from the low-cost features using genetic algorithms. A different set was found for each of the classification algorithms.
我们测试了16个场景,分别包含上述4组针对4种分类算法的低成本特性。针对每种场景,采用部分遗传算法对高成本特征的数量设置不同的限制,对分类算法进行优化。限制从1到32依次变化,这是候选高成本特性的数量。为每个场景生成的32种算法中的每一种的性能都绘制在一张图上。每个场景的图表都在gydF4y2Ba
-gydF4y2Ba .gydF4y2Ba当比较每种分类模型的图时,逻辑回归在每个场景中都优于决策树,而支持向量机和随机森林在几乎所有场景中都优于决策树。gydF4y2Ba
-gydF4y2Ba 演示在使用5、10和15个高成本获取特性时16个场景的数字比较。gydF4y2Ba提供了“无低成本”特征的选项,以确定低成本特征为分类增加了多少预测价值。不出所料,这个选项在所有分类算法中表现最差,证实了低成本的功能正在增加价值。接下来,只使用3种低成本eFI特性作为固定特性来构建模型。当几乎所有的eFI特征都被包括在内时,逻辑回归算法的准确率提高到97% (gydF4y2Ba
).尽管这是一个很好的结果,但是使用这么多高成本特性构建的模型并不是这项研究的目标。gydF4y2Ba遗传算法的工作原理是从所有可用的特征中选择一个最优子集。这个特性是分两个阶段构建模型版本的动机。在第一阶段,对低成本特征使用标准的、非偏微分的遗传算法寻找最优组合。这些模型的表现非常糟糕(gydF4y2Ba
),如果没有进一步改进,它们就不能使用。用于生成这些模型的特征组合(gydF4y2Ba -gydF4y2Ba )作为第二阶段部分遗传算法的固定特征。第二阶段的模型表现得出奇地差,与没有任何低成本特征的模型没有区别,无论使用的分类模型是什么。gydF4y2Ba在局部遗传算法中使用所有的低成本特征产生了最佳的整体结果,与使用低成本eFI特征的模型在能够选择大部分高成本eFI特征时所获得的97%的准确率相匹配。然而,在10个特征上,额外的低成本特征使算法的灵敏度从82.7%提高到89.3%,特异性从81.7%提高到86.7%。gydF4y2Ba
特性gydF4y2Ba | 灵敏度gydF4y2Ba | 特异性gydF4y2Ba | PPAgydF4y2Ba一个gydF4y2Ba | NPAgydF4y2BabgydF4y2Ba | 精度gydF4y2Ba | F1gydF4y2BacgydF4y2Ba | |
ACFIgydF4y2BadgydF4y2Ba+低成本eFIgydF4y2BaegydF4y2Ba | |||||||
逻辑回归gydF4y2Ba | 76gydF4y2Ba | 75gydF4y2Ba | 71.4gydF4y2Ba | 79.2gydF4y2Ba | 75.6gydF4y2Ba | 73.2gydF4y2Ba | |
支持向量机gydF4y2Ba | 76gydF4y2Ba | 61.7gydF4y2Ba | 67.3gydF4y2Ba | 71.3gydF4y2Ba | 69.6gydF4y2Ba | 64.3gydF4y2Ba | |
决策树gydF4y2Ba | 73.3gydF4y2Ba | 63.3gydF4y2Ba | 65.5gydF4y2Ba | 71.4gydF4y2Ba | 68.8gydF4y2Ba | 64.4gydF4y2Ba | |
随机森林gydF4y2Ba | 80gydF4y2Ba | 71.7gydF4y2Ba | 74.1gydF4y2Ba | 77.9gydF4y2Ba | 76.3gydF4y2Ba | 72.9gydF4y2Ba | |
低成本eFIgydF4y2Ba | |||||||
逻辑回归gydF4y2Ba | 80gydF4y2Ba | 81.7gydF4y2Ba | 76.6gydF4y2Ba | 84.5gydF4y2Ba | 80.7gydF4y2Ba | 79gydF4y2Ba | |
支持向量机gydF4y2Ba | 74.7gydF4y2Ba | 66.7gydF4y2Ba | 67.8gydF4y2Ba | 73.7gydF4y2Ba | 71.1gydF4y2Ba | 67.2gydF4y2Ba | |
决策树gydF4y2Ba | 76gydF4y2Ba | 53.3gydF4y2Ba | 64.0gydF4y2Ba | 67.1gydF4y2Ba | 65.9gydF4y2Ba | 58.2gydF4y2Ba | |
随机森林gydF4y2Ba | 72gydF4y2Ba | 70gydF4y2Ba | 66.7gydF4y2Ba | 75gydF4y2Ba | 71.1gydF4y2Ba | 68.3gydF4y2Ba | |
任何低成本的特性gydF4y2Ba | |||||||
逻辑回归gydF4y2Ba | 78.7gydF4y2Ba | 66.7gydF4y2Ba | 71.4gydF4y2Ba | 74.7gydF4y2Ba | 73.3gydF4y2Ba | 69gydF4y2Ba | |
支持向量机gydF4y2Ba | 82.6gydF4y2Ba | 55gydF4y2Ba | 71.2gydF4y2Ba | 69.7gydF4y2Ba | 70.4gydF4y2Ba | 62.2gydF4y2Ba | |
决策树gydF4y2Ba | 84gydF4y2Ba | 55gydF4y2Ba | 73.3gydF4y2Ba | 70gydF4y2Ba | 71.1gydF4y2Ba | 62.9gydF4y2Ba | |
随机森林gydF4y2Ba | 76gydF4y2Ba | 65gydF4y2Ba | 68.4gydF4y2Ba | 73.1gydF4y2Ba | 71.1gydF4y2Ba | 66.7gydF4y2Ba | |
基因选择的低成本功能gydF4y2Ba | |||||||
逻辑回归gydF4y2Ba | 80gydF4y2Ba | 66.7gydF4y2Ba | 72.7gydF4y2Ba | 75gydF4y2Ba | 74.1gydF4y2Ba | 69.6gydF4y2Ba | |
支持向量机gydF4y2Ba | 82.7gydF4y2Ba | 58.3gydF4y2Ba | 72.9gydF4y2Ba | 71.3gydF4y2Ba | 71.9gydF4y2Ba | 64.8gydF4y2Ba | |
决策树gydF4y2Ba | 76gydF4y2Ba | 68.3gydF4y2Ba | 69.5gydF4y2Ba | 75gydF4y2Ba | 77.2gydF4y2Ba | 68.9gydF4y2Ba | |
随机森林gydF4y2Ba | 81.3gydF4y2Ba | 75gydF4y2Ba | 76.3gydF4y2Ba | 80.3gydF4y2Ba | 78.5gydF4y2Ba | 75.6gydF4y2Ba |
一个gydF4y2BaPPA:正百分比协议。gydF4y2Ba
bgydF4y2BaNPA:负百分比同意。gydF4y2Ba
cgydF4y2Ba外国游客1:f值。gydF4y2Ba
dgydF4y2BaACFI:老年护理资助工具。gydF4y2Ba
egydF4y2BaeFI:电子脆弱性指数。gydF4y2Ba
特性gydF4y2Ba | 灵敏度gydF4y2Ba | 特异性gydF4y2Ba | PPAgydF4y2Ba一个gydF4y2Ba | NPAgydF4y2BabgydF4y2Ba | 精度gydF4y2Ba | F1gydF4y2BacgydF4y2Ba | |||||||
ACFIgydF4y2BadgydF4y2Ba+低成本eFIgydF4y2BaegydF4y2Ba | |||||||||||||
逻辑回归gydF4y2Ba | 89.3gydF4y2Ba | 86.7gydF4y2Ba | 86.7gydF4y2Ba | 89.3gydF4y2Ba | 88.1gydF4y2Ba | 86.7gydF4y2Ba | |||||||
支持向量机gydF4y2Ba | 85.3gydF4y2Ba | 80.0gydF4y2Ba | 81.4gydF4y2Ba | 84.2gydF4y2Ba | 83gydF4y2Ba | 80.7gydF4y2Ba | |||||||
决策树gydF4y2Ba | 65.3gydF4y2Ba | 61.7gydF4y2Ba | 58.7gydF4y2Ba | 68.1gydF4y2Ba | 63.7gydF4y2Ba | 60.2gydF4y2Ba | |||||||
随机森林gydF4y2Ba | 80gydF4y2Ba | 70gydF4y2Ba | 73.9gydF4y2Ba | 76.9gydF4y2Ba | 75.6gydF4y2Ba | 71.8gydF4y2Ba | |||||||
低成本eFIgydF4y2Ba | |||||||||||||
逻辑回归gydF4y2Ba | 82.7gydF4y2Ba | 81.7gydF4y2Ba | 79gydF4y2Ba | 84.9gydF4y2Ba | 82.2gydF4y2Ba | 80.3gydF4y2Ba | |||||||
支持向量机gydF4y2Ba | 81.3gydF4y2Ba | 81.7gydF4y2Ba | 77.8gydF4y2Ba | 84.7gydF4y2Ba | 81.5gydF4y2Ba | 79.7gydF4y2Ba | |||||||
决策树gydF4y2Ba | 81.3gydF4y2Ba | 50gydF4y2Ba | 68.2gydF4y2Ba | 67gydF4y2Ba | 67.4gydF4y2Ba | 57.7gydF4y2Ba | |||||||
随机森林gydF4y2Ba | 84gydF4y2Ba | 63.3gydF4y2Ba | 76gydF4y2Ba | 74.1gydF4y2Ba | 74.8gydF4y2Ba | 69.1gydF4y2Ba | |||||||
任何低成本的特性gydF4y2Ba | |||||||||||||
逻辑回归gydF4y2Ba | 72gydF4y2Ba | 86.7gydF4y2Ba | 71.2gydF4y2Ba | 87.1gydF4y2Ba | 78.5gydF4y2Ba | 78.2gydF4y2Ba | |||||||
支持向量机gydF4y2Ba | 77.3gydF4y2Ba | 78.3gydF4y2Ba | 73.4gydF4y2Ba | 81.7gydF4y2Ba | 77.8gydF4y2Ba | 75.8gydF4y2Ba | |||||||
决策树gydF4y2Ba | 81.3gydF4y2Ba | 70gydF4y2Ba | 75gydF4y2Ba | 77.2gydF4y2Ba | 76.3gydF4y2Ba | 72.4gydF4y2Ba | |||||||
随机森林gydF4y2Ba | 80gydF4y2Ba | 66.7gydF4y2Ba | 72.7gydF4y2Ba | 75gydF4y2Ba | 74.1gydF4y2Ba | 69.6gydF4y2Ba | |||||||
基因选择的低成本功能gydF4y2Ba | |||||||||||||
逻辑回归gydF4y2Ba | 82.6gydF4y2Ba | 80gydF4y2Ba | 78.6gydF4y2Ba | 83.8gydF4y2Ba | 81.5gydF4y2Ba | 79.3gydF4y2Ba | |||||||
支持向量机gydF4y2Ba | 78.7gydF4y2Ba | 78.3gydF4y2Ba | 74.6gydF4y2Ba | 81.9gydF4y2Ba | 78.5gydF4y2Ba | 76.4gydF4y2Ba | |||||||
决策树gydF4y2Ba | 77.3gydF4y2Ba | 60gydF4y2Ba | 67.9gydF4y2Ba | 70.7gydF4y2Ba | 69.6gydF4y2Ba | 63.7gydF4y2Ba | |||||||
随机森林gydF4y2Ba | 78.7gydF4y2Ba | 66.7gydF4y2Ba | 71.4gydF4y2Ba | 74.7gydF4y2Ba | 73.3gydF4y2Ba | 69gydF4y2Ba |
一个gydF4y2BaPPA:正百分比协议。gydF4y2Ba
bgydF4y2BaNPA:负百分比同意。gydF4y2Ba
cgydF4y2Ba外国游客1:f值。gydF4y2Ba
dgydF4y2BaACFI:老年护理资助工具。gydF4y2Ba
egydF4y2BaeFI:电子脆弱性指数。gydF4y2Ba
特性gydF4y2Ba | 灵敏度gydF4y2Ba | 特异性gydF4y2Ba | PPAgydF4y2Ba一个gydF4y2Ba | NPAgydF4y2BabgydF4y2Ba | 精度gydF4y2Ba | F1gydF4y2BacgydF4y2Ba | |||||||
ACFIgydF4y2BadgydF4y2Ba+低成本eFIgydF4y2BaegydF4y2Ba | |||||||||||||
逻辑回归gydF4y2Ba | 85.3gydF4y2Ba | 85.0gydF4y2Ba | 82.3gydF4y2Ba | 87.7gydF4y2Ba | 85.2gydF4y2Ba | 83.6gydF4y2Ba | |||||||
支持向量机gydF4y2Ba | 84.0gydF4y2Ba | 86.7gydF4y2Ba | 81.3gydF4y2Ba | 88.7gydF4y2Ba | 85.1gydF4y2Ba | 83.9gydF4y2Ba | |||||||
决策树gydF4y2Ba | 69.3gydF4y2Ba | 61.7gydF4y2Ba | 61.7gydF4y2Ba | 69.3gydF4y2Ba | 65.9gydF4y2Ba | 61.7gydF4y2Ba | |||||||
随机森林gydF4y2Ba | 84.0gydF4y2Ba | 66.7gydF4y2Ba | 76.9gydF4y2Ba | 75.9gydF4y2Ba | 76.3gydF4y2Ba | 71.4gydF4y2Ba | |||||||
低成本eFIgydF4y2Ba | |||||||||||||
逻辑回归gydF4y2Ba | 85.3gydF4y2Ba | 81.7gydF4y2Ba | 81.7gydF4y2Ba | 85.3gydF4y2Ba | 83.7gydF4y2Ba | 81.7gydF4y2Ba | |||||||
支持向量机gydF4y2Ba | 86.7gydF4y2Ba | 81.7gydF4y2Ba | 83.1gydF4y2Ba | 85.5gydF4y2Ba | 84.4gydF4y2Ba | 82.4gydF4y2Ba | |||||||
决策树gydF4y2Ba | 76.0gydF4y2Ba | 58.3gydF4y2Ba | 66.0gydF4y2Ba | 69.5gydF4y2Ba | 68.1gydF4y2Ba | 61.9gydF4y2Ba | |||||||
随机森林gydF4y2Ba | 86.7gydF4y2Ba | 65.0gydF4y2Ba | 79.6gydF4y2Ba | 75.6gydF4y2Ba | 77.0gydF4y2Ba | 71.6gydF4y2Ba | |||||||
任何低成本的特性gydF4y2Ba | |||||||||||||
逻辑回归gydF4y2Ba | 80.0gydF4y2Ba | 83.3gydF4y2Ba | 76.9gydF4y2Ba | 85.7gydF4y2Ba | 81.5gydF4y2Ba | 80.0gydF4y2Ba | |||||||
支持向量机gydF4y2Ba | 73.3gydF4y2Ba | 75.0gydF4y2Ba | 69.2gydF4y2Ba | 78.6gydF4y2Ba | 74.1gydF4y2Ba | 72.0gydF4y2Ba | |||||||
决策树gydF4y2Ba | 78.7gydF4y2Ba | 55.0gydF4y2Ba | 67.3gydF4y2Ba | 68.6gydF4y2Ba | 68.1gydF4y2Ba | 60.6gydF4y2Ba | |||||||
随机森林gydF4y2Ba | 77.3gydF4y2Ba | 76.6gydF4y2Ba | 73.0gydF4y2Ba | 80.6gydF4y2Ba | 77.0gydF4y2Ba | 74.8gydF4y2Ba | |||||||
基因选择的低成本功能gydF4y2Ba | |||||||||||||
逻辑回归gydF4y2Ba | 81.3gydF4y2Ba | 80.0gydF4y2Ba | 77.4gydF4y2Ba | 83.5gydF4y2Ba | 80.7gydF4y2Ba | 78.7gydF4y2Ba | |||||||
支持向量机gydF4y2Ba | 80.0gydF4y2Ba | 76.7gydF4y2Ba | 75.4gydF4y2Ba | 81.1gydF4y2Ba | 78.5gydF4y2Ba | 76.0gydF4y2Ba | |||||||
决策树gydF4y2Ba | 69.3gydF4y2Ba | 61.7gydF4y2Ba | 61.7gydF4y2Ba | 69.3gydF4y2Ba | 65.9gydF4y2Ba | 61.7gydF4y2Ba | |||||||
随机森林gydF4y2Ba | 84.0gydF4y2Ba | 66.7gydF4y2Ba | 76.9gydF4y2Ba | 75.9gydF4y2Ba | 76.3gydF4y2Ba | 71.4gydF4y2Ba |
一个gydF4y2BaPPA:正百分比协议。gydF4y2Ba
bgydF4y2BaNPA:负百分比同意。gydF4y2Ba
cgydF4y2Ba外国游客1:f值。gydF4y2Ba
dgydF4y2BaACFI:老年护理资助工具。gydF4y2Ba
egydF4y2BaeFI:电子脆弱性指数。gydF4y2Ba
算法gydF4y2Ba | 灵敏度gydF4y2Ba | 特异性gydF4y2Ba | PPAgydF4y2Ba一个gydF4y2Ba | NPAgydF4y2BabgydF4y2Ba | 精度gydF4y2Ba | F1gydF4y2BacgydF4y2Ba |
LRgydF4y2BadgydF4y2Ba | 97.3gydF4y2Ba | 96.7gydF4y2Ba | 96.7gydF4y2Ba | 97.3gydF4y2Ba | 97.0gydF4y2Ba | 96.7gydF4y2Ba |
支持向量机gydF4y2BaegydF4y2Ba | 86.7gydF4y2Ba | 95.0gydF4y2Ba | 85.1gydF4y2Ba | 95.6gydF4y2Ba | 90.4gydF4y2Ba | 89.8gydF4y2Ba |
DTgydF4y2BafgydF4y2Ba | 76.0gydF4y2Ba | 63.3gydF4y2Ba | 67.9gydF4y2Ba | 72.1gydF4y2Ba | 70.4gydF4y2Ba | 65.5gydF4y2Ba |
射频gydF4y2BaggydF4y2Ba | 88.0gydF4y2Ba | 75.0gydF4y2Ba | 83.3gydF4y2Ba | 81.5gydF4y2Ba | 82.2gydF4y2Ba | 78.9gydF4y2Ba |
一个gydF4y2BaPPA:正百分比协议。gydF4y2Ba
bgydF4y2BaNPA:负百分比同意。gydF4y2Ba
cgydF4y2Ba外国游客1:f值。gydF4y2Ba
dgydF4y2BaLR:逻辑回归。gydF4y2Ba
egydF4y2Ba支持向量机:支持向量机。gydF4y2Ba
fgydF4y2BaDT:决策树。gydF4y2Ba
ggydF4y2Ba射频:随机森林。gydF4y2Ba
算法gydF4y2Ba | 灵敏度gydF4y2Ba | 特异性gydF4y2Ba | PPAgydF4y2Ba一个gydF4y2Ba | NPAgydF4y2BabgydF4y2Ba | 精度gydF4y2Ba | F1gydF4y2BacgydF4y2Ba |
LRgydF4y2BadgydF4y2Ba | 77.3gydF4y2Ba | 63.3gydF4y2Ba | 69.1gydF4y2Ba | 72.5gydF4y2Ba | 71.1gydF4y2Ba | 66.1gydF4y2Ba |
支持向量机gydF4y2BaegydF4y2Ba | 77.3gydF4y2Ba | 58.3gydF4y2Ba | 67.3gydF4y2Ba | 69.9gydF4y2Ba | 68.9gydF4y2Ba | 62.5gydF4y2Ba |
DTgydF4y2BafgydF4y2Ba | 61.3gydF4y2Ba | 70.0gydF4y2Ba | 59.2gydF4y2Ba | 71.9gydF4y2Ba | 65.2gydF4y2Ba | 64.1gydF4y2Ba |
射频gydF4y2BaggydF4y2Ba | 77.3gydF4y2Ba | 58.3gydF4y2Ba | 67.3gydF4y2Ba | 69.9gydF4y2Ba | 68.9gydF4y2Ba | 62.5gydF4y2Ba |
一个gydF4y2BaPPA:正百分比协议。gydF4y2Ba
bgydF4y2BaNPA:负百分比同意。gydF4y2Ba
cgydF4y2Ba外国游客1:f值。gydF4y2Ba
dgydF4y2BaLR:逻辑回归。gydF4y2Ba
egydF4y2Ba支持向量机:支持向量机。gydF4y2Ba
fgydF4y2BaDT:决策树。gydF4y2Ba
ggydF4y2Ba射频:随机森林。gydF4y2Ba
讨论gydF4y2Ba
主要研究结果gydF4y2Ba
有了人工智能技术,对包含ACFI评估和非结构化患者记录的老年护理数据库进行具有成本效益的衰弱筛查测试成为可能。这项研究表明,单独的ACFI评估并不能提供足够的信息来确定患者是否虚弱。然而,当ACFI数据增加10个额外特征时,就可以推导出一个表现良好的AI模型,用于筛选测试。这在临床实践中意味着,使用我们的新型ai生成的衰弱模型,可以在住院护理中快速、准确地识别衰弱的老年人。快速识别弱点对于优化管理病情至关重要[gydF4y2Ba
].事实上,最近的澳大利亚皇家老年护理委员会强调了早期识别体弱的老年护理人员的重要性,他们需要额外的支持[gydF4y2Ba ].gydF4y2Ba任何人工智能衍生的弱点筛选模型的价值都可以通过它降低获取特征成本的多少来判断,这些特征需要确定用于构建弱点指数的缺陷值。以一种可以直接输入到分类模型的格式定期收集并存储在数据库中的特征具有较低的获取成本。不幸的是,如本研究所示(gydF4y2Ba
)及其他[gydF4y2Ba ],这种模型缺乏敏感性和特异性,无法作为有用的筛选试验。在另一个极端,包含用于计算eFI的所有赤字特征的模型表现非常好[gydF4y2Ba ) (gydF4y2Ba ),但这类模型的价值微乎其微。gydF4y2Ba为了对筛选测试有用,模型必须具有可接受的准确性,并显著降低实现脆弱指数所需的特征的获取成本。如果一个模型不包含至少一些高成本的特征就不能以可接受的精度发展,那么就需要确定实现可接受性能所需的高成本特征的最佳最小集。遗传算法在确定模型性能最大化所需的最优特征子集方面表现良好。此外,他们对子集的选择可以限制为任意数量的特征,直到并包括所有可用的特征。这允许在特性的数量和派生模型的性能之间进行权衡。gydF4y2Ba
这项研究发现,如果允许一个遗传算法从所有可用的特征中选择任意数量的特征,而不考虑它们的成本,它通常会选择只包含高成本特征的子集。这推动了前面提到的部分遗传算法的发展,这迫使算法也包含了低成本的特征。然而,这引发了一个问题,即低成本功能是否会增加任何价值。为了回答这个问题,结果包括一个不含低成本特征的固定集合和一个只包含用于计算eFI的低成本特征的集合。考虑到包含10个高成本特征(包括所有低成本特征)的逻辑回归模型,其灵敏度提高了17%(89%对72%)。这种组合并没有影响特异性,特异性保持稳定(87%),与没有低成本特征的场景相当。这一改进是显著的,可能代表了临床有用的筛选试验与不充分的筛选试验之间的差异。即使将基于所有低成本特征的模型与仅包含eFI计算中使用的低成本特征的模型进行比较,在灵敏度(89%对83%)和特异性(87%对82%)方面都有6%的提高。gydF4y2Ba
尽管部分遗传算法构建的模型包含10个高成本特征,但只使用了不到所有高成本特征的三分之一,它们仍然需要通过筛选患者病历来提取这10个特征。自然语言处理(NLP)的最新进展显示了自动提取过程的前景。NLP似乎可以提取计算eFI所需的所有特征,但这需要比本研究使用的数据集更大的数据集。与此同时,从每个患者记录中获取至少10个特征的成本仍然是在任何类似于我们的数据库(包含ACFI评估和非结构化患者记录)上实施筛选测试的成本。gydF4y2Ba
部分遗传算法可用于从任何数据库中导出分类模型,其中某些参数的获取成本高于其他参数。虽然它们已经在老年护理数据库的研究中被证明可以预测衰弱,但它们可以用于任何领域。它们非常适合训练AI模型,以便在成本非常重要且候选特征的获取成本存在差异的领域实施筛选测试。gydF4y2Ba
限制gydF4y2Ba
因为这项研究重用了之前研究的数据[gydF4y2Ba
,它也有与第一项研究的数据相关的局限性。特别是,数据来自单一的老年护理提供者,数据集相对较小。本研究基于ACFI评估的可用性进一步筛选患者。这似乎是合理的,这些标准提供了一个倾斜的人口代表,筛选测试将被应用,导致不同的模型性能。重现人工智能结果的能力仍然存在争议[gydF4y2Ba ,gydF4y2Ba 因此,进一步的研究应该着眼于用不同的数据集重现这些结果。另一个限制是澳大利亚老年人护理模式的变化,在未来两年内,一种新的模式将取代ACFI。gydF4y2Ba结论gydF4y2Ba
筛选试验的价值在于其具有成本效益的应用。应用基于模型的筛选测试的主要成本在于获取输入到模型中的度量。为了利用人工智能技术获得有用的筛选测试,必须采用算法,优先使用更便宜的功能,而不是那些需要更多努力或患者风险才能获得的功能。所有老年护理提供者及其临床顾问需要的是一种筛查工具,能够有效规划以证据为基础的干预措施,为体弱多病的老年人提供最好的受益者。在政府和国家质量机构要求老年护理部门和所有提供者关注这一弱势群体的时候,我们采用一种有效的筛选工具是至关重要的。gydF4y2Ba
本文展示了如何使用部分遗传算法来确定高成本特征的最优子集,并使用廉价特征来导出AI模型来对脆弱性进行分类,包括使用哪些参数和使用多少参数。这种技术可以应用于任何数据库。它不能保证从任何数据库中找到适当的模型,但它确实很好地指示了数据中是否有足够的信息来导出模型。gydF4y2Ba
本文演示了部分遗传算法,以推导出一种具有成本效益的弱点筛选试验,但该方法可应用于任何筛选试验,在测量所需特征的成本上存在差异。本研究的结果将有助于卫生保健提供者通过提出的成本效益方法,以更好的准确性筛选衰弱,这在准确性和成本之间取得了很好的平衡。gydF4y2Ba
的利益冲突gydF4y2Ba
没有宣布。gydF4y2Ba
gydF4y2Ba功能的完整列表。gydF4y2Ba
DOCX文件,14kbgydF4y2BagydF4y2Ba
选择功能。gydF4y2Ba
DOCX文件,41 KBgydF4y2BagydF4y2Ba
为用ga选择子集构建的模型选择低成本的特征。gydF4y2Ba
DOCX文件,13 KBgydF4y2Ba参考文献gydF4y2Ba
- 叶志勇,夏菲阿巴迪,李晓燕。基于遗传算法的太阳能应用超级电容-电池混合储能系统优化。IJRM 2014 6月29日;1(1):44-52。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
- Ambagtsheer RC, Beilby JJ, Visvanathan R, Dent E, Yu S, Braunack-Mayer AJ。我们是否应该在初级保健环境中筛查虚弱?脆弱证据基础的新视角:叙事回顾。Prev Med 2019 Feb;119:63-69。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Chatindiara I, Allen J, Hettige D, Senior S, Richter M, Kruger M,等。在入住养老机构的老年人中,营养不良和虚弱的患病率很高。《卫生保健2020》;12(4):305。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
- Turner G, Clegg a .虚弱管理的最佳实践指南:英国老年病学会,英国年龄和皇家全科医生学院的报告。2014年11月43(6):744-747。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Vermeiren S, Vella-Azzopardi R, Beckwée D, Habbig A, Scafoglieri A, Jansen B,等。虚弱和负面健康结果的预测:一项元分析。J Am Med Dir Assoc 2016 Dec 01;17(12):1163.e1-1163.e17。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Dent E, Kowal P, Hoogendijk EO。虚弱测量研究与临床实践综述。Eur J Intern Med 2016 Jun;31:3-10。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Theou O, Sluggett J, Bell J, Lalic S, Cooper T, Robson L,等。居家养老中的衰弱、住院和死亡率。中华老年医学杂志2018年7月09;73(8):1090-1096。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Hajek A, Bock J, Saum K, Matschinger H, Brenner H, Holleczek B,等。一项前瞻性队列研究的纵向结果:虚弱和医疗保健成本2018年3月01日;47(2):233-241。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 法国脆弱的代价。欧洲卫生经济杂志2017年3月25日;18(2):243-253。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 邓东,连超,林伟思,黄卫东,黄忠昌,吴泰平,等。虚弱管理亚太临床实践指南。J Am Med Dir asssoc 2017 july 01;18(7):564-575。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Thompson MQ, Theou O, Adams RJ, Tucker GR, Visvanathan R.南澳大利亚州老年人虚弱状态转变及其相关因素。Geriatr Gerontol Int 2018年11月16日;18(11):1549-1555。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 李晓燕,李晓燕,李晓燕。虚弱综合征:一个动态过程中的过渡状态。老年医学2009年4月4日;55(5):539-549。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- 普特斯,图巴斯S,安德鲁MK,阿什MC, Ploeg J,阿特金森E,等。预防或降低社区老年人虚弱水平的干预措施:文献和国际政策的范围回顾2017年5月01;46(3):383-392 [gydF4y2Ba免费的全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Hoogendijk EO, Afilalo J, Ensrud KE, Kowal P, Onder G, Fried LP。虚弱:对临床实践和公共卫生的影响。《柳叶刀》2019年10月,394(10206):1365 - 1375。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
- Gobbens RJ, Luijkx KG, Wijnen-Sponselee MT, schools JM。对脆弱社区居住老年人的概念定义。Nurs展望2010年3月58(2):76-86。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Gobbens RJJ, Maggio M, Longobucco Y, Barbolini M. sun虚弱工具的有效性:一项荷兰社区老年人的横断面研究。J; 2020;9(4):219-225。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Orkaby AR, Hshieh TT, Gaziano JM, Djousse L, Driver JA。医师健康研究中两个衰弱指标的比较。Arch Gerontol Geriatr 2017 july;71:21-27 [gydF4y2Ba免费的全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Ambagtsheer RC, Archibald MM, Lawless M, Kitson A, Beilby J.常用筛查工具在社区居住老年人中识别虚弱的可行性和可接受性:一项混合方法研究。BMC Geriatr 2020 Apr 22;20(1):152 [gydF4y2Ba免费的全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Clegg A, Bates C, Young J, Ryan R, Nichols L, Teale EA,等。利用常规初级保健电子健康记录数据开发和验证电子脆弱指数。年龄老化2018年3月01日;47(2):319 [gydF4y2Ba免费的全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Ambagtsheer R, Shafiabady N, Dent E, Seiboth C, Beilby J.人工智能(AI)技术在养老院管理数据集脆弱性识别中的应用。Int J Med Inform 2020年4月;136:104094。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Ambagtsheer RC, Beilby J, Seiboth C, Dent E.澳大利亚老年护理机构居民虚弱的患病率和相关性:来自回顾性队列研究的发现。2020年9月04日;32(9):1849-1856。[gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Clegg A, Bates C, Young J, Ryan R, Nichols L, Ann Teale E,等。利用常规初级保健电子健康记录数据开发和验证电子脆弱指数。2016年5月03日;45(3):353-360 [gydF4y2Ba免费的全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Searle SD, Mitnitski A, Gahbauer EA, Gill TM, Rockwood K.创建脆弱指数的标准程序。BMC Geriatr 2008 9月30日;8(1):24 [gydF4y2Ba免费的全文gydF4y2Ba] [gydF4y2BaCrossRefgydF4y2Ba] [gydF4y2BaMedlinegydF4y2Ba]gydF4y2Ba
- Hoover M, Rotermann M, Sanmartin C, Bernier J.评估社区居住老年人虚弱患病率的指数验证。健康报告2013;24(9):7。gydF4y2Ba
- Shafiabady N. ST (Shafiabady- teshnehlab)优化算法。《群体智能:创新、新算法和方法》2018。URL:gydF4y2Bahttps://digital-library.theiet.org/content/books/10.1049/pbce119g_ch4gydF4y2Ba[2022-09-29]访问gydF4y2Ba
- Shafiabady N, Lee L, Rajkumar R, Kallimani V, Akram NA, Isa D.用无监督聚类方法训练支持向量机进行文本分类。Neurocomputing 2016年10月,211:4-10。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
- 邓特E,马丁FC,伯格曼H,吴J,罗梅罗-奥尔图诺R,沃尔斯顿JD。弱点管理:机遇、挑战和未来方向。《柳叶刀》2019年10月,394(10206):1376 - 1386。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
- Pagone G, Briggs L.最后的报告:关心,尊严和尊重。皇家老年护理质量和安全委员会。URL:gydF4y2Bahttps://agedcare.royalcommission.gov.au/sites/default/files/2021-03/final-report-volume-1.pdfgydF4y2Ba[2022-05-01]访问gydF4y2Ba
- Stupple A, Singerman D, Celi LA。数字医学时代的再现危机。npj数字。Med 2019 1月29日;2(1)。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
- Jeganathan J, Knio Z, Amador Y, Hai T, Khamooshian A, Matyal R,等。人工智能在二尖瓣分析中的应用。安卡麻醉2017;20(2):129。[gydF4y2BaCrossRefgydF4y2Ba]gydF4y2Ba
gydF4y2Ba
缩写gydF4y2Ba
ACFI:gydF4y2Ba安老照顾资助工具gydF4y2Ba |
人工智能:gydF4y2Ba人工智能gydF4y2Ba |
eFI:gydF4y2Ba电子脆弱指数gydF4y2Ba |
FI:gydF4y2Ba脆弱指数gydF4y2Ba |
外交政策:gydF4y2Ba脆弱的表现型gydF4y2Ba |
遗传算法:gydF4y2Ba遗传算法gydF4y2Ba |
NLP:gydF4y2Ba自然语言处理gydF4y2Ba |
不是:gydF4y2Ba老人精神科评估量表gydF4y2Ba |
支持向量机:gydF4y2Ba支持向量机gydF4y2Ba |
王俊杰、梁涛编辑;提交03.04.22;Y Longobucco, M Kraus的同行评议;对作者21.06.22的评论;修订版收到01.07.22;接受30.07.22;发表07.10.22gydF4y2Ba
版权gydF4y2Ba©John Oates, Niusha Shafiabady, Rachel Ambagtsheer, Justin Beilby, Chris Seiboth, Elsa Dent。最初发表于JMIR Aging (https://aging.www.mybigtv.com), 07.10.2022。gydF4y2Ba
这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布,该协议允许在任何媒体上不受限制地使用、分发和复制,前提是原始作品首次发表在《JMIR Aging》上,并被适当引用。必须包括完整的书目信息,https://aging.www.mybigtv.com上的原始出版物链接,以及版权和许可信息。gydF4y2Ba