TY - JOUR AU - Lu, Zhaohua AU - Sim, Jin-ah AU - Wang, Jade X AU - Forrest, Christopher B AU - Krull, Kevin R AU - Srivastava, Deokumar AU - Hudson, Melissa M AU - Robison, Leslie L AU - Baker, Justin N AU - Huang, I-Chan PY - 2021 DA - 201/11/3 TI -描述非结构化患者报告结果的自然语言处理和机器学习方法:验证研究JO - J Med Internet Res SP - e26777 VL - 23 IS - 11 KW -自然语言处理KW -机器学习KW - PROs KW -儿科肿瘤学AB -背景:通过访谈或对话评估患者报告的结果(PROs)在临床遭遇中提供了关于生存率的深刻信息。目的:本研究旨在测试自然语言处理(NLP)和机器学习(ML)算法在识别儿童和青少年癌症幸存者所经历的疼痛干扰和疲劳症状的不同属性方面的有效性,而不是作为验证NLP/ML算法的金标准的PRO内容专家的判断。方法:这项横断面研究的重点是8至17岁的儿童和青少年癌症幸存者以及护理人员,从中生成了391个疼痛干扰域的意义单位和423个疲劳域的意义单位用于分析。数据来自圣裘德儿童研究医院治疗完成后诊所。通过深度访谈报告经历过的疼痛干扰和疲劳症状。逐字转录后,可分析的句子(即意义单位)由2名内容专家对每个属性(物理、认知、社会或未分类)进行语义标记。两种NLP/ML方法用于提取和验证语义特征:来自变压器(BERT)和Word2vec的双向编码器表示,再加上一种ML方法,支持向量机或极端梯度增强。采用受试者工作特征和精密度-召回曲线来评价NLP/ML方法的准确性和有效性。结果:与Word2vec/支持向量机和Word2vec/极端梯度增强相比,BERT在两个症状域都表现出更高的准确性,在疼痛干扰的认知和社会属性问题上分别为0.931 (95% CI 0.905-0.957)和0.916 (95% CI 0.887-0.941),在疲劳的认知和社会属性问题上分别为0.929 (95% CI 0.903-0.953)和0.917 (95% CI 0.891-0.943)。 In addition, BERT yielded superior areas under the receiver operating characteristic curve for cognitive attributes on pain interference and fatigue domains (0.923, 95% CI 0.879-0.997; 0.948, 95% CI 0.922-0.979) and superior areas under the precision-recall curve for cognitive attributes on pain interference and fatigue domains (0.818, 95% CI 0.735-0.917; 0.855, 95% CI 0.791-0.930). Conclusions: The BERT method performed better than the other methods. As an alternative to using standard PRO surveys, collecting unstructured PROs via interviews or conversations during clinical encounters and applying NLP/ML methods can facilitate PRO assessment in child and adolescent cancer survivors. SN - 1438-8871 UR - //www.mybigtv.com/2021/11/e26777 UR - https://doi.org/10.2196/26777 UR - http://www.ncbi.nlm.nih.gov/pubmed/34730546 DO - 10.2196/26777 ID - info:doi/10.2196/26777 ER -
Baidu
map