注意:这是一个未审核预印
警告:这是一份未经审阅的预印本(什么是预印本?).警告读者,该文件尚未经过专家/患者审稿人或学术编辑的同行评审,可能包含误导性声明,如果被接受,在最终出版前可能会发生更改,或者可能已被拒绝/撤回(上面将出现“不再考虑”的说明)。
同行评议我:如果论文处于开放的同行评议期内,我们鼓励有兴趣和专业知识的读者注册为同行审稿人(在这种情况下,上面显示了一个“peer-review Me”按钮,可以注册为审稿人)。所有目前开放审查的预印本都列在这里。在正式的开放同行评议期之外,我们鼓励您在推特上发布预印本。
引用:请引用此预印本仅用于审查或拨款申请和简历(如果您是作者)。
最终版本:如果我们的系统检测到在任何期刊上发表的最终同行评审的“记录版本”(VoR),则将在下面显示该VoR的链接。然后鼓励读者引用VoR而不是这个预印本。
设置:如果您是作者,您可以登录并更改预打印显示设置,但预打印URL/DOI应该是稳定的和可引用的,因此一旦发布就不应该删除。
提交:张贴自己的预印本,简单提交到任何JMIR期刊,并选择适当的设置以预打印形式公开您提交的版本。
警告:这是一篇作者提交的文章,未经同行评审或编辑。除非预印本显示为“已接受”,否则不应依赖预印本来指导临床实践或与健康相关的行为,也不应在新闻媒体上作为既定信息报道。
利用自然语言处理从缺血性和出血性中风患者的自由文本成像报告中提取放射学特征
摘要
背景:
神经影像学是所有疑似中风患者的金标准诊断方式。然而,成像报告的非结构化性质仍然是从电子健康记录(EHR)系统中提取有用信息的主要挑战。尽管放射学报告越来越多地采用自然语言处理(NLP),但许多脑卒中成像特征的信息提取尚未得到系统评估。
摘要目的:
在本研究中,我们提出了一种NLP管道,该管道采用最先进的ClinicalBERT模型,具有特定领域的预训练,从头部计算机断层扫描(CT)成像记录中提取13个卒中成像特征。
方法:
我们利用该模型生成了包含24,924名中风患者常见中风特征存在或不存在信息的结构化数据集。我们使用Kaplan-Meier曲线和log-rank检验比较了有和没有严重卒中特征(中线移位、血肿周围水肿或肿块效应)的患者的生存特征。
结果:
我们的HeadCT_BERT模型对82073个头部CT笔记(6100万字)进行了预训练,并对200个注释笔记进行了微调,其平均面积下接受者工作特征曲线(Area Under Receiver Operating Characteristic curve, AUROC)为0.9831,F1评分为0.8683,准确率为97%。在急性缺血性脑卒中患者中,入院时初始成像记录中任何严重脑卒中特征都与较低的生存概率相关(p值< .001)。
结论:
我们提出的NLP管道实现了高性能,并有潜力改善医学研究和患者安全。
引用
请求排队。正在生成文件,请稍候。这可能需要一些时间。
版权
©作者。版权所有。这是一份目前正在同行评审/社区评审(或接受/拒绝的手稿)的保密文件。作者已向JMIR出版物提供独家许可,在其网站卡塔尔世界杯8强波胆分析上发布此预印本,仅用于审查和打印前引用目的。虽然最终的同行评议论文可以在cc-by许可下发表,但在此阶段,作者和出版商明确禁止除评审目的外重新分发此论文草稿。