这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR Formative Research上的原创作品。必须包括完整的书目信息,https://formative.www.mybigtv.com上的原始出版物的链接,以及此版权和许可信息。
健康的社会决定因素(SDoH),如地理邻近、获得卫生保健的机会、教育和社会结构,是影响人们健康和健康结果的重要因素。患者的SDoH很少在电子健康记录(EHRs)中以离散格式记录,但通常以自由文本的临床叙述(如医生笔记)形式提供。人们正在开发自然语言处理(NLP)等创新方法,以从电子病历中识别和提取SDoH,但在设计NLP系统时,必须包括关键利益相关者的输入。
本研究旨在通过与主要利益相关者(1)肿瘤学家,(2)数据分析师,(3)公民科学家和(4)患者导航员进行访谈,了解开发NLP系统从临床叙述中发现SDoH的可行性、挑战和好处。
经常使用SDoH数据的个人被邀请参加半结构化访谈。所有的访谈都被记录下来并随后转录。在对转录本进行编码并编制码本后,采用常数比较法生成主题。
共采访了16名参与者(5名数据分析师,4名患者导航员,4名医生和3名公民科学家)。出现了三个主要主题,并伴有副主题。第一个主题,获得SDoH的重要性和方法,描述了每个参与者(n=16, 100%)如何认为SDoH很重要。特别是,往往依赖医院的远近和收入水平。关于SDoH的交流通常发生在与肿瘤科医生的初始对话中,但更多的个人信息通常由患者导航员获得。第二个主题,SDoH以多种形式存在,举例说明SDoH是如何在非正式沟通中产生的,并且很难进入EHR。最后一个主题是将SDoH纳入卫生服务研究,讨论如何收集更知情的SDoH。一种策略是增强患者的能力,使他们意识到SDoH的重要性,以及采用NLP技术以离散格式提供叙述数据,这可以为肿瘤学家提供可操作的数据摘要。
从电子病历中提取SDoH被认为是有价值和必要的,但叙事数据格式等障碍会使这一过程变得困难。NLP可能是一种潜在的解决方案,但随着技术的发展,重要的是要考虑关键利益相关者如何记录SDoH,应用NLP系统,并在健康结果研究中使用提取的SDoH。
世界卫生组织将健康的社会决定因素定义为"
尽管自19世纪开始记录以来,关于病人生活方式和行为的特征已经被包括在医疗记录中[
为了更好地捕获SDoH数据,研究强调自然语言处理(NLP)是从非结构化数据中提取见解的有效工具[
本课题组等人的研究表明,利用NLP从临床记录中提取SDoH是可行的,但关键是要了解收集哪种类型的SDoH以及收集这些数据的最佳方式[
这项研究在佛罗里达健康大学(UFHealth)与位于佛罗里达州盖恩斯维尔的佛罗里达健康癌症中心协调进行。
一种有目的的抽样形式,关键案例抽样,被用来确定参与者,因为研究的目标是在非常早期的阶段评估感兴趣的现象[
研究团队使用扎根理论方法制定了一份访谈指南,其中访谈问题一般以涵盖广泛的经验,也会缩小以探讨具体的经验[
描述你在与病人的典型互动中经常收集的信息类型。
我们如何才能更好地从患者身上获得社会决定因素信息?
电子健康记录(EHR)系统中的什么工具将有助于改善社会决定变量的输入?
你认为健康信息的社会决定因素对你的医疗保健提供者有什么重要意义?
你的医生通常如何询问健康的社会决定因素?
你对提供者有什么建议,以便更有效地了解你的健康的社会决定因素?
健康的社会决定因素如何对健康结果研究重要?
您如何与其他研究人员和肿瘤学家合作,使用有关健康的社会决定因素的数据?
电子病历系统在装备提供数据方面发挥了什么作用?
描述你与病人的典型互动。
根据你的经验,患者是否愿意分享有关社会决定因素的信息?
你和他们一起检查病人的电子病历有什么经验?
该研究获得了佛罗里达大学机构审查委员会(IRB202002156)的批准。所有程序都按照机构指导方针、条例和人体受试者保护进行。访谈前对所有参与者进行了知情同意审查,并解释说参与是自愿的,他们可以随时自由退出。
所有数据都被转录,任何可识别的信息都从记录中删除。数据保存在健康保险携带与责任法案批准的安全服务器上,只有研究团队的成员可以访问。
2021年8月至9月,共有16名参与者同意接受采访(招募率66%),包括5名数据分析师、4名患者导航员、4名肿瘤医生和3名公民科学家。所有参与者都在美国;平均年龄48岁,以女性(63%)和白人(69%)居多。在肿瘤学家中,从奖学金开始的平均时间为24年,从3年到35年不等。访谈平均长度为26分钟,并生成了160页的转录数据。
主要主题是获得SDoH的重要性和方法,由两个子主题总结。第一个子主题,SDoH的重要性,侧重于医生、航海家和公民科学家如何重视SDoH数据,以及为什么他们认为收集这些数据至关重要。第二个子主题,患者-提供者交流期间的SDoH征求,讨论了如何将SDoH融入患者与医疗保健团队其他成员(如导航员、社会工作者和护士)之间的讨论。
所有利益相关者团体的每个参与者(n=16)都同意SDoH数据对患者护理非常重要。当被要求说出一种可能不是特别重要的特定类型的SDoH数据时,参与者很难提供一个例子。医生和患者导航员表达了SDoH如何在提供护理中发挥重要作用。例如,一个特殊的SDoH,靠近医院,被认为是至关重要的,因为正如9号医生所说,“如果病人住得更远,他们就不太可能去赴约。不太可能准时到达。更有可能错过预约,并随后产生负面后果。”另一个SDoH,社会结构,与帮助患者到达医院以及管理副作用有关。9号医生说:“我们的治疗可能会使人身心衰弱……他们可能只看我或我的同事15到20分钟……他们大部分时间都不在我们的诊所,有可以依靠的人来帮助他们缓解症状。”4号公民科学家回忆了她作为病人的经历和社会支持的重要性。她说:“感谢上帝,我有家人的支持,我的妈妈,我的妹妹。 That was a big one for me just with living with [the disease].” Doctors can use information about patients’ social structure to effectively communicate with patients and family members, as well as bring clarity as to who can assist patients the most. For example, doctor #10 provided the following example:
每天陪病人去诊所的人,可能不是做很多繁重工作的人或者至少不是做很多繁重组织工作的人。也许他在那里处理日常事务,但他不是。他不是那个需要参与她照顾的主要生活转折点的人。所以这非常非常有见地。
其他被认为重要的SDoH是收入水平和地理位置。所有数据分析师(n= 5,100%)都提到,邮政编码是卫生服务研究人员最常请求的数据点。邮政编码非常强大,因为它们通常与地理位置有关。12号分析师说:“邮政编码可能是最重要的,因为你可以把它与一个人的工作机会和几乎整个社会经济地位联系起来,仅仅从他们居住的地方。”另一位分析师(#13)提到收入和地理位置是如何由于“空气质量和环境压力”而联系在一起的。
征求卫生部信息的过程通常发生在初步咨询期间。传统上,在第一次就诊时进行的正式程序中,医生会根据电子病历中的智能表格提出标准化的问题。智能表单允许肿瘤学家输入数据,通常以下拉菜单的形式。然而,时间限制是初始访问的一个障碍,导致无法收集所有SDoH。第九名医生说:“在第一次就诊中很难了解所有事情……第一次就诊会非常拥挤。”医生们发现,一旦患者和肿瘤医生的关系更好地建立起来,关于患者的更多信息就会浮出水面。例如,10号医生说:“你必须准备好倾听它(SDoH),然后抓住这个机会,因为他们提出了它,让你的脚进入大门,更多地追求它。”公民科学家同意这种观点,并认识到医生了解病人的重要性。公民科学家#4建议医生应该“让病人感觉你在他们身边。你想知道到底发生了什么,让他们感觉舒服。” Doctor #9 said the following:
在随后的探视中,我能够有更多的那种对话方式,询问他们护理的其他方面,我想这也是因为……在随后的探视中,我建立了这种关系。有时,在第一次就诊时向病人询问严肃和私人的问题是很困难的。
患者导航器也在对话期间从患者获得SDoH数据,但导航器-患者关系的性质有时允许获取更多个人细节。导航员通常与患者建立密切的联系,这与患者与肿瘤医生的互动不同。导航员#8提到,患者对他们倾诉是因为他们形成了高度的信任。公民科学家#5重申了这一观点,他说:“你能想象你的医生问你‘你有足够的钱买杂货吗?你住的地方危险吗?你的性生活有趣吗?’他们不会去那里。”导航员要么提醒肿瘤医生,要么在自己的笔记下直接将SDoH数据输入电子病历。10号医生指出了社会工作者与患者讨论SDoH的重要性,因为除了帮助他们解决旅行或保险等问题外,他们还可以成为“患者可以依靠的肩膀”。总的来说,在患者和肿瘤医生之间的关系中,SDoH请求更现实地持续发生。
虽然通常认为SDoH是在会诊期间获得的医疗信息,但它可以通过其他方式泄露。第一个子主题“非正式沟通”描述了为何不是所有的SDoH都包括在EHR中,而第二个子主题“SDoH专业知识和知识的需求”解释了可以发现SDoH的方式。
虽然智能表单被认为是获取SDoH数据的一种充分方法,但患者信息可以非正式地交流,使肿瘤学家有责任单独输入他们认为重要的数据。9号医生评论道:“如果我确实从病人身上得到了一些我认为非常重要的东西,我会把它写在笔记里。但我认为问题在于我们的典型笔记模板中没有章节。”因此,医生们不确定这些信息应该写在病历的哪里。同样,另一位医生(#15)说:“我没有把它放在模板里……我把我认为对我重要的放在第一段。”除了在检查中发生的交流,SDoH也可以在其他交流方式中发现。10号医生说:“MyChart信息传递给了我在诊所里没有的见解。”例如,医生提到了以下几点:
当他们的社会系统中一直有另一个照顾者代表患者与我们接触时,也许这些人我没有见过,但显然他们密切参与了患者的日常支持。
由于SDoH可以来自许多不同的来源,如消息以及导航员输入的额外注释,因此必须将它们适当地包含在EHR中。尽管智能表单似乎更容易输入SDoH数据,但10号博士注意到“每个离散变量都需要至少15次点击。”作为一种耗时较少的替代方法,医生将输入数据,这些数据被认为是非结构化数据,因为这些信息不一定包含在智能表单中。要将这些数据输入EHR,通常需要手动文档。肿瘤医生复制粘贴以前的记录是很常见的,但这么做会遗漏最近检查中出现的新的SDoH。
手动输入数据会给提取SDoH数据带来障碍。数据分析师#13说,“拥有非结构化数据对最终用户来说会更加困难,因为许多研究人员没有技能……试图实际获得他们需要的数据。”解密非结构化SDoH数据是有问题的,因为正如数据分析师#12所问的那样,“很多东西(SDoH)……存储在笔记部分中……我们如何从笔记中获取它,然后如何将其转换为结构化格式?”分析人员被迫发挥创造性来识别研究人员经常要求的SDoH。例如,数据分析师#12继续说道,“我们没有教育状况。我们不知道个别患者的收入水平或任何东西……我们可以从邮政编码推断出这些东西,但这也只能到此为止。”10号医生说:“我们甚至不会考虑不记录病人过去的手术史,但[SDoH]并没有最佳地记录在[EHR]中……因为它需要太多的人工劳动来输入和输入系统。”
当NLP被提出作为一种解决方案时,分析师们很感兴趣,但5名分析师中没有人具备以这种方式提取数据的专业知识。数据分析师17号说:“我知道NLP是做什么的,我以前也玩过一些东西,但这不是我在工作中做的事情。”另一位分析师(#14)没有NLP经验,但他说:“这是该领域一个有趣的领域,但我个人没有使用过它。”像参与者15一样,医生们对NLP能否很快成为一种解决方案表示怀疑。他说:“它还没有准备好进入黄金时段,但可能会有我不知道的测试版。”
考虑到获取和提取SDoH的挑战,以及SDoH对治疗患者的重要性,有必要发现将数据纳入研究的方法,以扩大其影响。出现了两个子主题,讨论了改善SDoH数据如何纳入卫生服务研究和患者护理的可能解决方案:(1)赋予患者权力和(2)可采取行动的数据。
真正理解患者的个人情况需要确定SDoH,如他们居住的社区、职业、获得健康和社会支持的途径,并将其纳入护理计划。尽管肿瘤学家向患者征求信息,但也有机会增加患者对这一过程的参与。例如,9号医生说:“我们一直对直接从患者那里获得信息很感兴趣,但我认为让患者自愿回答问题也不是一个坏主意。”医生解释说,调查可以在与医生见面前一周通过电子邮件分发,以更多地了解患者的背景和环境。这样做将“减轻(肿瘤学家)很多负担”。另一位医生(#15)认为,患者应该更多地参与进来,并有能力澄清有关自己的信息,因为“可能会有无辜的错误,或者总是有一定数量的不正确的信息。”然而,患者还有其他机会填写关于自己的信息,但由于这些信息是可选的,大多数患者选择不填写。因此,一位数据分析师(#16)说:“我们没有看到太多结构化的数据……我确实知道有一项调查有很多结构化的问题,但没有多少人填写。”10号医生说了下面的话来强化这一观点:
我们已经取消了病人在候诊室填写信息的纸质系统,这是另一个很好的机会,让病人自己把数据输入系统,然后我们可以验证。
为了让患者参与进来,他们必须了解SDoH如何影响他们,但他们也必须了解数据。公民科学家#3反思了她自己的家庭成员,他们都受过高中教育,并认识到他们可能没有能力像其他人一样轻松地处理健康信息。当患者可以采取行动时,输入或查看SDoH数据更有帮助。例如,9号医生认为,对患者来说,有一个可以与他们谈论SDoH的人是有益的,原因如下:
我认为很多病人都没有意识到他们可以获得的所有资源,无论是患者药物援助项目,还是支持团体……[或]财务项目。
NLP创新作为一种聚合个人层面SDoH数据的潜在解决方案受到欢迎,并作为一种使它们对患者和肿瘤学家都更加突出的方式。数据分析师对获取额外数据的前景充满热情,但对准确验证数据的过程感到好奇。肿瘤学家也意识到NLP的潜在效率。提到NLP, 9号医生评论道:“这是自动的。不需要我们做任何事。我认为这很棒……你可以更好地结合患者所需的正确管理和个性化护理,考虑到这些社会决定因素。”肿瘤学家还考虑了数据将在何处以及如何呈现。例如,10号博士推测,“如果NLP系统可以识别数据并将其提取出来,会发生什么?它最终会被放在EHR中原本应该放在的地方吗?”民间科学家对解释NLP获得的数据持谨慎乐观态度。 A citizen scientist (#5) provided the following example:
如果我在看医生的记录,我说我对我的隔壁邻居感到偏执,那么偏执这个词可能会出现在我的记录中。这对我来说是一个多么错误的陈述……这可能会被编码成一些对我来说并不是真正的诊断。我很担心这个过程。
我们采访了16位与SDoH相关的利益相关者,包括肿瘤学家、数据分析师、患者导航员和公民科学家。研究结果显示,没有SDoH数据点被认为不重要。地理、社会结构和收入是最容易获得的,因此也是最常使用的。虽然众所周知,卫生防疫对人口健康的重要性,但由于COVID-19大流行,卫生防疫最近的重要性有所提高。例如,那些社会经济地位较低或患有合并症的人更容易受到感染[
在将数据输入电子健康记录(EHR)时,应优先考虑SDoH,并尽可能详细地包括这些数据。应该填写智能表格,并添加有关患者的其他信息,例如他们的生活方式和他们目前面临的问题。
虽然大多数SDoH是在初次会诊后输入电子病历的,但随着患者-提供者关系的发展,有价值的SDoH是由患者在随后的访问中提供的。关于患者生活的更丰富的细节应不断添加到电子病历中。
虽然智能表格可能会引导讨论,但患者在整个就诊过程中会提供有关他们生活方式的线索。如果某个特定变量无法通过智能表单获得,则应该在注释中输入。
应该向参与研究分析过程的每个人简要介绍和教育有关识别和提取SDoH的技术。
提高患者对向提供者分享SDoH如何对其护理产生积极影响的认识。
让患者了解SDoH的影响,以及他们如何直接影响有关其护理的决定。
我们的研究结果表明,从患者那里获取SDoH的方法各不相同,因为数据来自于正式和非正式的患者-提供者沟通以及整个护理提供的时间线。医生在初次会诊时获得SDoH,但由于时间限制,不太可能获得所有相关SDoH。SDoH还可以在安全消息中以及与患者导航器的交互过程中找到。以往的研究表明,患者的自我表露取决于医生的性别以及他们自己是否愿意向患者开放和披露信息[
由于大多数导航员都可以访问EHR,并且可以输入自己的笔记,因此使用非结构化数据捕获SDoH非常重要。NLP产生了有效的结果[
最后,访谈显示,为了更好地将SDoH数据纳入卫生服务研究和临床护理,应该让患者了解这些数据如何影响他们的健康,以及信息披露后可能会提供有价值的资源。由于时间限制是收集SDoH的常见障碍[
这项研究有几个局限性。首先,使用了相当小的样本量。其次,所有访谈都是在同一卫生系统进行的。因此,参与者的意见可能仅限于卫生系统的具体程序,不适用于其他设施的利益相关者。第三,存在选择偏差的因素,因为所有参与者都是在被告知该主题后自愿参与的。一般来说,没有看到NLP或SDoH价值的利益相关者有可能选择不参与。
SDoH数据对患者护理非常有价值,但由于非结构化数据输入EHR的方式,可能难以访问。NLP可以识别EHR中隐藏的SDoH数据,从而减轻肿瘤学家的负担,同时使分析人员能够轻松提取健康结果研究所需的数据。然而,保持输入电子病历的SDoH数据的高质量是必要的。应制定流程,以促进患者获得SDoH,并教育患者了解SDoH的重要性。
电子健康记录
自然语言处理
健康的社会决定因素
该研究获得了以患者为中心的结果研究所(PCORI)奖(ME-2018C3-14754)资助。
经合理要求,可提供未识别的数据。
没有宣布。