发表在第三卷第三期(2001年):

糖尿病消费者入门词汇开发的受控词汇资源评估

糖尿病消费者入门词汇开发的受控词汇资源评估

糖尿病消费者入门词汇开发的受控词汇资源评估

原始论文

1美国密苏里大学哥伦比亚分校家庭医学科学中心健康管理与信息系

2美国密苏里大学哥伦比亚分校健康管理与信息系

3.美国密苏里-哥伦比亚大学健康管理与信息学系信息科学与学习技术学院

4美国地区英语词典项目,威斯康星大学麦迪逊分校,美国

5美国密苏里大学哥伦比亚分校家庭医学科学中心家庭与社区医学系

通讯作者:

Timothy B Patrick博士

卫生管理和信息系“,

密苏里大学哥伦比亚分校

克拉克厅324号

美国

电话:+1 573 884 8155

传真:+1 573 884 8155

电子邮件:patrickt@health.missouri.edu


背景:数字信息技术可以促进个人在个人医疗保健方面做出明智的决定。数字鸿沟将那些能够访问或不能使用数字信息的人区分开来。为了缩小数字鸿沟,医疗保健传播研究必须解决一个基本问题,即消费者词汇问题:医疗保健的消费者,至少是外行,并不总是熟悉医疗保健提供者和医疗保健信息提供者使用的专业词汇和概念,反过来,医疗保健和医疗保健信息提供者也并不总是熟悉消费者使用的词汇和概念。解决这个问题的一种方法是为医疗保健通信开发一个消费者入口词汇表。

目的:评估受控词汇资源在支持糖尿病消费者入门词汇开发方面的潜力。

方法:我们使用来自美国地区英语词典项目的民间医学术语,创建了3个受控词汇资源的扩展版本:统一医学语言系统元词库、欧盟委员会翻译服务的欧洲词典,以及流行和技术医学术语的欧盟委员会词汇表。我们从消费者撰写的材料中提取消费者术语,从医生撰写的材料中提取医生术语。我们使用词汇资源的扩展版本,将医疗保健消费者使用的糖尿病相关术语与家庭医生使用的同义词、近乎同义词或密切相关的术语联系起来。我们还检查了由非营利医疗保健专业组织、学术组织或政府组织维护的与糖尿病相关的万维网信息网站的检索是否可以通过在查询中用医生术语替换其相关的消费者术语来改进。

结果:《美国地区英语词典》对易词龙的扩展直接或间接地涵盖了大约23%的自然语言消费者术语-医生术语对。Eurodicautom的扩展版《美国地区英语词典》覆盖了16%的术语对。mettathesaurus和Eurodicautom间接相关的词汇都比直接相关的词汇多。较高比例的覆盖词对(间接覆盖词对多于直接覆盖词对)可能是充分利用昂贵的受控词汇资源的一种方法。我们比较了使用医生术语检索糖尿病相关Web信息网站和使用相关消费者术语检索糖尿病相关Web信息网站。我们的比较基于非营利医疗专业组织、学术组织或政府组织维护的网站检索。通过在查询中用医生术语替换相关的消费者术语,搜索结果的前20个结果中此类站点的数量增加了。这表明,《美国地区英语词典》对变义词和欧洲词的扩展可以用来提供从自然语言消费者术语到自然语言医生术语的有用链接。

结论:应进一步调查美国地区英语词典对异义词汇和欧洲词汇的扩展,以支持糖尿病的消费者入门词汇。

中国医学杂志,2001;3(3):e24

doi: 10.2196 / jmir.3.3.e24

关键字



消费者词汇问题

数字信息技术可以促进个人的知情决策,并有助于实现美国医疗保健机构的2个重要目标。这些目标中的第一个是美国健康人2010年的目标,即提高“预期寿命和生活质量……通过帮助个人获得他们需要的知识、动力和机会来对自己的健康做出明智的决定" [1].第二个目标是美国国家癌症研究所(NCI)的目标,即改进“使用高质量的、基于证据的癌症信息,不论种族、民族、健康状况、教育、收入、年龄、性别、文化或地理区域”[2].事实的确如此,“历史上没有任何一个时期像现在这样让如此多的人如此容易地获取如此丰富的信息”。3.],而且医疗保健的消费者,特别是外行,越来越多地使用网络作为医疗保健信息的来源[4].数字鸿沟[5被描述为将人群划分为拥有数字信息的人群和无法获取或利用数字信息的人群。数字鸿沟对于《2010年健康人》和《国家癌症研究所》的目标来说是个问题。

医疗保健通信研究的一个前景是,它可以为数字鸿沟提供解决方案。但是,确保普遍获得信息技术并不是一个充分的解决办法。为了消除数字鸿沟,医疗保健传播研究必须解决一个比数字鸿沟更根本的问题:我们称之为消费者词汇问题。

消费者词汇问题是,医疗保健的消费者,至少是那些外行,并不总是熟悉医疗保健提供者和医疗保健信息提供者使用的专业词汇和概念,相反,医疗保健和信息提供者并不总是熟悉消费者使用的词汇和概念。这种双向通信问题比数字鸿沟更为根本,因为它影响着各种形式的信息使用,无论是数字形式还是非数字形式。访问高速网络和万维网(Web)浏览器对于缺乏必要词汇的医疗保健消费者来说没有什么用处:询问有关他或她的医疗保健的问题,搜索支持他或她的决定的信息,或者当他或她设法访问这些信息时理解这些信息。

健康中的词汇差异是沟通:误解、结果和信息获取

卫生保健沟通中词汇差异所带来的潜在误解可能会降低医患互动的质量,导致糟糕的健康结果和患者满意度,影响消费者获取卫生保健信息,并对知情同意产生影响。

词汇差异对医患沟通的影响早已被医学人类学家和从业者所认识和研究[6 - 8].越来越多的人认识到医患沟通对患者满意度和健康结果的重要性[9]和沟通技巧越来越被视为医学教育的必要组成部分[10-12].

并非所有医患沟通中的问题都是词汇差异造成的。有些沟通问题是由于病人和医生的价值观不同造成的[13].然而,医患沟通的质量可能会受到词汇差异的影响,从而导致不良的健康结果。患者对专业语言的误解(或患者看护人的误解),无论是否由于文盲所致[14],可能导致对重要的诊断或治疗信息的误解,而这可能导致缺乏适当的依从性[15].例如,先前的研究表明,在糖尿病等慢性疾病患者的教育和治疗中,需要密切关注词汇差异[1617]及哮喘[18-22].

词汇和其他语言差异在跨文化语境中尤为显著[2324].例如,一个不熟悉这个术语的医生血液病被一些非裔美国人用来指癌症[25,可能很容易把它误认为是的同义词低血被一些非裔美国人用来指贫血[8].再举一个例子糖糖尿病,而且糖尿病.美国中西部和南部的临床医生普遍认为糖尿病是农村非裔美国人用来指糖尿病的一个术语。然而,最近的一项研究[26表明在某些情况下,那些说他们有对自己的疾病有不同的健康信念吗糖尿病糖尿病.根据[26),这些人说他们有他们“更有可能说自己的病情并不严重,是可以治愈的。”这些不同的健康信念对依从性有明显的影响。如果相信自己拥有的人也相信他们的病情并不严重,他们可能在控制血糖水平方面不那么勤奋。

关于医疗保健信息的获取,在之前的一项研究中[27]我们展示了用于在Web上检索医疗保健信息的词汇是有问题的。在这项研究中,我们比较了几种常用词汇变体的检索结果,即外行常用的同一术语的不同书写方式。我们发现,使用的变体明显影响了检索到的条目数量。但是,词汇变异并不是医疗保健信息的唯一词汇障碍。在美联社最近的一篇报道中[28],据报道,前美国众议员杰拉尔丁·费拉罗已经血癌.不管在这种情况下是否使用得当,血癌是消费者词汇的一个明显例子。如果最近有报道称消费者越来越多地使用网络获取医疗保健信息,[4尽管美联社的报道是准确的,但很有可能促使一些消费者在网上搜索相关信息。因此,我们(2001年6月25日)在www.altavista.com上进行了搜索血癌.搜索返回了2616个结果多发性骨髓瘤(美联社的报道使用了这个词,显然是一个更具体的术语血液癌症)返回33,279个结果。在www.google.com上差异是5450对46,700。的number of items retrieved is not at issue as much as the quality and relevance of the items retrieved [29-32].然而,这些结果确实表明,在Web信息检索的消费者词汇和专业词汇之间可能存在显著的实际差异。

影响信息检索的词汇差异和调和这些差异的概念框架在信息科学和信息学领域长期以来一直在研究[33-36].对于医疗保健消费者信息学来说,词汇差异的问题很复杂,因为外行使用的医疗保健词汇的含义精度存在差异,而且外行词汇与专业词汇之间缺乏一致的语义重叠[635].

语义重叠的缺失可能会对知情同意产生影响。也许美国最著名的例子是臭名昭著的塔斯基吉梅毒研究[37].塔斯基吉研究的参与者缺乏知情同意可能是相互误解这个术语的结果坏血这是农村非裔美国受试者使用的,也是进行这项研究的美国公共卫生医生使用的。根据[37,一些研究对象被告知他们已经知道了坏血.美国疾病控制中心(CDC)负责这项研究的后期阶段,CDC的一名官员“表示,他理解‘坏血’一词在黑人社区是梅毒的同义词”[37].然而,也根据[37),一位幸存的研究对象说:“这可能是真的。但我从没听说过这样的事。我只知道他们一直说我血液不好——他们从来没有跟我提过梅毒,一次也没有。”[37] .的确,这样的误解令人担忧坏血可能还会持续下去。1985年,在塔斯基吉的研究被大众媒体广泛报道后,坏血据报道,梅毒仍然是一个俚语或非标准方言的同义词[8].

需要一个用于医疗保健通信的消费者入口词汇表

刚才描述的问题类型在程度上因案例而异;一些医疗保健消费者比其他人更熟悉专业词汇,同样,一些医疗保健提供者比其他人更熟悉消费者词汇。此外,国家之间可能存在差异,例如,美国医生和英国医生在熟悉消费者语言方面存在差异。然而,总的来说,我们正在讨论的这种双向沟通问题会使个人很难获得他们需要的信息来支持他们关于个人健康保健的决定,因此这些问题与2010年健康人和美国国家癌症研究所(NCI)的目标背道而驰。

解决这些双向沟通问题的一种方法是开发一个consumer-entry词汇用于医疗保健通讯。条目词汇表将常用术语与某些专业词汇中的术语联系起来[36].用于医疗保健通信的消费者条目词汇表将消费者熟悉的术语与可能不熟悉的用于索引、描述和通信医疗保健信息的专业术语联系起来。它还将有助于提供者和患者(或其护理人员)之间的沟通[15].从医疗保健提供者的角度来看,条目词汇表将把提供者熟悉的术语与常用但可能不熟悉的消费者术语联系起来。这种消费者词汇和专业词汇的双向链接在其他地方被描述为调和子语言组的问题。34].

研究概述

受控词汇表可以最低限度地定义为基于概念的词汇表,其中的概念和用来表达它们的术语都受到某种程度的控制;只表达了概念的一些子集,并且只允许一些术语和术语变体作为这些概念的表达式。通常,条目词汇表将自然语言术语与受控词汇表中的术语联系起来。然而,由于健康交流以专业实践的自然语言和常识的自然语言开始和结束,我们有兴趣使用受控词汇资源来连接两个自然语言词汇域。(我们使用词汇资源这里允许有组织的词汇表集合,例如统一医学语言系统[UMLS] Metathesaurus。)我们是对受控词汇资源中包含多少给定的自然语言领域(无论是专业人士还是外行人士)的问题感兴趣。无论我们在受控词汇资源上投入了多少,无论它们看起来有多全面,我们都假定,当前的词汇中总会有一些自然残留,无论是专业的还是外行的,它们不包含在任何受控词汇资源中,而且它可能与医疗保健中的双向沟通问题有关。从建立词汇资源的投资中获得收益的一种方法可能是使用它们在自然语言词汇领域之间提供间接的(尽管可能只是近似的)联系。

通过使用受控词汇资源链接两个自然语言领域的词汇,我们可以提供从一个领域到另一个领域的入口词汇。具体来说,在这项试点研究中,我们评估了受控词汇资源支持从自然语言医疗保健消费者词汇到自然语言医疗保健专业词汇的入口词汇的能力。中描述了我们使用的概念模型图1

图1。一个受控词汇资源,在消费者术语和专业术语之间提供桥梁
查看此图

图1例如,一个受控词汇资源(如Metathesaurus)可以作为自然语言消费者术语和自然语言专业术语之间的桥梁。该模型的重点是解决连接自然语言领域的需求,并依赖于自然语言消费者词汇表、受控词汇表资源和自然语言专业词汇表之间存在一些重叠。这种重叠使我们能够利用受控词汇资源将自然语言消费者术语与自然语言专业术语联系起来。图1显示了链接到4个自然语言专业术语的3个自然语言消费者术语。

图1,假设这3个消费者术语位于相同的语义邻域[38],即同义的,几乎同义的,或密切相关的。还要假设这4个专业术语本身在它们自己的语义邻居中。假设受控词汇表资源包含1个消费者术语和1个专业术语。还假设受控词汇资源根据其内部指定的规则和结构,将所包含的消费者术语和所包含的专业术语定位在相同的语义邻域。最后,假设语义邻域之间的关系是可传递的,即如果消费者邻域可以链接到受控邻域,受控邻域可以链接到专业邻域,则消费者邻域可以链接到专业邻域。在这种情况下,受控词汇表资源可用于间接地将剩余的消费者术语和专业术语联系起来,从而为自然语言专业词汇表提供消费者条目词汇表。这种关系的特征将随着定义各自语义域的属性以及表征词汇资源的控制程度的变化而变化。

为了将自然语言消费者术语和自然语言专业术语联系起来,我们必须根据我们的模型,将消费者术语和专业术语分组到语义邻域(步骤3).此外,词汇表资源提供的消费者术语和专业术语之间的链接只有在需要链接这些术语时才合适。因此,为了评估给定的词汇资源在将自然语言消费者术语与自然语言专业术语联系起来时是否有用,我们需要独立地确定消费者术语是否应该与位于同一语义邻域的专业术语(步骤3).最后,虽然词汇资源提供的链接在概念上的适当性很重要,但我们最感兴趣的是由此产生的消费者入口词汇相对于前面提到的健康人2010和NCI的目标的实际价值。因此,我们需要根据信息使用或医疗保健交流的某些上下文来评估消费者条目词汇表,这些上下文可以为个人关于其个人医疗保健的决策提供支持。在这项试点研究中,我们评估了消费者条目词汇表对医疗保健信息的Web检索的支持(方法,步骤8).当然,Web检索不仅应该被评估信息检索,但它的质量.对于这项试点研究,我们使用条目词汇表检查了由非营利医疗保健专业组织、学术组织或政府组织维护的网站的Web检索。我们认识到,由专业、学术或政府组织维护网站并不能保证网站是高质量的,但我们确实认为它确实增加了网站是高质量的可能性。

为了使这项初步的探索性研究保持在可管理的范围内,我们将自己局限于与糖尿病相关的消费者词汇,并试图将这些消费者词汇与美国家庭医生使用的糖尿病词汇联系起来。因此,这项研究补充了之前的一项关于糖尿病消费者和专业词汇的研究,该研究的重点是阅读同义词典[35].

研究问题

我们提出了2个研究问题:

  1. 变质龙能在多大程度上39]、欧洲委员会翻译服务的欧洲语[40],以及欧洲委员会常用和专业医学术语表(简称“欧洲术语表”)[41],由美国地区英语词典(DARE)计划扩展而来[42-45],可以用来推导出消费者和医生关于糖尿病的术语对,它们在相同的语义邻近?
  2. 通过在Web查询中用医生术语替换成对的消费者术语,非营利医疗保健专业组织、学术组织或政府组织维护的与糖尿病相关的Web信息站点的检索能否得到改进?

词汇资源

mettathesaurus是由美国国家医学图书馆开发的一个大型数据库,它将50多个医疗保健词汇连接在一起。变义龙把表达相同或几乎相同概念的词连在一起。当术语表达相同的概念时,它们就被赋予相同的含义,在异龙的语言中metaconcept.例如,这些项未指明糖尿病而且糖尿病赋给相同的元概念。

Eurodicautom是欧盟委员会翻译服务的多语言术语数据库。欧洲词典包含124,551个医学词条,其中许多是英语词条。欧语词典共包含990672个英语术语条目。Eurodicautom是由不同的术语办公室维护的术语集合组织起来的,就像mettathesaurus一样,当不同的术语表达相同或几乎相同的概念时,将它们链接在一起。例如,Eurodicautom条目高血压在术语集EUT97中,包括高血压作为的同义词高血压

欧洲术语表是由欧洲委员会开发的,与欧洲词典是分开的。欧洲术语表包含成对的同义或几乎同义的消费者术语和专业术语。例如,欧洲术语表将消费者术语“屏住呼吸”与专业术语“低通气”配对。

DARE旨在“记录在美国各地都找不到的各种英语——那些因地区而异的单词、发音和短语,我们在家里而不是在学校里学习的,或者是我们口头文化而不是书面文化的一部分”。45].DARE基于1965年至1970年间在美国50个州的1002个社区进行的实地调查。DARE的实地工作人员收集了对这个关于糖尿病的采访问题的各种回答,例如:“当一个人的血液中有太多的糖,可能不得不服用胰岛素,你会说他有__________________?”

这些回答包括糖尿病高血糖血糖尿病,.DARE中包含的其他术语是由涵盖美国从殖民时期到现在的历史的书面材料(日记、信件、小说、历史、传记、报纸和政府文件)的综合收集提供的。45].


步骤1。我们从先前从2个消费者来源提取的术语列表中选择了与糖尿病相关的消费者术语。术语的第一个来源是1997-1999年期间消费者向密苏里大学医疗保健在线网站提交的1500个电子邮件问题的语料库(密苏里大学哥伦比亚分校人类受试者研究机构审查委员会[IRB]豁免批准#6843)。术语的第二个来源是提交给一个主要营利性Web医疗保健信息网站的消费者门户网站的348,000个查询日志(根据与网站所有者的协议,我们将不提及该网站的名称)。通过搜索先前提取的包含子字符串的术语列表来选择与糖尿病相关的术语迪亚布dibgluco,或insul.我们更正了消费者术语的拼写,并消除了重复的地方。(我们从一开始就认识到这项研究的局限性——虽然这些术语表面上是消费者术语,它们的谱系是外行术语仍然存在一定的疑问,因为没有明确的证据,特别是从查询日志中提取的术语,来解决是健康专业人员还是外行输入查询的问题。)

步骤2。接下来,我们从密苏里大学医疗保健家庭医生在1999-2000年期间撰写的25000份家庭医学进展记录语料库中提取了与糖尿病相关的医生术语(密苏里大学哥伦比亚分校IRB豁免批准#7054)。与消费者术语一样,与糖尿病相关的医生术语是通过搜索先前提取的包含子字符串的术语列表来选择的迪亚布dibgluco,或insul.我们纠正了医生术语的拼写,并消除了重复的地方。

步骤3。两位合著者(H.K.M.和T.B.P.)使用以下非正式程序生成消费者术语和医生术语对,并将其判断为具有相同的语义邻域:(1)每个消费者术语与一个或多个同义词、近似同义词或密切相关的医生术语相匹配;(2)消费者术语和医生术语分别被分为同义、近似同义和密切相关的术语组;(3)每组消费者术语与一组或多组医生术语相匹配;(4)消费者-医生-术语匹配基于(3)进行了调整。H.K.M.对术语进行了初始匹配和分组,然后T.B.P.对匹配和分组进行了审查。不同意见通过医学词典进行讨论和审查,直到达成一致意见。这种非正式的程序并不是为了产生一对严格同义的消费者术语和医生术语,而是为了产生一对我们认为是同义的、几乎同义的或密切相关的术语。这种方法比我们所希望的更加非正式和主观。我们更喜欢一种方法,它允许我们生成定义语义邻域的属性的逻辑严格定义。然而,语义局部性的客观度量(可以让我们更严格地指定这些属性)在这种情况下并不明显适用。例如,我们得出的文本语料库分析,如单词或术语共现分析[3846]将不适用,因为我们没有从查询日志中提取的术语集的更大的文本上下文。使用其他经验方法来建立语义局部性,如焦点小组、访谈或外行和家庭医生的调查,超出了本试点研究的探索性范围。

步骤4。我们为metthesaurus, Eurodicautom和European Glossary创建了扩展,使用了来自DARE的术语。我们将DARE术语作为一个组链接到每个词汇表资源,作为通用术语的近义词糖尿病.尽管在某些情况下,民间信仰体系和相关词汇在医学意义上极其精确[6],我们采用了这种保守的方法,以避免赋予民间术语不适当的特定含义。然而,这种保守的方法可能与[26在某些情况下,那些声称自己拥有的人对自己的疾病有不同的健康信念吗糖尿病糖尿病

第5步。由于我们在本地关系数据库中维护了Metathesaurus和European Glossary,我们能够轻松地自动搜索这些数据库。我们使用规范化的字符串匹配在Metathesaurus和European Glossary的DARE扩展中搜索消费者术语和医生术语。与术语相关联的规范化字符串是通过对携带术语的字符串进行基于规则的转换产生的,例如,字符串眼科医生携带这个词眼科医生.根据这套规则

  1. 使复数变为单数
  2. 把单词按字母顺序排列;

它可以被规范化为字符串医生的眼睛.规范化的字符串匹配通过防止匹配被微小的词汇变化阻塞而允许更自由的术语到术语的匹配。我们使用UMLS NORM程序为metthesaurus和European Glossary的DARE扩展创建了规范化字符串索引[39].然后,我们规范化了消费者和医生术语,并将它们与规范化字符串索引中的字符串匹配。

步骤6。Eurodicautom仅通过Web界面提供,因此我们无法对其进行规范化字符串匹配(根据来自J Vega J的一封电子邮件,关于Eurodicautom的问题和反馈的官方联系,2001年4月)。相反,我们使用Eurodicautom界面来执行全单词加上下文的搜索,以及仅在不匹配的情况下截断英语搜索。在这些搜索中,如果一个词的所有组成词都包含在欧洲术语中,则该词将被匹配。截断的使用在轻微的词汇变化的情况下提供匹配。我们创建了一个DARE术语表(已链接到Eurodicautom术语)和一个规范化字符串索引。我们在欧洲词典的DARE扩展中搜索消费者和医生术语。

步骤7。接下来,我们收集了直接或间接包含在这3个词汇资源的DARE扩展中的成对消费者和医生术语。有些消费者术语和医生术语通过字符串匹配直接匹配词汇表资源,而有些仅通过语义邻域间接匹配。例如,消费者术语糖尿病的饮食直接匹配,而消费者术语糖尿病患者的食物只间接匹配;糖尿病患者的食物间接匹配的,因为它是同义的,几乎同义的,或密切相关的糖尿病的饮食.我们说消费者-医生-术语对是直接覆盖当发生以下两种情况时,通过词汇表资源:

  • 消费者术语和医生术语都通过字符串匹配直接与词汇表资源匹配
  • 词汇资源根据其内部指定的规则和结构,将所包含的消费者术语和所包含的专业术语定位在同一语义邻域。

我们认为,对于异义龙来说,当其中一个术语与同一个元概念相关联,或者与根据异义龙相关元概念(MRREL)表相关的不同元概念相关联时,第二个条件得到满足。对于Eurodicautom,当术语与同一个Eurodicautom条目相匹配时,我们认为满足了第二个条件——对于European Glossary也是如此。

一对是间接覆盖当两个术语都与另一对直接覆盖的术语匹配时,但至少有一个匹配是间接的。提供的词汇资源部分间接覆盖当一对中只有一个成员直接匹配时,它提供完全间接覆盖当两个人都不直接匹配时。

为了为我们的第一个研究问题提供初步结果,我们比较了直接和间接与3个资源的DARE扩展匹配的消费者术语和医生术语的数量,以及直接和间接覆盖的消费者术语-医生术语-术语对的数量。

步骤8。为了为我们的第二个研究问题提供初步结果,合著者T.B.P.选择了5对由《异义词典》、《欧洲词典》或《欧洲词汇表》部分或间接覆盖的词汇。对于其中的每一对,消费者术语是间接匹配的,而医生术语是直接匹配的。tbp在www.altavista.com上使用每一对的消费者术语和医生术语进行了精确的短语搜索。为了更好地区分消费者术语和医生术语的检索效果,使用了精确短语搜索。消费者期的结果与医生期的结果进行了比较。研究人员比较了他们各自由非营利医疗专业组织、学术组织或政府组织维护的相关网站的数量。由于坊间证据表明,消费者很可能只看网络搜索引擎返回的结果的前几页,对于任何给定的搜索,我们只检查了列出的前20个结果。如果站点不可用,则不计算该站点,我们将来自同一个Web站点的2个或更多页面视为单个站点。


研究问题1的结果

我们的原始数据包括909个消费者术语(例如,临界糖尿病糖dibetes苏格糖尿病)和938个内科术语(例如,胰岛素不敏感而且糖尿病流程图).我们纠正了拼写并合并了重复的术语。然后,我们选择了86个消费者术语,并将它们与125个医生术语进行匹配,共225对术语。表1显示术语对示例。

表1。示例消费者术语和医生术语对
消费者的术语 医生的术语
糖尿病患者的食物 糖尿病人的健康饮食
糖尿病患者的食物 糖尿病人饮食计划
糖尿病食谱 糖尿病人的健康饮食
糖尿病食谱 糖尿病人饮食计划

我们直接将27个消费者术语与变义龙的DARE扩展进行了匹配,27个消费者术语与欧洲词汇的DARE扩展进行了匹配,5个消费者术语与欧洲词汇的DARE扩展进行了匹配。我们间接地将13个消费者术语与mettathesaurus的DARE扩展进行了匹配,11个消费者术语与Eurodicautom的DARE扩展进行了匹配,1个消费者术语与欧洲词汇表的DARE扩展进行了匹配。

我们直接将39个医生术语与变义龙的DARE扩展词进行了匹配,23个医生术语与欧洲词汇的DARE扩展词进行了匹配,2个医生术语与欧洲词汇的DARE扩展词进行了匹配。我们间接地将29个医师术语与变义龙的DARE扩展词相匹配,7个医师术语与欧洲词汇的DARE扩展词相匹配,没有医师术语与欧洲词汇的DARE扩展词相匹配。

Metathesaurus的DARE扩展直接覆盖了17对消费者术语-医生术语对,为22对提供了部分间接覆盖,为12对提供了完全间接覆盖。Eurodicautom的DARE扩展直接覆盖8对,部分间接覆盖19对,完全间接覆盖9对。DARE对欧洲词汇表的扩展直接覆盖了2对,对1对提供了部分间接覆盖,对没有对提供了完全间接覆盖。表2展示了直接和间接涵盖的术语对的示例。

表2。直接和间接涵盖的术语对示例
消费者的术语 医生的术语 扩展Metathesaurus 扩展Eurodicautom 扩展的欧洲术语
糖糖尿病患者 糖尿病 部分间接 部分间接 部分间接
糖尿病 糖尿病 直接 直接 直接
糖尿病 糖尿病 直接 直接 直接
糖尿病食谱 糖尿病饮食 部分间接 部分间接 不包括
糖尿病患者的食物 糖尿病人的健康饮食 完整的间接 部分间接 不包括
为糖尿病患者准备的食物 糖尿病人的健康饮食 完整的间接 完整的间接 不包括
糖尿病饮食 糖尿病饮食 直接 直接 不包括

研究问题2的结果

表3比较了www.altavista.com上消费者术语和医生术语的网络搜索结果。的质量(在前20个结果中)“结果”下的列包含由非营利医疗保健专业组织、学术组织或政府组织维护的前20个搜索结果中的站点数量。在每种情况下,医生术语产生的结果比消费者术语包含更多这样的位点。

表3。部分间接覆盖的消费者术语搜索结果和医生术语搜索结果的比较
消费者的术语 医生的术语 提供部分间接覆盖的词汇资源
术语 结果 术语 结果
总计 质量*(前20个结果中) 总计 质量*(前20个结果中)
糖尿病食谱 457 1 糖尿病饮食 83778年 2
Metathesaurus;Eurodicautom
糖尿病患者的食物 One hundred. 0 糖尿病饮食 83778年 2
Metathesaurus;Eurodicautom
儿童糖尿病 2016年 1 青少年糖尿病 18482年 6 Eurodicautom
糖尿病怀孕 562 0 妊娠期糖尿病 13498年 2 Metathesaurus
糖糖尿病患者 92 0 糖尿病 1038268年 6

Metathesaurus;Eurodicautom;欧洲的术语表
组织

我们的第一个研究问题的结果对变焦龙的DARE扩展似乎有些希望。变义龙的DARE扩展直接或间接地覆盖了大约23%的自然语言消费者术语-医生术语

对。Eurodicautom扩展提供的结果不太有希望,因为它只覆盖了16%的术语对。(欧洲词汇表的结果可以忽略不计。)然而,我们总体上有希望的发现是,变义龙和欧氏亚种的扩展都间接覆盖了比直接覆盖更多的对。覆盖词对的比例很高,间接覆盖词对多于直接覆盖词对,这可能是对昂贵的受控词汇资源的有效使用,用于医疗保健交流。

第二个研究问题的结果也多少有些希望。尽管样本规模较小,但在每种情况下,对于由非营利医疗保健专业组织、学术组织或政府组织维护的网站,自然语言医生术语比消费者术语产生了更好的结果。这表明变义龙和欧语的DARE扩展可以用来提供从自然语言消费者术语到自然语言医生术语的有用链接。有人可能会说,这些结果并不是特别有意义,因为

我们使用术语而不是实际的消费者查询来进行研究

由非营利性医疗保健专业人员、学术机构或政府组织维护的站点并不是站点质量的一个确定指标。

针对第一点,我们指出,我们在www.altavista.com查询中使用的一些术语是从较长的消费者电子邮件消息中提取出来的,还有一些用于对Web信息站点的实际查询。这些术语反映了消费者实际使用的术语,尽管必须承认,只有后者才能表示实际的消费者Web查询(受制于前面提到的限制)步骤1,关于他们的血统外行条款)。我们确实更正了一些消费者术语的拼写。然而,拼写错误对检索的影响尚不清楚,这是我们目前研究的一个主题。最后,许多接受自然语言输入的Web搜索程序从自然语言输入中提取术语并使用它们进行检索,就像我们在研究中所做的那样。

针对第二点,我们同意由专业、学术或政府机构维护的地盘,并不能保证地盘的品质是高的,但如研究概述我们认为这样的维护可以增加高质量的可能性。

研究的局限性

虽然我们的研究结果很有希望,但它们在几个方面都有局限性。我们的研究的一个局限性是www.altavista.com,像大多数搜索引擎一样,不限制其精确短语结果为真正精确短语的结果,但也会报告短语中的单词包含在文档中,但不是紧挨着彼此的结果。因此,我们的结果并没有严格区分消费者术语和医生术语的检索效果。然而,我们的结果确实反映了消费者实际面临的情况,并在某种程度上表明了消费者和医生术语的相对有效性。

该研究的另一个局限性是,我们的消费者术语来源之一Web查询日志不能将术语共现作为语义位置的可量化度量,也不能用于将术语聚类到语义邻域的其他数据。但是,也许更重要的是,我们没有根据来自消费者和医生调查的其他定量证据来评估最终的术语对,也没有根据来自焦点小组和消费者和医生访谈的定性证据来评估它们。因此,即使根据我们在这个项目中使用的质量标准,术语对似乎有用,但它们可能并没有更普遍的用处,因为它们可能没有构成从消费者语言到家庭医生语言的适当意义保留(或意义扭曲)步骤。

最后,虽然这项研究可以部分作为更大规模的消费者医疗保健信息获取研究的试点,但这项研究的一个普遍局限性是我们只关注网络,而没有解决其他医疗信息的使用场所,如报纸、杂志和电视。我们认识到,如果消费者要获得支持其个人健康保健决定所需的信息,这些其他来源和格式的健康信息也需要类似的调查。事实上,正如我们在一开始所说的,我们一直在考虑的双向通信问题比Web和数字鸿沟更根本。医生、病人教育专业人员和消费者需要做更多的工作,以进一步阐明这些问题的程度,并制定解决问题的方法。

致谢

该项目得到了国家医学图书馆LM07089的部分资助。的美国地区英语词典由国家人文基金会和国家科学基金会资助,编号89- 08905,94 -08728和97-2906。

利益冲突

没有宣布。

  1. ;美国卫生与公众服务部。2010年健康人:了解和改善健康,第二版。华盛顿特区:卫生与公众服务部;2000年11月1日。
  2. ;国家癌症研究所。癌症交流研究的卓越中心。rfa - ca - 01 - 019年出版。URL:http://grants.nih.gov/grants/guide/rfa-files/RFA-CA-01-019.html[2001年6月访问]
  3. ;国家癌症研究所。癌症研究的科学重点:非凡的机遇。URL:http://plan2002.cancer.gov/scpcomms.htm[2001年6月访问]
  4. 泰勒H.哈里斯民意调查第44名:“网络疑病症患者”的爆炸式增长仍在继续。2000年9月11日。URL:http://www.gsbc.com/harris_poll/index.asp?PID=104[2001年5月进入]
  5. Brodie M, Flournoy RE, Altman DE, Blendon RJ, Benson JM, Rosenbaum MD.健康信息,互联网和数字鸿沟。卫生事务人员(米尔伍德)2000年12月;19(6):255-265 [免费全文][Medline][CrossRef
  6. Burnum摩根富林明。方言是诊断性的。安实习医学1984年6月;100(6):899-901。[Medline
  7. 雪低频。民间医学信仰及其对病人护理的影响。这篇综述基于对美国黑人的研究。安实习医学1974 7月;81(1):82-96。[Medline
  8. 舒格曼J,巴特斯RR。了解病人:医生可能不知道的医学词汇。中华医学杂志1985 7月;46(7):415-417。[Medline
  9. 达菲FD。对话:临床核心技能。安实习医学1998年1月15日;128(2):139-141 [免费全文][Medline
  10. 三文鱼P,彼得斯S,斯坦利I.患者对躯体化障碍的医学解释的看法:定性分析。英国医学杂志1999 Feb 6;318(7180):372-376 [免费全文][PMC][Medline
  11. 斯凯尔顿JR,霍布斯FD。初级保健咨询中男女医生合作语言的描述性研究。英国医学杂志1999年2月27日;318(7183):576-579 [免费全文][PMC][Medline
  12. 与病人沟通。专业培训应该包括沟通技巧。中国医学杂志1999年1月2日;[Medline
  13. 李志刚,李志刚。糖尿病患者的认知障碍。病人和医生对疾病的不同看法。中国生物医学工程杂志,2000年6月;49(6):507-512。[Medline
  14. 文盲:卫生保健的无声障碍。Ann实习医学1999 Feb 16;130(4 Pt 1):333-336 [免费全文][Medline
  15. 有效的患者教育:增加依从性指南,第二版。Gaithersburg MD: Jones & Bartlett Publishers;1994年1月15日。
  16. Leichter SB, Nieman JA, Moore RW, Collins P, Rhodes A.糖尿病患者自我护理教学手册的可读性。糖尿病护理1981 Dec;4(6):627-630。[Medline
  17. Reid JC, Klachko DM, Kardash CA, Robinson RD, Scholes R, Howard D.为什么人们不从糖尿病文献中学习:文本和读者特征的影响。患者教育杂志1995 Feb;25(1):31-38。[Medline][CrossRef
  18. Hardie GE, Janson S, Gold WM, Carrieri-kohlman V, Boushey HA。种族差异:非裔美国人和白人哮喘患者在诱导支气管收缩期间使用的词描述符。胸部2000年4月;117(4):935-943 [免费全文][Medline][CrossRef
  19. 韦兰·SK, Kugler J, Von Mutius E, Schmitz N, Fritzsch C, Wahn U,等。[儿童哮喘患者的语言。症状描述研究]。中华儿科杂志1993年11月30日(11):878-882。[Medline
  20. 马勒DA,哈维a,你会说呼吸困难的语言吗?胸部2000年4月;117(4):928-929 [免费全文][Medline][CrossRef
  21. 莫文明,李志强,李志强。雾化沙丁胺醇治疗急性哮喘患者呼吸困难的语言评估。Am呼吸危重症护理医学1998年9月;158(3):749-753 [免费全文][Medline
  22. Flynn CA, Barash A.非裔美国哮喘患者对哮喘症状的感知和描述与白人哮喘患者不同吗?J Fam practical 2000 8月;49(8):688,759。[Medline
  23. Hornberger J, Itakura H, Wilson SR.弥合医患之间的语言和文化障碍。公共卫生报告1997年10月;112(5):410-417。[Medline
  24. 吴晓明,王晓明,王晓明。美国医学语言障碍的研究。中国医学杂志,1995年3月1日;273(9):724-728。[Medline][CrossRef
  25. ;德克萨斯癌症委员会。为非裔美国人开发视听癌症教育材料的实用指南。URL:http://tcdc.uth.tmc.edu/pgavemaa/6.4.html[2001年6月访问]
  26. 肖林JB,桑德斯JT。“糖”和糖尿病一样吗?一项以农村非裔美国人为基础的研究。糖尿病护理2000 3月23日(3):330-334 [免费全文][Medline
  27. Sievert ME, Patrick TB, Reid JC。流鼻血需要是流鼻血吗?或者,词汇变体会导致令人惊讶的结果。牛医学杂志2001年1月;89(1):68-71。[PMC][Medline
  28. ;美联社。费拉罗与血癌作斗争。哥伦比亚每日论坛报2001年。2001年6月19日。p.第8A节URL:http://archive.showmenews.com/2001/Jun/20010619News013.asp[2001年8月访问]
  29. ;卫生首脑会议工作组。评估互联网卫生信息质量的标准——政策文件。URL:http://hitiweb.mitretek.org/docs/policy.pdf[2001年5月进入]
  30. 伍JC。互联网上关于妇女健康信息的质量。《妇女健康》1997年10月6日(5):575-581。[Medline
  31. Oermann MH, Wilson FL.因特网上为消费者提供的护理质量信息。中华护理质量杂志2000七月;14(4):45-54。[Medline
  32. 阿德尔哈德K,奥布斯特O.医疗互联网网站的评估。方法Inf 1999 Jun;38(2):75-79。[Medline
  33. 兰开斯特弗兰克-威廉姆斯。信息检索中的词汇控制。弗吉尼亚州阿灵顿:信息资源出版社;1986年2月1日。
  34. Brown PJ, Price C, Sonksen PH.评估支持多学科糖尿病护理的术语需求。1997:645-649。[Medline
  35. 布朗PJB,普莱斯C,考克斯YM。患者语言-评估其与临床同义词库的关系。Proc AMIA年度秋季会议1997:917。
  36. 杨晓东,陈晓东,张晓东,等。将条目词汇映射到不熟悉的元数据词汇。D-Lib杂志,1999年。(1)网址:http://www.dlib.org/dlib/january99/buckland/01buckland.html[2001年8月访问]
  37. 琼斯JH。坏血:塔斯基吉梅毒实验,修订版。纽约:自由出版社;1993年1月15日。
  38. Bodenreider O, Nelson SJ, Hole WT, Chang HF。超越同义词:在映射词汇表中利用UMLS语义。Proc AMIA symp1998:815-819。[Medline
  39. ;国家医学图书馆。UMLS知识来源,2000年第11版。
  40. ;欧洲委员会翻译服务。Eurodicautom。URL:http://eurodic.ip.lu/cgi-bin/edicbin/EuroDicWWW.pl[2001年8月访问]
  41. ;欧洲委员会。九种欧洲语言的多语言技术和流行医学术语表。URL:http://allserv.rug.ac.be/~rvdstich/eugloss/welcome.html[2001年5月进入]
  42. 卡西迪FG。美国地区英语词典。马萨诸塞州剑桥:哈佛大学出版社贝尔纳普出版社;1985年,第1卷。
  43. 卡西迪FG。美国地区英语词典。马萨诸塞州剑桥:哈佛大学出版社贝尔纳普出版社;1991年第2卷。
  44. 卡西迪FG。美国地区英语词典。马萨诸塞州剑桥:哈佛大学出版社贝尔纳普出版社;1996年第3卷。
  45. ;敢。美国地区英语词典。URL:http://polyglot.lss.wisc.edu/dare/dare.html[2001年5月进入]
  46. Biber D, Conrad S, Reppen R.语料库语言学:研究语言结构和使用(剑桥语言学方法)。英国剑桥:剑桥大学出版社;1998年4月23日。


记者:美联社
疾病预防控制中心:疾病控制中心
敢:美国地区英语词典
IRB:院校检讨委员会
NCI:国家癌症研究所
uml:统一医学语言系统
我们:美国


G·艾森巴赫(G Eysenbach)编辑;提交16.05.01;W赫什、P布朗同行评议;作者评论05.06.01;修订版本收到20.07.01;接受08.08.01;发表28.08.01

版权

©Timothy B Patrick, Harpreet K Monga, MaryEllen C Sievert, Joan Houston Hall, Daniel R Longo。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2001年8月28日。除非另有说明,发表在《医学互联网研究杂志》上的文章都是根据创作共用署名许可协议(http://www.creativecommons.org/licenses/by/2.0/)发布的,该协议允许在任何媒体上不受限制地使用、分发和复制,前提是正确引用原创作品,包括完整的书目细节和URL(参见上面的“请引用”),并包括本声明。

Baidu
map