这是一篇开放获取的文章,根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR医学信息学上的原创作品。必须包括完整的书目信息,http://medinform.www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。
医疗保健信息专业人员在弥合医学研究和临床实践之间的知识差距方面发挥着关键作用。他们的工作包括使用复杂的搜索策略对文献数据库进行细致的搜索,这些策略可能包含数百个关键字、操作符和本体术语。这个过程很容易出错,如果执行不正确,会导致效率低下和偏差。
本研究的目的是调查医疗保健信息专业人员的搜索行为,揭示他们对信息检索系统的需求、目标和要求。
通过专业协会电子邮件讨论列表向医疗保健信息专业人员分发了一项调查。它调查了他们所承担的搜索任务,他们制定搜索策略的技术,他们评估搜索结果的方法,以及他们搜索图书馆式数据库的首选功能。然后对流行文献搜索系统PubMed进行评估,以确定他们的需求得到满足的程度。
107名受访者表示,他们的信息检索过程依赖于使用复杂的、可重复的和透明的搜索策略。制定一个搜索策略平均需要60分钟,一个搜索任务需要4个小时,由15条策略线组成。受访者在每个搜索任务中查看了175个结果,远远超过了他们理想的结果(100个)。搜索系统最理想的特性是合并搜索查询和组合搜索结果。
医疗保健信息专业人员经常解决一些最具挑战性的信息检索问题。然而,目前的文献搜索系统并不能完全支持他们的需求,而且还需要改进功能,特别是在搜索策略的开发和管理方面。
医学知识增长如此之快,以至于医疗专业人员很难跟上。由于发表的研究数量每年都在增加[
医疗保健信息专业人员在缩小已发表的研究和医疗实践之间的差距方面发挥着主要作用,他们将复杂、不完整、有时相互矛盾的生物医学研究结果综合成一种形式,可以随时为医疗保健决策提供信息[
注意缺陷多动症/
注意力缺陷多动症
addh
抗利尿激素
hyperactiv美元
hyperkin美元
注意力缺陷美元
大脑功能障碍
或/ 1 - 8
孩子/
青少年/
儿童美元,男孩美元,女孩美元,学龄儿童美元,青少年美元,青少年美元,年轻人美元,青少年美元
或/ 10 - 12
针灸疗法/或针灸,耳针/或电针/
accupunct美元
或/ 14日至15日
9 13 16
进行系统评审是一项耗费资源和时间的工作,有时需要数年才能完成[
已经进行了大量研究,以调查医疗保健信息检索过程,并更好地理解战略制定所涉及的挑战,因为已经注意到在线医疗资源不是由医疗保健专业人员创建的[
没有一个数据库可以覆盖系统综述所需的所有医学文献,尽管有些被认为是任何医疗保健搜索策略的核心要素,例如MEDLINE [
调查[
为了提高文献搜索过程的准确性和效率,必须将信息检索应用程序(在本例中是医学文献数据库和访问它们的接口)设计为支持用户的任务、需求和期望。要做到这一点,他们应该考虑影响搜索任务的上下文层次[
本研究涉及的具体研究问题是(1)由医疗保健信息专业人员执行搜索任务需要多长时间?(2)他们如何制定搜索策略,使用什么样的搜索功能?(3)如何评估搜索结果?(4)他们看重文献搜索系统的哪些功能?(5) PubMed文献检索系统在多大程度上满足了他们的需求和愿望?
在回答这些研究问题时,我们希望提供与其他职业的直接比较(例如,在结构、复杂性和搜索任务的持续时间方面)。
调查工具为在线问卷,共58个问题,分为5个部分。它的设计与Joho等人的结构和内容一致[
调查计划在大约15分钟内完成,并由2名健康科学图书馆员进行了面部效度预测试。
通过向5个处理系统评论和医学图书馆的医疗保健专业协会邮件列表发送带有调查链接的电子邮件邀请来招募调查受访者:Lis-Medical [
这项调查(
对数字问题的回答并不局限于整数,因为一项试点调查表明,受访者更喜欢输入近似值和/或有表现力的值。与数字问题相对应的文本回答(问题14至22和32至38;共16个)归一化如下:(1)当受访者指定一个范围(例如,10至20小时)时,进入中点(例如,15小时);(2)当被访者指出最低年限(如10年及以上)时,填写最低年限(如10年);(3)当受访者输入一个大概的数字(例如,大约20),这个数字被输入(例如,20)。
归一化后,8.29%(142/1712)回复未包含数值数据,21.61%(370/1712)回复归一化。
使用在线文档对PubMed搜索系统进行了评估[
受访者中89.3%(92/103)为女性。年龄呈双模态分布,高峰为39 ~ 45岁和53 ~ 59岁,合并平均年龄为46.0岁(SD 10.9, N=104) (
受访者在其专业领域的经验平均时间为16.6年(标准差为10.0),大于他们在科学文献综述中的12.0年(标准差为9.0)经验(N=107)。
大多数受访者来自英国(51.4%,55/107)、美国(27.1%,29/107)或加拿大(7.5%,8/107)。其余受访者分别来自澳大利亚(2.8%,3/107)、荷兰、挪威和德国(1.9%,2/107),以及丹麦、新加坡、乌拉圭、南非、比利时和爱尔兰(0.9%,1/107)。所有(100.0%,107/107)受访者表示,他们最常用的搜索语言是英语;然而,6.5%(7/107)的受访者表示,他们在工作场所最常用的沟通方式不是英语。
大多数受访者(81.3%,87/107)在提供系统评审的组织中工作。这些机构还提供其他服务,包括参考资料管理(72.0%,77/107)、快速证据审查(63.6%,68/107)、背景审查(60.7%,65/107)和关键评估(52.3%,56/107)。
受访者年龄。
努力完成搜索任务并评估结果。
任务 | 最小值(差一个) | 平均(差) | 最大(差) |
每个文档集/数据库的搜索时间,分钟 | 20 (10 - 30) | 60 (27.5 -150) | 228年(86 - 480) |
搜索任务完成时间,小时数 | 1 (0.5 - 2) | 4 (2 - 6.5) | 14 (7-30) |
每个搜索任务的策略行数n | 5 (2.8 -10) | 15 (9.1 -30) | 59 (30 - 105) |
搜索任务检查的结果,n | 10 (5-32) | 175年(75 - 500) | 850年(400 - 5250) |
评估单个结果/文件相关性的时间,分钟 | 1 (0.5 - 2) | 3 (1 - 5) | 10(做) |
每个搜索任务的理想搜索结果数n | 0 | One hundred. | 10000年 |
一个IQR:四分位间距。
在这个上下文中,我们认为搜索任务是创建一个或多个策略行来搜索特定的文档或数据库集合,任务完成将产生一组搜索结果,这些结果将被进一步分析。这个过程的输出是搜索策略,它通常作为搜索文档的一部分发布。这种合理化符合医疗保健信息专业人员的理解,但稍后将更详细地讨论该领域搜索任务的复杂性。
表中显示了制定搜索策略所花费的时间,受访者完成搜索任务所花费的时间,以及他们使用的策略线的数量
检索频率最高的数据源为MEDLINE(96.3%, 103/107)、Cochrane Library(87.9%, 94/107)和Embase (80.4%, 86/107) (
大多数受访者(86.9%,93/107)至少有时会使用以前的搜索策略或模板,这表明它们所体现的价值是被认可的,应该在任何可能的情况下重新使用。此外,大多数受访者(89.7%,96/107)经常以某种形式分享他们的搜索策略,或与工作组中的同事分享,或更广泛地在组织内分享,或以其他身份分享(例如与客户分享或作为发表评论的一部分)。
我们通过要求受访者使用李克特5分制(从1(强烈不同意)到5(强烈同意))表示对陈述的同意程度,来检查查询制定过程的机制。结果显示在
当被问及经常使用哪些分类法时,74.8%(80/107)的受访者表示他们使用MeSH, 45.8% (49/107) Emtree, 18.9% (20/107) CINAHL标题。
当被问及他们使用哪种技术组合来创建搜索策略时,44.9%(48/107)的人表示他们使用基于表单的查询构建器,41.1%(44/107)的人在纸上手动创建,40.2%(43/107)的人使用文本编辑器。只有9.3%(10/107)使用某种形式的可视化查询生成器。
受访者表示,搜索任务返回的理想结果数量是100个文档,但实际上他们会评估更多的结果(中位数为175个文档;
受访者被要求以李克特5分制表示他们使用搜索限制和限制标准来缩小搜索结果的频率。结果显示在
我们还研究了受访者检查搜索结果的策略。最流行的方法是“从看起来最相关的结果开始”(54.2%,58/107)或简单地“选择第一个结果”(23.4%,25/107)。没有受访者建议选择“最值得信赖的消息来源”。
受访者被问及哪些类型的活动[
最常搜索的数据源。
查询公式功能的重要性。
限制标准的使用。
受访者在完成搜索任务时所参与的活动。
一个文献检索系统的理想特性。
我们还研究了受访者在执行搜索任务时所看重的与搜索管理、组织和历史相关的其他特征。受访者被要求使用李克特5分制,从1(非常不同意)到5(非常同意)表示对一项陈述的同意程度。结果显示在
在这里,对“如何为您改进创建和管理搜索策略的过程”这个问题的逐字回答的结果的含义?”进行了讨论,研究结果与PubMed文献搜索系统相关。
受访者表示,他们投入了相当多的时间执行搜索任务和编写搜索策略。搜索一个文档集合的时间(60分钟)表明,他们的搜索策略比大多数文献搜索查询更复杂,因为PubMed上90%的个人查询耗时不到5分钟[
这种搜索工作经常被循环利用,并定期共享,这表明需要设施来管理和共享策略,例如:“……能够下载、分享、混音、转移和翻译搜索策略。”PubMed不提供共享搜索查询的功能,只提供引用集合形式的结果。
结果是
PubMed提供了中描述的大部分查询公式功能
先前的一项研究表明,多达90%的已发表策略包含错误[
搜索功能
语法检查:“…自动检查括号、操作符和字段代码…”
截断:“单词开头的通配符;一个单词内的通配符(替换单个或多个字母,例如$ aesthetic或wom$n)
拼写错误:“…account for拼写错误…”和“英式/美式拼写…”
接近性:“……在句子中解释接近性,而不是越过标点符号的限制。”
术语频率和位置:“…仅在摘要的第一个和/或最后一个句子中的术语”
否定:“…不排除冠词的否定概念之前有一个否定。“姑息治疗”将排除诸如“在这项研究中我们没有考虑到姑息治疗”这样的句子的摘要。
PubMed允许用户使用HTML表单来捕获查询,然后在下面列出之前的查询,以便用户制定越来越复杂的复合策略。假设这里的搜索任务所需的平均策略行数为15,这种查询构造方法对于用户来说可能会变得越来越复杂和难以理解和操作。只有5.7%(10/176)的受访者表示使用了可视化查询构建器,这表明医疗保健信息专业人员在直观构建复杂搜索查询方面的支持非常少。他们还表达了对高级编辑功能的渴望,特别是:
移动搜索线上下历史…
能够添加标签或描述搜索策略,按名称,主题或日期排序的能力…
记下你添加术语、语法等的原因。
很明显,受访者通常在多个平台上工作,特别是MEDLINE、Cochrane和Embase,这与之前的研究结果一致[
100个平均(中位数)理想搜索结果的数字掩盖了数据的非参数性质;所获得的搜索结果数量可能会因该领域的主题和可获得的文献而有很大差异[
考虑到要分析的一些文档的长度,评估每个结果的时间(3分钟)似乎很短。然而,搜索任务是一个更长的过程的第一个阶段,在这个过程中,检索到的文档将暴露在进一步的评估阶段(
发表日期被认为是最重要的结果筛选标准,其次是发表语言(
没有受访者重视最可靠来源的分类,这一事实与另一项医疗保健行业研究中使用的策略形成了鲜明对比[
受访者对所有理想功能选项的评分都很高,这表明他们普遍希望获得高级搜索功能。组合搜索查询和组合搜索结果被评为最重要的,这反映了当前构建搜索查询的范式(即,包括PubMed在内的大多数数据库提供的逐行策略构建方法)。参与者对导出搜索查询(历史)的能力评价很高,这反映出他们需要将发布完整的搜索策略作为其专业实践的一部分。
中描述的所有功能
一个原因可能是PubMed试图迎合广泛的用户知识(大约三分之一的PubMed用户不是领域专家[
这项调查的一个局限性是与一些医疗保健信息专业人员的调查相比,样本量大[
这项研究的另一个局限性是,受访者是否完全理解我们在搜索任务和搜索策略之间的区别(这遵循了以前调查设计的先例,因此便于与他们的结果进行直接比较)。对其他文献搜索工具(如Ovid)的额外评估将为医疗保健信息专业人员提供更广泛的功能调查;然而,由于PubMed是受访者最常使用的工具,它更能代表他们所拥有的工具。对医疗保健领域可用的免费和订阅搜索工具的全面调查将是有用的未来工作。尽管有这些限制,我们相信这项研究为医疗保健信息专业人员的需求提供了有价值的见解。
本文总结了医疗保健信息专业人员的信息检索实践的调查结果,特别关注搜索策略开发的过程。我们的研究结果表明,它们常规地解决了任何职业中一些最具挑战性的信息检索问题,但目前的文献搜索系统仅对其需求提供了有限的支持。PubMed提供的功能在一定程度上满足了这些需求,但由于需要为所有类型的用户提供服务,这些用户可能不需要对他们的搜索策略进行同样程度的精细控制。特别是,需要改进搜索策略管理的功能和跨多个数据库进行搜索的能力。
本研究的结果将用于为医疗保健信息专业人员和其他执行医疗保健相关搜索任务的人提供未来检索系统的开发信息。
调查工具。
作者要感谢完成调查的参与者,向其成员分发调查的专业协会,以及帮助制定调查工具并为结果提供背景的医疗保健信息专业人员。
没有宣布。