这是一篇开放获取的文章,根据创作共用署名许可协议(http://creativecommons.org/licenses/by/2.0/)发布,该协议允许在任何媒体上不受限制地使用、分发和复制,前提是要正确引用最初发表在《医学互联网研究杂志》上的原始作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物链接,以及版权和许可信息。
一般消费者在线搜索日志中的模式已被用于监测健康状况和预测与健康相关的活动,但消费者进行在线搜索的多个上下文使得难以解释重大关联。医生信息寻求行为通常通过基于调查的方法和文献综述进行分析。因此,使用在线医疗信息资源的卫生保健专业人员的活动日志是一种有价值但相对未开发的大规模医疗监测资源。
分析医疗保健专业人员的信息寻求行为,并评估从在线医疗信息资源的使用日志中衡量药物安全警报响应的可行性。
使用UpToDate两年(2011-2012年)的使用日志,我们测量了美国与负担沉重的医疗条件相关的搜索量,以及这些搜索的季节性分布。我们量化了搜索结果和页面浏览量之间的关系。使用大量的在线主流媒体文章和Web日志文章,我们还通过UpToDate搜索活动与与警报主题相关的一般在线媒体活动的变化来描述食品和药物管理局(FDA)警报的吸收情况。
疾病和症状在最新搜索中占主导地位。一些搜索只会导致短时间的页面浏览量,而另一些搜索则会导致比平均时间更长的页面浏览量。FDA对Celexa警告的反应,以UpToDate搜索活动的变化为特征,与一般的在线媒体活动有很大不同。在UpToDate日志中,搜索活动的变化出现得较晚,且持续时间较长。与Celexa相关的搜索量和页面浏览时长在警报前和警报后也有所不同。
了解与在线证据来源相关的信息寻求行为可以洞察卫生专业人员的信息需求,并实现大规模医疗监测。我们的Web日志挖掘方法有可能在国家层面上监测对FDA警报的响应。我们的发现也可以为UpToDate等循证医学信息资源的设计和内容提供信息。
在互联网上搜索和消费医疗信息资源在消费者和医护专业人员的日常信息查询活动中占据越来越重要的地位[
分析Web搜索行为的固有挑战是用户的多样性。Web搜索日志捕获了一个基本没有特征的用户组的广泛在线行为,该用户组在未知的上下文中执行搜索。大多数分析Web日志的工作都集中在消费者搜索行为上。事实上,最近的方法试图在分析中辨别和分离来自卫生保健专业人员的搜索[
相比之下,对卫生保健专业人员搜索行为的分析通常集中于文献综述或基于调查的方法[
UpToDate使用的日志捕获源机构和一个唯一的已识别会话、输入的搜索字符串、搜索的时间和日期、搜索的类型以及作为搜索结果访问的主题页面。使用这些访问日志,我们分析了用户执行的自由文本搜索以及他们如何导航UpToDate主题页面。我们分析了UpToDate在全国的使用情况,并从信息寻求的角度量化了医疗条件与成本和利用率的关系。我们还通过搜索词和后续页面浏览时长之间的关系来描述信息寻求行为——这是一个被充分研究的用户兴趣指标[
在下面的小节中,我们将描述分析来自UpToDate搜索日志的自由文本搜索和页面视图序列的方法。然后,我们展示了最新免费文本搜索的季节性分布,以及按身体系统、健康状况和症状、药物、医疗设备和程序进行搜索的分布。我们还通过UpToDate搜索和页面浏览量的频率和持续时间的变化来描述FDA药物警报的接收情况。最后,我们讨论了我们的研究结果,描述了我们方法的局限性,并提出了未来的工作。
为了分析医疗保健专业人员的在线搜索行为,我们使用了UpToDate的2年使用日志,从2011年1月到2012年12月。我们使用文本挖掘和统计方法相结合的方法来分析这些日志,以确定搜索的总体趋势,发现搜索词与后续访问UpToDate主题页面(“主题视图”)的时长之间的关联,以及主题视图序列中的模式,并监测卫生保健专业人员对FDA警报的吸收情况。在接下来的小节中,我们将描述搜索日志的结构、文本挖掘方法和分析UpToDate用户行为的方法,以及识别搜索和主题视图中的模式的方法。
单个UpToDate用户事件的日志由以下部分组成:(1)查询字符串,(2)惟一会话ID,(3)搜索位置,(4)搜索的时间戳,以及(5)操作类型(例如,当用户单击UpToDate页面中的链接时,在网站搜索栏中进行的字符串搜索,主题视图或子主题视图记录)。
我们限制了这个数据集,只考虑在美国购买了UpToDate许可证的网站上执行的搜索或页面浏览量(即,我们排除了UpToDate的试用版或营销版用户,以及在美国以外的计算机上执行的搜索)。使用的数据集包含2.12亿个搜索查询及其对应的主题视图。
我们使用之前描述的文本处理工作流的变体处理所有自由文本搜索[
使用文本处理管道的输出,我们计算了所有使用日志中每个术语出现的频率,并使用这些频率来分析医疗保健专业人员搜索UpToDate的方式。我们首先使用以下特征分析了搜索行为:季节性、搜索时间长度、身体系统、医疗概念类别,以及2011年和2012年关于医疗条件的费用和出院率的全国统计数据。我们使用与每个搜索相关联的时间戳来按月和年聚合搜索。我们使用术语中的概念映射来标识10个主要身体系统的术语集:心血管、呼吸、消化、内分泌、血液和免疫、皮肤、肌肉骨骼、口腔和下颌、神经和泌尿生殖系统。使用这些术语集,我们统计了包含与给定身体系统相关的任何术语的搜索次数。使用术语中的概念映射,我们确定了最常搜索的疾病/症状、药物、设备和程序术语,并对每个身体系统的这些类别的分布进行量化,以评估作为数据源的搜索日志的全面性。
为了探索搜索行为和美国医疗状况的全国趋势之间的关系,我们从对应于医疗成本和利用项目(HCUP)临床分类系统(CCS)代码的词典中创建了自定义术语集。我们从构成每个CCS代码的国际疾病分类第9版(ICD-9)代码开始,收集了每个ICD-9代码的统一医学语言系统(UMLS)元词概念。然后,我们在更大的词汇库中利用术语-概念映射来扩展与这些概念相关的术语集(参见
HCUP CCS代码术语展开示例每个代码都表示为其ICD-9代码集。使用UMLS mettathesaurus扩展了原发性高血压的ICD-9代码,以识别映射到该概念的n个术语。这n个术语中的每一个(例如,“essential hypertension nos,”red)都用作对我们的自定义词典的种子查询,以识别其他概念及其术语。这里,“原发性高血压编号”映射到高血压疾病的概念,其附加的m-1术语(绿色)与n个种子术语结合使用,以识别对应于高血压的HCUP CCS代码的搜索。
我们使用所有搜索和主题视图的时间戳来确定在给定搜索之后的主题视图持续时间。主题视图持续时间是通过计算一个主题视图事件的时间戳与下一个事件的时间戳之间的差值来计算的——要么是搜索,要么是查看完全不同的主题。如果会话中的最后一个事件是一个主题视图,那么该主题视图事件将被排除在我们的分析的这一部分之外,因为如果没有后续用户操作的日志时间戳,就无法计算该主题视图的持续时间。根据在搜索后花费在所有主题页面上的时间的日志归一化分布,我们使用日志归一化持续时间值的平均值(转换回秒)作为决策边界,对花费在给定主题页面上的时间量进行分类。小于此边界的持续时间被分类为
我们将发起一个给定主题视图的所有搜索分组,以计算每个主题的长点击和短点击的比例,并确定导致一个主题视图的唯一搜索词的数量。我们还将来自一个独特搜索词的所有主题进行分组,以计算源自该搜索词的长点击和短点击的比例,以及每个搜索词引发的主题数量。
UpToDate内容结构为主题,每个主题都有一个专门的页面,其子部分包含更具体的信息。除了分析搜索文本之外,我们还使用日志来研究UpToDate用户在会话中如何从一个主题进展到另一个主题,并分析启动主题视图序列的搜索词。
UpToDate中用于分析查询序列和主题视图的方法概述。使用唯一的会话标识符,我们对查询和主题视图进行分组,并按出现时间(绿色表)对它们进行排序。识别频繁出现的主题视图序列(橙色框),以及启动它们的搜索词(蓝色框)。括号中的数字表示特定术语出现的频率。
2011年8月24日,FDA发布了一份警告,描述了与高剂量西酞普兰(商品名Celexa)相关的不良心血管事件的风险。我们检查了UpToDate日志中与同一时间段的消费者在线媒体活动相关的此警报的接收情况。我们使用大量的在线媒体收集来比较在UpToDate搜索日志和在线新闻媒体中与Celexa相关的词汇的相对频率。网络媒体集合包括2009年至2014年间发布在网络上的超过60亿篇在线新闻文章、新闻连线和博客文章[
我们从UpToDate日志中获得了新闻媒体集合中celxa相关搜索词的每日提及计数,以及特定一天中所有celxa相关搜索查询的每日累计计数。利用这些数据,我们计算出与Celexa相关的每日搜索查询总数的7天移动平均值。同样,我们计算了包含celex相关术语的在线媒体文章的日计数和7天移动平均值。为了支持UpToDate和在线新闻计数的覆盖,我们将UpToDate计数扩大了107.我们认为偏离2年时间内的平均发生次数是一个信号。
UpToDate的使用主要是对疾病状况和症状的搜索,并且显示出显著的季节性变化。查询量高的疾病和症状并不是对美国医疗保健系统负担最大的。例如,在研究期间,头痛和病毒感染是搜索最多的20种医疗状况之一,但它们的相对总成本和出院率较低。我们还发现,一些总费用较高的医疗条件和程序查询量较低,如心脏病发作和情绪障碍。按查询量排名前1%的机构负责美国约21%的查询,每家机构平均发出170万次查询。其余的问题在全国范围内广泛分布,其中一些问题来自50个州的每个州。
我们以三种方式总结了搜索和随后的主题视图。对于主题,我们发现停留时间比平均时间长(也称为
然后,我们描述了卫生专业人员对2011年FDA药品警报的“反应”——服用大剂量西酞普兰(Celexa)时心脏节律异常的风险——在寻求信息行为方面的变化。我们将UpToDate网站上关于西酞普兰(Celexa)的搜索量与2011年FDA警告后新闻网站上这些术语的提及量进行了比较,发现医疗保健专业人员在日常工作中对警告的理解与普通公众明显不同。在FDA发出警告、新闻网站首次出现提及西酞普兰的次数激增10多天后,UpToDate上有关西酞普兰的搜索量达到了峰值,但持续的时间要长得多。
我们测量了2011年和2012年任何一个月搜索次数最多的10种疾病和药物的月频率
2011-2012年最常搜索疾病(上)和药物(下)。
器官系统的搜索分布。每个器官系统名称后面跟着与该系统相关的查询的百分比。每个饼图显示了对该器官系统的搜索分布,按词汇类别分组,然后是与该系统相关的10个最频繁和10个最不频繁的搜索词。对疾病和症状(深蓝色)的搜索占据了大多数系统。关于内分泌系统的搜索包括大量的药物搜索,其次是心血管系统。
对美国医疗保健系统负担最大的医疗条件的查询量(以2011-2012年排名前10的平均总成本和/或出院量进行量化)在各种条件之间有显著差异(见
搜索次数最多的医疗状况(图中的三角形)
2011年和2012年平均总费用、出院量和/或最新查询量最高的医疗条件。每个点都是一个单一的医疗状况,点的大小表示查询量。点的形状表明它是否按总成本、流量和/或查询量排在前10位。费用和出院数据取自HCUP国家住院患者样本。
为了描述用户搜索和消费UpToDate内容的方式,我们分析了用户执行的搜索与查看作为这些搜索结果返回的UpToDate主题所花费的时间之间的关系。正如方法部分所描述的,我们使用主题视图持续时间的分布来决定截止持续时间(143.79秒)来将每个主题视图分类为
长时间点击比例高的主题来自于明显少于短时间点击的主题的独特搜索。长时间点击比例高的主题平均有10.37个唯一初始搜索词(SD 22.13),中位数为4个(四分位范围[IQR] 2)。这明显低于平均29.29 (SD 50.22)和中位数12 (IQR 8)个具有高比例短点击的主题的初始搜索词(
相比之下,搜索的长时间点击比例(由给定搜索词发起的长时间点击的主题视图的比例)的分布明显是双峰的(右图)
长时间点击在UpToDate主题(左)和搜索词(右)中的分布。左边面板中的虚线表示使用异常值的Hampel标识符确定的低和高长点击比例的阈值。
前10个搜索词(按数量计算)没有引发后续主题视图的长时间点击。
术语 | 频率 |
gad7 | 187 |
阿霉素患者信息 | 144 |
阿霉素患者信息 | 109 |
phenochromocytoma | 106 |
孕期实验室值 | 105 |
增加 | 86 |
probencid | 79 |
怀孕时服用地洛吗啡 | 71 |
parovirus | 66 |
肾脏上海四通 | 60 |
前10个搜索词(按量计算)只会引发长时间点击以获得后续主题视图。
术语 | 频率 |
abreva | 3411 |
大疱的鼓膜炎 | 3392 |
subchorionic出血 | 1904 |
脉络膜丛囊肿 | 1270 |
cerefolin | 1258 |
estropipate | 1207 |
moexipril | 1181 |
产后高血压 | 1153 |
tinactin | 1152 |
flucon | 1114 |
最常观察到的10个大小为3或4的主题视图序列,以及启动它们的搜索词。
主题视图顺序(频率) | 启动搜索词(频率) |
蜂窝织炎、丹毒→克林霉素:药物信息→克林霉素(全身):药物信息(14,463) | 蜂窝织炎(10434),蜂窝织炎治疗(2055),丹毒(260),皮肤感染(219),面部蜂窝织炎(171) |
甲真菌病→特比萘芬:药物信息→特比萘芬(全身):药物信息(8234) | 甲菌病(3421),甲菌病治疗(1433),癣病(531),脚趾甲菌病(524),甲菌病(476) |
结膜炎→红霉素:药物信息→红霉素(眼):药物信息(5938) | 结膜炎(2738)、结膜炎治疗(801)、红眼病(603)、细菌性结膜炎(422)、结膜炎(292) |
成人难辨梭菌感染治疗→甲硝唑:药物信息→甲硝唑(全身):药物信息(5923) | C diff (1947), C diff治疗(454),艰难梭菌治疗(439),艰难梭菌治疗(416),C . diff治疗(357) |
急性胰腺炎的治疗→急性胰腺炎严重程度的预测→计算器:胰腺炎预后Ranson标准→计算器:Apache II评分系统(1219) | 胰腺炎(731例),急性胰腺炎(303例),胰腺炎治疗(73例),急性胰腺炎治疗(52例),胆石性胰腺炎(23例) |
慢性阻塞性肺疾病急性加重期的处理→慢性阻塞性肺疾病急性加重期感染的处理→阿奇霉素:药物信息→阿奇霉素(全身):药物信息(565) | Copd加重(350例),Copd(98例), |
婴幼儿尿布皮炎概况→制霉菌素:药物信息→制霉菌素(外用):药物信息→制霉菌素(外用):儿童药物信息(522) | 尿布疹(350例),尿布皮炎(71例),尿布疹治疗(36例),尿布念珠菌病(19例),念珠菌性尿布疹(18例) |
女性急性非复杂性膀胱炎、肾盂肾炎→环丙沙星:药物信息→环丙沙星(眼科):药物信息→环丙沙星(全身):药物信息(416) | 尿路感染276例,尿路感染52例,膀胱炎31例,尿路感染治疗26例,肾盂肾炎16例 |
急性肺栓塞概述→急性肺栓塞的诊断→急性肺栓塞的治疗→急性肺栓塞的抗凝治疗(392) | 肺栓塞(311),PE(50),肺栓塞(31) |
最后,我们使用UpToDate日志中的用户搜索活动来监测医疗保健专业人员对FDA警报的响应。具体来说,我们测量了抗抑郁药物西酞普兰(商品名Celexa)在2011年8月24日FDA警告使用西酞普兰时心脏节律异常风险之前和之后的相对搜索量。如方法中所述,我们将UpToDate中的相对查询量与在线媒体中药物提及的相对量进行了比较
在线媒体显示,在警报发布的同一天,与celex相关的词汇出现了小幅飙升,在随后的几天里急剧上升,大约在10天左右达到峰值。相比之下,Celexa的UpToDate查询量直到10天才增加
在发出警告后,发起celexa相关主题视图的唯一搜索词的数量要高得多
在FDA发出警告后,搜索特异性也有所增加。“西酞普兰”或“Celexa”与“长qt期”、“心脏”或“节律”的搜索数在警报前只有2次,在警报后只有34次,证明了FDA警报的效果。
2011年8月24日FDA警告(绿色虚线表示的日期)前后与Celexa相关的UpToDate查询量的7天移动平均值(红色)、媒体活动的7天移动平均值(蓝色)和原始媒体活动的7天移动平均值(灰色)。
引发Celexa(西酞普兰)话题浏览量的唯一搜索词的数量,以及这些话题在2011年8月24日FDA警告前后的长时间点击比例。
主题 | 唯一搜索词的数量 | 长点击比例 | ||
前提醒 | 后提醒 | 前提醒 | 后提醒 | |
西酞普兰:药物信息 | 489 | 683 | 0.376 | 0.354 |
西酞普兰:患者药物信息 | 183 | 303 | 0.262 | 0.247 |
西酞普兰:儿童药物信息 | 43 | 63 | 0.395 | 0.301 |
这是第一个利用专门的循证医学信息资源分析医疗专业人员在线搜索行为的研究。我们的发现可以为UpToDate等资源的设计更改提供信息。例如,只导致短点击的搜索词(表明搜索结果对搜索者没有用处)潜在地确定了对新内容或新搜索词的需求,而只有高比例长点击的搜索词和主题表示覆盖广泛的主题。在搜索量上有季节性变化的搜索,例如流感和相关药物的搜索,可以在适当的季节突出显示,以使内容更容易获得。这样的分析可以通过考虑用户行为(消费者网络公司经常进行的一项活动)来提高内容的利用率。
最近在挖掘医疗领域Web日志方面的工作涉及使用消费者日志进行药物警戒[
2011年FDA对西酞普兰的警报被清晰地反映在UpToDate日志中,显示了该数据源作为评估疗效和衡量卫生保健专业人员对FDA警报的吸收的一种手段的潜力。这一发现也得到先前工作的支持,该工作演示了对监测流感流行的UpToDate使用日志的分析[
通过测量关于器官系统、疾病和药物的搜索量随时间的变化,以及通过量化搜索量变化和相关事件之间的关系,搜索日志分析可能为监视提供额外的机会。这种监测可以监测传染病暴发,或观察对卫生保健系统构成重大负担的健康状况的流行变化。开发监测这些变化的方法是可能的,并且先前已经通过使用消费者互联网搜索日志来预测医疗保健利用、检测流感爆发和跟踪处方药使用证明了这一点。使用卫生专业人员搜索日志来改进此类使用案例是一个研究领域,它有可能通过疾病爆发的早期预警来改善公共健康,并通过监测医生对FDA通信的响应来评估其疗效,从而改善药物安全监测。
我们的方法有几个限制。虽然UpToDate搜索和主题视图的位置、时间和相关用户许可是已知的,但我们没有UpToDate用户身份的信息。我们预计绝大多数获得UpToDate许可的用户是医疗保健专业人员(即,医生、护士从业人员和/或研究人员),但也有可能有些日志捕获了患者或其他类型的消费者使用UpToDate的情况。类似地,一个唯一的会话标识符将搜索和主题页面视图联系起来,但是在一个会话中有可能存在多个具有不同信息需求和行为的用户。依靠原始日志,我们无法识别会话内的用户切换,结果可能是由不同用户实际执行的关联搜索和主题视图,因此它们是不相关的。然而,已经有研究致力于开发自动确定Web日志数据会话边界的方法(包括用户切换)。
更普遍地说,应用于web规模搜索数据的数据挖掘方法可能存在方法论上的缺陷。2013年初,人们发现谷歌流感趋势系统高估了流感流行率,预测的值远远高于美国疾病控制中心的估计。如果没有重新校准方法以调整有外部原因的时间波动,例如媒体对不寻常的2012-2013流感季节的报道导致更多与流感相关的搜索,就可能出现此类不准确性[
我们的结果表明,挖掘UpToDate搜索日志为医疗保健专业人员的信息寻求行为提供了独特的见解,以及这种行为与与疾病状态相关的医疗保健利用之间的关系。我们的结果使我们能够了解卫生专业人员在日常工作中的信息需求,以及搜索词和主题视图之间的关系——其中很大一部分包括一个疾病或病情概念,然后是该疾病的药物或治疗方法。最后,我们能够使用UpToDate来量化FDA对严重药物不良事件警报的吸收,说明了分析搜索行为在国家层面上监测FDA警报响应的新用法。
2011年8月24日FDA警告(绿色虚线表示的日期)之前和之后,2011-2012年所有与Celexa相关的UpToDate查询量的7天移动平均值(红色),媒体活动的7天移动平均值(蓝色)和原始媒体活动量(灰色)。
临床分类体系
食品和药物管理局不良事件报告系统
食品和药物管理局
医疗保健成本和利用项目
《国际疾病分类》第九版
四分位范围
国家普通医学科学研究所
国立卫生研究院
国家医学图书馆
统一医学语言系统
这项工作得到了美国国立卫生研究院(NIH)为国家生物医学本体中心(授权号U54 HG004028)、美国国家医学图书馆(授权号R01 LM011369)和美国国家普通医学科学研究所(授权号R01 GM101430)的部分支持。我们感谢Wolters Kluwer的Amy Warner和Peter Bonis在数据提取和支持项目方面的帮助。
霍华德·斯特拉斯伯格是威科集团的员工。