JMIR医学信息学-在Twitter上的COVID-19期间公共和私人医疗保健组织之间的协同作用:使用预测模型进行情绪和参与分析gydF4y2Ba

原始论文gydF4y2Ba

Aditya SinghalgydF4y2Ba^*gydF4y2Ba,硕士gydF4y2Ba ；gydF4y2Ba
人见考尔八喜gydF4y2Ba^*gydF4y2Ba,硕士gydF4y2Ba ；gydF4y2Ba
维贾伊·马戈博士gydF4y2Ba

加拿大雷德贝湖首大学计算机科学系gydF4y2Ba

这些作者的贡献相同gydF4y2Ba

通讯作者:gydF4y2Ba

Aditya Singhal理学硕士gydF4y2Ba

计算机科学系gydF4y2Ba

湖首大学gydF4y2Ba

奥立弗道955号gydF4y2Ba

安大略省桑德湾，p7b5e1gydF4y2Ba

加拿大gydF4y2Ba

电话:1 807 709 9571gydF4y2Ba

电子邮件:gydF4y2Baasinghal@lakeheadu.cagydF4y2Ba

背景:gydF4y2Ba社交媒体平台(smp)经常被各种制药公司、公共卫生机构和非政府组织(ngo)用于沟通健康问题、新进展和潜在的疫情。尽管将其作为一种工具的好处已被广泛讨论，但在COVID-19期间，各种医疗保健组织在smp上的在线活动在参与和情绪预测方面尚未得到彻底调查。gydF4y2Ba

摘要目的:gydF4y2Ba本研究的目的是分析Twitter上分享的信息的性质，了解在Twitter上产生的公众参与度，并预测各种组织的情绪得分。gydF4y2Ba

方法:gydF4y2Ba数据收集自2017年1月1日至2021年12月31日期间5家制药公司、10家美国和加拿大公共卫生机构以及世界卫生组织(WHO)的推特账户。以2020年2月26日确认的北美首例COVID-19社区传播病例为基础，将181469条推文分为COVID-19之前和COVID-19期间两个阶段进行分析。我们使用基于自然语言处理(NLP)的主题建模技术进行内容分析，生成与健康相关的主题，分析Twitter上的公众参与度，并使用16个单变量移动平均和机器学习(ML)模型进行情绪预测，以了解公众意见与推文内容之间的相关性。gydF4y2Ba

结果:gydF4y2Ba我们使用非负矩阵分解(NMF)从选择用于分析的医疗保健组织撰写的推文中建模主题gydF4y2Ba_{马塞诸斯州大学的gydF4y2Ba}= -3.6530 = -3.7944。主题包括慢性病、卫生研究、社区卫生保健、医学试验、COVID-19、疫苗接种、营养和福祉以及心理健康。就用户影响而言，世界卫生组织(用户影响=4171.24)的总体影响最高，其次是公共卫生机构，疾病控制和预防中心(CDC);用户影响=2895.87)，以及美国国立卫生研究院(NIH;用户影响= 891.06)。在制药公司中，辉瑞的用户影响力最高，为97.79。此外，对于情绪预测，自回归综合移动平均(ARIMA)和季节性自回归外生因素综合移动平均(SARIMAX)模型在大多数数据子集(按医疗机构和时期划分)上表现最佳，平均绝对误差(MAE)在0.027 ~ 0.084之间，均方误差(MSE)在0.001 ~ 0.011之间，均方根误差(RMSE)在0.031 ~ 0.105之间。gydF4y2Ba

结论:gydF4y2Ba我们的研究结果表明，人们更多地关注COVID-19等话题，而不是医疗试验和客户体验。此外，不同组织的用户粘性水平也存在显著差异。全球组织，如世卫组织，随着时间的推移在参与水平上表现出很大的差异。所讨论的情绪预测方法为组织提供了一种构建其未来内容以确保最大用户参与度的方法。gydF4y2Ba

中国生物医学工程学报;2010;31 (8):893 - 893gydF4y2Ba

doi: 10.2196/37829gydF4y2Ba

关键字gydF4y2Ba

社交媒体gydF4y2Ba；gydF4y2Ba 卫生保健gydF4y2Ba；gydF4y2Ba 推特gydF4y2Ba；gydF4y2Ba 内容分析gydF4y2Ba；gydF4y2Ba 用户参与gydF4y2Ba；gydF4y2Ba 情绪预测gydF4y2Ba；gydF4y2Ba 自然语言处理gydF4y2Ba；gydF4y2Ba 公共卫生gydF4y2Ba；gydF4y2Ba 制药gydF4y2Ba；gydF4y2Ba 公众参与gydF4y2Ba

背景gydF4y2Ba

社交媒体平台(SMPs)，如Twitter、Facebook和Reddit，通常被人们用来获取健康信息。在美国，80%的互联网用户在线获取健康信息，其中74%的人使用smp。与此同时，公共卫生机构和制药公司经常使用社交媒体与公众接触[gydF4y2Ba1gydF4y2Ba]。smp通过为公众、患者和卫生保健专业人员(HCPs)提供交流平台来讨论健康问题，最终导致更好的结果，从而对社区做出了重大贡献[gydF4y2Ba2gydF4y2Ba]。此外，smp还通过促进保健教育和向社区提供最新信息，作为激励患者的媒介[gydF4y2Ba1gydF4y2Ba]。分析医疗保健领域的社交媒体内容可以揭示重要的维度，例如受众范围(例如，关注者和订阅者)、帖子来源(例如，制药公司、公共卫生机构)和帖子交互性(例如，点赞、转发的数量)[gydF4y2Ba3.gydF4y2Ba]。最近的一项研究讨论了一种机器学习(ML)方法来检查Twitter上的COVID-19 [gydF4y2Ba4gydF4y2Ba]。虽然它确定了讨论主题，但没有研究如何理解公共卫生机构和私人组织共享的内容。gydF4y2Ba

客观的gydF4y2Ba

社会媒体传播对医护人员的影响已被广泛讨论[gydF4y2Ba33gydF4y2Ba，gydF4y2Ba34gydF4y2Ba]。虽然他们专注于从社交媒体中提取健康和疾病相关内容的优势和方法，但目前对公共卫生机构、非政府组织(ngo)和制药公司如何使用社交媒体与社会产生共鸣缺乏了解。此外，对推文情绪的研究可以补充现有的模型，为未来的推文生成内容。预测推文的情绪是实现这一目标的一种方法。因此，将这些文本内容转化为信息，以制定未来战略，并获得对社交媒体用户看法的宝贵见解，这一点至关重要。gydF4y2Ba

本文的其余部分结构如下:首先，在方法部分中提出了使用性能最佳的聚类算法对主题建模进行初步分析，然后使用CardiffNLP的情感和参与分析gydF4y2Batwitter-roberta-base-sentimentgydF4y2Ba模型。然后，我们在完整的数据集上使用16个单变量模型进行了基于时间序列的情绪预测。Results部分概述了获得的模型主题，这些主题用于生成热图，以深入了解主题相关的tweet。接下来，我们讨论了用户粘性及其影响，以了解是否有更高水平的用户粘性受到任何离线事件的影响。此外，我们还讨论了表现最好的情绪预测模型的结果。最后，在讨论部分，我们得出结论，并对未来的工作提出了纲要。gydF4y2Ba

数据集gydF4y2Ba

本研究的数据(181469条推文)是从美国和加拿大主要医疗机构、制药公司和世界卫生组织(WHO)的账户中收集的，使用Twitter学术API for Research v2 [gydF4y2Ba35gydF4y2Ba在2017年1月1日至2021年12月31日期间。排名前五的制药公司是根据医疗保健专业人员在Twitter上提出的建议选出的[gydF4y2Ba36gydF4y2Ba]。gydF4y2Ba表1gydF4y2Ba列出为每个Twitter句柄抓取的tweet数。每个组织被称为gydF4y2Ba用户gydF4y2Ba，将组织类型(即制药公司、公共卫生机构、非政府组织)称为本研究范围内的用户组。gydF4y2Ba

完整的时间线分为两个阶段进行分析，gydF4y2Ba之前gydF4y2BaCOVID-19和gydF4y2Ba在gydF4y2Ba基于2020年2月26日确认的北美首例COVID-19社区传播病例[gydF4y2Ba37gydF4y2Ba]。gydF4y2Ba图1gydF4y2Ba介绍了研究框架的概述。gydF4y2Ba

表1。3种类型组织的选定用户帐户的tweet分布。gydF4y2Ba

组织名称(Twitter句柄)gydF4y2Ba		在COVID-19之前，n (%)gydF4y2Ba	在COVID-19期间，n (%)gydF4y2Ba	推文总数，NgydF4y2Ba
公共卫生机构gydF4y2Ba
	美国疾病控制与预防中心(cdc)gydF4y2Ba	8435 (58.6)gydF4y2Ba	5963 (41.4)gydF4y2Ba	14398年gydF4y2Ba
	美国疾病控制与预防中心gydF4y2Ba	1376 (86.3)gydF4y2Ba	219 (13.7)gydF4y2Ba	1594gydF4y2Ba
	加拿大土著政府(gcindig土著人)gydF4y2Ba	3505 (54.0)gydF4y2Ba	2989 (46.0)gydF4y2Ba	6494gydF4y2Ba
	加拿大卫生部和PHAC(加拿大健康政府)gydF4y2Ba	7878 (17.2)gydF4y2Ba	37907 (82.8)gydF4y2Ba	45785年gydF4y2Ba
	美国卫生与公众服务部(HHSGov)gydF4y2Ba	7890 (56.9)gydF4y2Ba	5969 (43.1)gydF4y2Ba	13859年gydF4y2Ba
	印度卫生局(IHSgov)gydF4y2Ba	1090 (44.7)gydF4y2Ba	1346 (55.3)gydF4y2Ba	2436gydF4y2Ba
	加拿大食品检验局(InspectionCan)gydF4y2Ba	4145 (62.2)gydF4y2Ba	2516 (37.8)gydF4y2Ba	6661gydF4y2Ba
	美国国立卫生研究院gydF4y2Ba	5837 (71.6)gydF4y2Ba	2314 (28.4)gydF4y2Ba	8151gydF4y2Ba
	印度国家卫生委员会(NIHB1)gydF4y2Ba	1247 (51.1)gydF4y2Ba	1195 (48.9)gydF4y2Ba	2442gydF4y2Ba
	美国食品和药物管理局(US_FDA)gydF4y2Ba	5810 (59.7)gydF4y2Ba	3925 (40.3)gydF4y2Ba	9735gydF4y2Ba
	总计gydF4y2Ba	47213 (42.3)gydF4y2Ba	64343 (57.7)gydF4y2Ba	111555年gydF4y2Ba
制药公司gydF4y2Ba
	阿斯利康(阿斯利康)gydF4y2Ba	3462 (78.2)gydF4y2Ba	963 (21.8)gydF4y2Ba	4425gydF4y2Ba
	生原体(生原体)gydF4y2Ba	1819 (61.9)gydF4y2Ba	1120 (38.1)gydF4y2Ba	2939gydF4y2Ba
	葛兰素史克(GSK)gydF4y2Ba	4200 (69.3)gydF4y2Ba	1857 (30.7)gydF4y2Ba	6057gydF4y2Ba
	强生公司(JNJNews)gydF4y2Ba	4813 (71.4)gydF4y2Ba	1926 (28.6)gydF4y2Ba	6739gydF4y2Ba
	辉瑞(Pfizer)gydF4y2Ba	3637 (64.1)gydF4y2Ba	2039 (35.9)gydF4y2Ba	5676gydF4y2Ba
	总计gydF4y2Ba	17931 (69.4)gydF4y2Ba	7905 (30.6)gydF4y2Ba	25836年gydF4y2Ba
非政府组织gydF4y2Ba^{一个gydF4y2Ba}
	世卫组织gydF4y2Ba	24775 (56.2)gydF4y2Ba	19303 (43.8)gydF4y2Ba	44078年gydF4y2Ba

^{一个gydF4y2Ba}NGO:非政府组织。gydF4y2Ba

内容分析gydF4y2Ba

将每个用户的内容分为COVID-19之前和期间2个阶段。我们使用表现最好的主题模型产生的主题对组织撰写的推文进行主题建模，以便在热图的帮助下探索谈论最多和最少的主题。此外，我们还研究了这些组织使用的十大话题标签。gydF4y2Ba

预处理gydF4y2Ba

首先，所有非字母(数字、标点、换行字符和额外的空格)和统一资源定位器(url)都使用正则表达式模块(gydF4y2Ba再保险2.2.1gydF4y2Ba) ［gydF4y2Ba38gydF4y2Ba]的所有推文。清理后的文本然后使用gydF4y2Banltk 3.2.5gydF4y2Ba图书馆(gydF4y2Ba39gydF4y2Ba]。接下来，删除停止词，然后使用PorterStemmer进行词干提取，然后使用WordNetLemmatizer从gydF4y2BanltkgydF4y2Ba。gydF4y2Ba

主题建模gydF4y2Ba

研究人员使用术语频率逆文档频率(TF-IDF)为tweet创建文档嵌入[gydF4y2Ba40gydF4y2Ba]。根据他们的方法，我们对推文进行预处理并生成文档嵌入，并将其输入5种不同的聚类算法:LDA、并行LDA、非负矩阵分解(NMF)、潜在语义索引(LSI)和分层狄利let过程(HDP)。这些聚类算法以不同的随机种子值执行了5次。种子值解释了tweet的简短和嘈杂的性质。我们计算了主题模型的一致性分数，cgydF4y2Ba_{马塞诸斯州大学的gydF4y2Ba}［gydF4y2Ba41gydF4y2Ba]和cgydF4y2Ba_vgydF4y2Ba［gydF4y2Ba42gydF4y2Ba]，以确认多次运行后的性能一致性。gydF4y2Ba

我们使用Gensim LDA [gydF4y2Ba43gydF4y2Ba]、Gensim LDA多核(并行LDA) [gydF4y2Ba44gydF4y2Ba]， Gensim LSI [gydF4y2Ba44gydF4y2Ba，gydF4y2Ba45gydF4y2Ba)模型。对于NMF和HDP模型，我们对大型语料库使用在线NMF [gydF4y2Ba46gydF4y2Ba]和在线变分推理[gydF4y2Ba46gydF4y2Ba，gydF4y2Ba47gydF4y2Ba]模型。gydF4y2Ba

的热图gydF4y2Ba

生成热图使用gydF4y2BaseaborngydF4y2Ba分析每个主题的推文数量。利用每个时间阶段(即COVID-19之前和期间)表现最佳的主题模型产生的主题来生成热图。每个单元格表示组织针对特定主题的tweet总数。例如，在制药公司中，阿斯利康(AstraZeneca)在COVID-19之前的慢性病推文数量最多(n=1729, 49.9%)。gydF4y2Ba

标签gydF4y2Ba

用户推文中提到的前10个标签使用gydF4y2Baadvertools 0.13.0gydF4y2Ba模块(gydF4y2Ba48gydF4y2Ba]。这个工具提取社交媒体帖子中的话题标签。利用该模型分析疫情前和疫情期间推文行为的异同，进行话题分析。gydF4y2Ba

情绪分析gydF4y2Ba

情感分析是一种NLP方法，用于根据每条tweet中使用的关键字对Twitter消息中出现的情感进行分类。我们测试了不同的模型，将用户的推文分为3类:积极、消极和中性。虽然对于应该采样多少条推文没有共同的阈值，但我们看到了大约2000条推文的范围[gydF4y2Ba49gydF4y2Ba-gydF4y2Ba51gydF4y2Ba]到几千条推文[gydF4y2Ba52gydF4y2Ba-gydF4y2Ba54gydF4y2Ba在测试模型时。在这项研究中，我们在数据收集时间框架内均匀分布了3000条推文，这些推文来自所有Twitter句柄。然后，推文被3个不同的注释者标记，投票最高的情绪类别被选为整体情绪。CardiffNLP的gydF4y2Batwitter-roberta-base-sentimentgydF4y2Ba模型(gydF4y2Ba55gydF4y2Ba]，它是在6000万个Twitter语料库上训练的，用于获得采样数据集上的情感标签。我们检查了人类注释和模型标签之间的相似性，CardiffNLP模型的相似性百分比为69.96%;因此，该模型被用来预测用户对剩余推文的情绪。gydF4y2Ba

参与分析gydF4y2Ba

对于给定的用户，Twitter定义了用户粘性[gydF4y2Ba56gydF4y2Ba]如式(1)所示:gydF4y2Ba

,“gydF4y2Ba订婚gydF4y2Ba是每条推文的点赞数、回复数、转发数、媒体浏览量、推文扩展数、个人资料数、标签数、URL点击数和新关注者数的总和，以及gydF4y2Ba印象gydF4y2Ba是一条推文在推特上被看到的总次数，比如通过关注者的时间轴、推特搜索，或者因为有人喜欢你的推文。”gydF4y2Ba

研究人员通过提出启发式和基于神经网络的模型，分析了Twitter句柄的影响(受欢迎程度)[gydF4y2Ba57gydF4y2Ba-gydF4y2Ba59gydF4y2Ba]。我们将其定义为关注者、关注者、tweets总数和个人资料年龄的函数，并使用式(2)进行计算:gydF4y2Ba

在哪里gydF4y2BalistedCountgydF4y2Ba此用户所属的公共列表的个数。gydF4y2Ba

用户发布的tweet总数被认为与用户的影响力成反比，因为偶尔发布tweet并获得较高参与度的用户比经常发布tweet但参与度较低的用户更有影响力。gydF4y2Ba

参与分析是为了量化所产生的话题的受欢迎程度。每个用户的参与度定义为每天平均参与度与其影响力的乘积，如式(3)所示。每天平均参与度计算为每天点赞、回复、转发和引用的总和。这些反应汇总自2017年1月1日至2021年12月31日。gydF4y2Ba

指数移动平均线(EMA)计算每个用户的窗口跨度为151天，使用z-score去除异常值，然后使用Savitzky-Golay过滤器将每天的平均参与度平滑到8度[gydF4y2Ba60gydF4y2Ba]。gydF4y2Ba

情绪预测gydF4y2Ba

为了预测每天的情绪，我们首先需要量化每个用户每天发布的推文的整体情绪。我们利用了CardiffNLP的gydF4y2Batwitter-roberta-base-sentimentgydF4y2Ba模型(gydF4y2Ba55gydF4y2Ba]来计算收集到的用于我们分析的所有推文的情绪，然后根据当天推文数量最多的情绪类别计算每日情绪得分，如式(4)所示，然后根据情绪:0为分配情绪得分gydF4y2Ba中性gydF4y2Ba情绪，正面推文数与总推文数之比gydF4y2Ba积极的gydF4y2Ba情绪，以及负面推文数与总推文数之比gydF4y2Ba负gydF4y2Ba情绪。gydF4y2Ba

然后将每日情绪得分重新采样为每月平均情绪得分，这也有助于我们处理缺失值(如果有的话)。如前所述，将完整的时间线分为2个阶段(即COVID-19之前和期间)，并在每个时期对所有用户组的20%数据集进行情绪评分预测。gydF4y2Ba

使用网格搜索找到最优超参数，并对每个模型进行5次交叉验证。的gydF4y2BastatsmodelgydF4y2Ba图书馆(gydF4y2Ba61gydF4y2Ba]用于ARIMA [gydF4y2Ba62gydF4y2Ba]及SARIMAX [gydF4y2Ba63gydF4y2Ba模型，以及gydF4y2BapycaretgydF4y2Ba［gydF4y2Ba64gydF4y2Ba]用于基于回归的模型。我们还报告了gydF4y2Ba先知gydF4y2Ba［gydF4y2Ba65gydF4y2Ba在数据集上建立模型。gydF4y2Ba

选择平均绝对误差(MAE)、均方误差(MSE)和均方根误差(RMSE)三个指标来评价模型的预测精度。我们在本研究中考虑提前一步预测，因为它有助于避免与前一时期累积误差相关的问题。gydF4y2Ba

计算资源gydF4y2Ba

这项研究是利用加拿大计算机(现称为加拿大数字研究联盟)的资源进行的，这些资源提供了对先进研究计算(ARC)、研究数据管理(RDM)和研究软件(RS)的访问。以下是国家服务(数字研究联盟)的一个集群提供的计算资源列表，Graham:gydF4y2Ba

CPU: 2x Intel E5-2683 v4 Broadwell@2.1 GHzgydF4y2Ba
内存(RAM): 30gbgydF4y2Ba