发表在24卷第12名(2022): 12月

本文的预印本(早期版本)可在https://preprints.www.mybigtv.com/preprint/39460,首次出版
2019年电子烟和电子烟使用相关肺损伤爆发期间,推特和Reddit上关于电子烟的话题和情绪:比较研究

2019年电子烟和电子烟使用相关肺损伤爆发期间,推特和Reddit上关于电子烟的话题和情绪:比较研究

2019年电子烟和电子烟使用相关肺损伤爆发期间,推特和Reddit上关于电子烟的话题和情绪:比较研究

原始论文

1南卡罗来纳大学集成信息技术系,哥伦比亚,南卡罗来纳州,美国

2美国密苏里州圣路易斯华盛顿大学医学院精神科

3.美国明尼苏达州罗彻斯特市梅奥诊所人工智能与信息学研究室

通讯作者:

黄明博士

人工智能与信息学系“,

梅奥诊所

第一街200号西南

罗切斯特,明尼苏达州,55902

美国

电话:1 507 538 3287

电子邮件:Huang.Ming@mayo.edu


背景:近年来,电子烟或电子烟在美国变得越来越流行。2019年,电子烟和电子烟使用相关肺损伤(EVALI)病例导致住院和死亡人数增加,许多病例后来与不受监管的产品有关。以前的文献利用社交媒体数据来监测健康主题。个人愿意在社交媒体平台上分享心理健康经历和其他个人故事,在那里他们有一种社区感,减少了耻辱和赋权。

摘要目的:本研究旨在比较2个流行社交媒体平台(即Twitter和Reddit)上的电子烟相关内容,以探索2019年EVALI爆发期间电子烟的背景,并支持使用这两个社交平台的数据在社交媒体上开发深度智能电子烟检测模型的可行性。

方法:数据提取自2019年7月至2019年9月EVALI危机高峰期间的Twitter(316,620条推文)和Reddit(17,320条推文)。进行高通量计算分析(情感分析和主题分析)。此外,还进行了深入的人工内容分析,并与两个平台上的内容(577条推文和613条帖子)的计算分析进行了比较。

结果:从2019年7月到2019年9月,推特和Reddit上与电子烟相关的帖子和独立用户都有所增加,推特上每用户的平均帖子从1.68篇增加到1.81篇,Reddit上从1.19篇增加到1.21篇。计算分析发现,Reddit上的积极情绪帖子数量更多。P<。001, 95%置信区间0.4305-0.4475),推特上的负面帖子数量将更高(P<。001, 95% CI -0.4289至−0.4111)。这些结果与临床内容分析的结果一致,表明Twitter上的负面情绪帖子(273/577,47.3%)高于Reddit(184/613, 30%)。此外,根据关键词和人工评论,两个平台上流行的话题包括年轻人、营销或监管、大麻和戒烟的兴趣。

结论:2019年EVALI期间,推特和Reddit上的帖子内容和热门话题重叠。然而,在用户类型和内容关键字上也发现了关键差异,包括推特上提到健康相关关键字的频率更高,Reddit和推特上提到电子烟对健康的负面影响更多。计算和临床内容分析的使用不仅对于识别与电子烟相关的社交媒体内容中的公共卫生趋势信号至关重要,而且对于提供电子烟风险和行为的背景至关重要。通过利用Twitter和Reddit作为公开数据源的优势,这项研究可能会提供技术和临床见解,为自动检测正在吸电子烟的社交媒体用户提供信息,并可能受益于这些平台上的数字干预和主动拓展策略。

中国医学杂志,2018;24(12):e39460

doi: 10.2196/39460

关键字



背景

近年来,电子烟在美国变得越来越流行,每20个美国成年人中就有一个人在使用电子烟,到2021年,美国将有200万初高中学生使用电子烟。12].电子烟会对个人健康造成多种负面影响,包括肺功能和心脏功能下降,易依赖尼古丁,并影响神经发育,尤其是在年轻人中[3.4].然而,尽管对健康有这些负面影响,但研究发现年轻人对电子烟的危害了解有限。56]以及有很强的自觉戒烟能力[7].更令人担忧的是,2019年,电子烟和电子烟使用相关的肺损伤(EVALI)导致住院和死亡,其中许多病例后来与维生素E醋酸酯(不受监管产品中的填充物质)有关[8].在这些风险和负面健康后果的背景下,美国食品和药物管理局在2018年将青少年吸电子烟列为全国流行病,并继续发布政策,更有效地监管电子烟产品[9].鉴于电子烟对健康的有害影响和EVALI风险的增加,未来有必要对来自社交媒体等来源的公开可用的更大规模数据进行研究,以监测这一日益增长的公共健康问题,并为戒烟的外联干预措施提供信息。以前的文献利用社交媒体数据监测健康问题,包括非法药物使用[10]、精神健康[1112]、公共卫生[1314],以及其他与健康有关的经验[15].Twitter是一个社交媒体网站,大约22%(1/5)的美国成年人使用Twitter [16]作为信息的来源和信息共享[17].在推特等基于网络的平台上,人们可能更愿意公开分享有关精神健康或药物滥用的经历和个人故事,减少对判决或法律诉讼的恐惧,使他们能够获得社会支持和建议,并与有类似经历的人分享这些建议[18].例如,一项对心理健康意识周期间1200条推文的研究发现,意识、耻辱和个人经历是推特用户话语的中心主题[19].因此,推特已被用作公共健康监测的海量信息数据源,并可用于更好地了解个人对电子烟的态度和行为[20.-22].例如,在COVID-19大流行期间,推特数据被用来更好地理解人们对吸烟与病毒的关系的情绪和反应[23]以及个人对全球事件和美国相关生活方式变化的看法[24].尽管推特在监控和公共健康监测方面有几个优势,但Reddit等其他社交媒体平台可能有互补的优势,可以提供个人层面的用户吸电子烟行为数据。

Reddit是一个类似的匿名社交媒体平台,公众用它来讨论可能被污名化的个人经历。25-27],包括年轻人,他们可能会透露个人信息,而不太担心线下的伤害或后果[28].Reddit的数据已被用于调查使用非法物质的个人的态度和行为[29-31),在吸电子烟的人群中也进行了类似的研究。对Reddit帖子的一项分析表明,精神疾病患者吸电子烟的主要动机包括自我药物治疗、自由和控制、将电子烟作为爱好、社交联系,以及为了戒烟而吸电子烟。32].其他研究使用Reddit的数据来分析公众对电子烟禁令的反应和担忧。33]、支持戒烟电子烟的社群[34],以及人们对电子烟产品的态度和评论[35].

Twitter和Reddit都是流行的社交媒体平台,但它们在影响用户发帖行为和发帖内容的多个方面有所不同。推特,月活跃用户3亿[36],只允许在280个字符内发布突发新闻、趋势和观点,这往往会导致不完整或误导性的陈述[37].相比之下,Reddit每月有4.3亿活跃用户,没有字符发帖限制,是匿名的,由社区网络组成,即子reddits,致力于特定的主题,允许用户与其他具有类似背景、观点和生活经历的人联系起来。通过Reddit的匿名性,人们可以通过深入的文字和内容诚实地表达自己的观点,以传播意识和重要新闻。3839].因此,在同一时期内关于同一主题的帖子(即2019年关于电子烟的帖子),根据分享内容的类型和对公众认知的影响程度,预计会有所不同。

使用计算机科学(CS)策略进行大规模评估,包括使用自然语言处理和机器学习进行文本挖掘,之前已经对社交媒体上的内容进行了大规模评估[40-42].例如,Visweswaran等人[41开发了机器学习分类器来识别与电子烟相关的推文,以开发电子烟监控系统。结果表明,社交媒体内容可以用于全面的信息监控,这些数据可以为未来的个人级检测模型提供信息,以识别有风险的帖子和用户。Kwon和Park所作的系统检讨[32研究发现,在社交媒体网站上,人们对电子烟的看法往往更加积极,而此前在推特上的研究也表明,吸烟者更有可能接触到有关电子烟的错误信息。[43].在Reddit帖子上进行的研究表明了与电子烟有关的健康症状[44]并强调了旨在支持那些想要戒掉电子烟的人的社区[45].

目标

专门研究EVALI公共卫生危机可以帮助识别与社交媒体上分享的电子烟相关的急性和长期健康结果相关的内容和关键词,因为电子烟风险的信号可能在此期间被放大了。通过利用Twitter和Reddit作为公开数据源的优势,以及使用跨学科的方法来分析复杂的社交媒体内容,可以获得技术和临床见解,为自动检测模型的未来发展提供信息,以连接可能受益于社交媒体平台上的数字干预的电子烟用户。然而,到目前为止,很少有研究比较Twitter和Reddit在同一时间段内对药物滥用的看法[4647],目前还没有开展与电子烟相关的已知研究来分析个人用户水平和人群水平上的2019年EVALI爆发。因此,本文研究了Twitter和Reddit上与电子烟相关的内容,以更好地理解(1)在2019年EVALI时间框架内与电子烟相关内容相关的情绪和关键词,(2)Twitter和Reddit上内容之间的情绪和关键词的差异,以及(3)电子烟相关内容的统计分析和临床编码之间的相似性或差异。


数据收集

在这项研究中,我们使用2019年7月至2019年9月这两个平台的数据,重点比较了EVALI爆发期间推特和Reddit上与电子烟相关的关键词频率和情绪,因为我们之前的工作已经确定这是与电子烟相关的社交媒体内容增加的时间框架[48].为了定义大规模数据提取的标准,我们的团队首先对2019年时间线上随机选择的200条与电子烟相关的推文进行了手动分析,以生成临床相关关键词列表。我们的主要研究问题指导了这个关键字列表的创建,其中包括特许经销商vape,以及其他60个指定术语(多媒体附件1)。使用这组关键词,在EVALI爆发期间(2019年7月、8月和9月)随机抽取了316,620条与电子烟相关的推文样本,平均每条推文有27个单词。为了进行比较,我们使用相同的关键字集随机提取Reddit数据,结果在EVALI爆发期间,有17320篇Reddit帖子,平均每篇帖子有211个单词与电子烟有关。

GetOldTweets [49]是一个开源的python库,它允许我们的团队提取带有我们识别的vaping关键字的随机推文样本。该模块允许访问和提取任何日期和主题的历史推文。使用这个应用程序接口(API)的好处是它对大小没有限制,并且可以访问历史推文[4950].我们使用Pushshift Reddit API(4.0版本)[51,它提供了丰富的搜索和提取功能,以及灵活的方式来聚合公开的Reddit帖子和评论。

数据清理

在我们根据关键字从Twitter和Reddit提取帖子后,我们在进一步分析之前清理了数据集。由于我们在这项研究中只关注英语帖子,我们首先删除了包含非英语语言的帖子。我们还删除了标记为“已删除”或“已删除”的无效Reddit帖子。在此之后,Twitter帖子的数量从316620条减少到286703条,Reddit帖子的数量从17320条减少到12069条。

对于帖子中的文本,我们首先将所有字符转换为小写,以避免区分大小写的过程。然后,我们从文本中删除了所有非美国信息交换标准代码的特殊字符。对于文本缩略,我们将其扩展为多个单独的单词。接下来,我们从文本中删除了对文本意义没有重大贡献的停顿词(例如is, a, the和of)。在那之后,我们从推文文本中删除了特殊术语,包括提及、标签、链接、勾号、标点、数字和空格。然后,我们应用词元化函数将单词转换为它们的基本形式。

情绪分析

情感分析是一种常用的计算机技术,用于测量文本中的主体性、观点、态度和情感[52].情感分析按照连续尺度量化给定文本中的情感内容,例如,从−1到1 [4153].我们应用了Valence Aware Dictionary and emotion Reasoner (VADER)作为工具来分析tweets和Reddit帖子的情绪,因为VADER是一个基于词汇和规则的情绪分析工具[54]最近的研究[245556已经发现可以有效计算情感的社交媒体分析。更具体地说,VADER已经适应了社交媒体的情绪,并通过一个黄金标准的情绪词汇库进行了预训练,该词汇库是基于成熟的情绪词库,流行的情绪表达,以及社交媒体中具有情感价值的常见俚语开发的。为了确定情感,VADER将词汇特征映射到情感强度,称为情感评分,可以通过将文本中每个单词的强度相加来获得。然后将分数归一化为−1(最极端的负)和+1(最极端的正)。在我们的研究中,如果文本情感得分为>0,则文本被归类为积极的。情绪得分<0的文本被归为负面。中性文本的情感得分为0。我们的研究使用这种情绪评分进一步将帖子分为对电子烟的积极、消极和中性情绪,并根据每月的3种情绪类型计算帖子的分布。

关键词分析

除了前面描述的情绪分析之外,我们还使用卡方检验来比较以下主题中每个月Twitter和Reddit帖子中关键字频率的差异:(1)情绪,(2)情感相关的关键字,(3)健康相关的关键字,(4)年龄相关的关键字,(5)营销相关的关键字,(6)产品相关的关键字,(7)成瘾相关的关键字,以及(8)戒烟相关的关键字。

术语频率-逆文档频率

词频逆文档频率(Term frequency - inverse document frequency, TF-IDF)是一种统计度量,可以表示语料库中相关的词[57].TF-IDF评分基于词频和逆文档频计算。使用这种方法可以帮助我们找到Twitter和Reddit上的常用词。根据TF-IDF得分,我们可以识别出两个平台上最重要的单词。公式如下:

TF =文档中的字数/文档中的字数(1)
IDF = log(文档数量/包含该单词的文档数量)(2)
tf - idf = tf × idf(3)

临床编码比较

根据之前概述的内容和情绪分析,在EVALI爆发期间,2019年7月、8月和9月被确定为推特上与电子烟相关的讨论急剧增加期间和之前的几个月。因此,从前面描述的Twitter和Reddit数据集中提取每月200个帖子的随机样本,用于深入的人类编码,以进行上下文内容分析。具体而言,我们临床团队中具有物质使用研究经验的成员(心理学、社会工作或公共卫生专业的研究生,以及由临床心理学家PCR领导的定性社交媒体数据编码的相关经验)使用归纳和演绎方法,在回顾样本推文的基础上构建了一个代码本,并参考了以前的文献[5859].使用了三个主要编码类别:(1)帖子类型,包括个人、营销、媒体或新闻或其他[60];(2)对电子烟的看法[61];(3)所提到的健康结果,包括积极的(如戒烟)和消极的(如肺损伤、死亡和成瘾或依赖)[6062].次要概念被编码为存在或不存在,包括(1)提到青少年或青少年或年轻成年人[63]和(2)提到大麻或杂草或大麻二酚或四氢大麻酚[6465].两名独立的人类编码员审查了每篇文章,并根据文本内容分配了适用的代码,编码员之间的一致性非常高,平均κ评分为0.62 [66].然后,第三位编码员审查了每个初步编码员的编码,并为那些存在分歧的推文提供了最终代码[67],这是以往定性分析文献中使用的第三方解析方法[68].然后将频率和定性主题与CS分析的初步结果进行比较,以帮助对数据集中反映的临床主题进行概念化。

比较了推特和Reddit上每个主题在2019年7月、8月和9月(3个月的总和)被提到的总频率,以展示每个主题在各自平台上的相对权重。

伦理批准

华盛顿大学机构审查委员会(202101009)审查了本研究的数据提取和分析方法。考虑到数据在社交媒体上公开,该研究被确定为非人类研究,因此不受审查。


数据集摘要和唯一用户

本节介绍高通量计算分析的结果。我们总共在Reddit上收集了286,703条推文和12,096条帖子。Twitter和Reddit之间的样本量差异与每个Reddit帖子和推文中包含的信息量有关。每条推文的字数限制是280个字符,而Reddit每条帖子的字数限制是4万个字符。因此,每个Reddit帖子包含的信息都比一条推文丰富得多。为了分析单词级别的数据集和进一步的内容分析,提取的Reddit帖子的数量明显小于推文的数量。表1显示两个平台上每个用户的独立用户数和发帖数。总体而言,从2019年7月到2019年9月,推特和Reddit上与电子烟相关的帖子和独立用户的数量呈上升趋势。特别是,从2019年8月到2019年9月,推特上的帖子数量和独立用户增加了约4倍。在推特和Reddit上,每用户发表的文章数分别从1.68篇增加到1.81篇和1.19篇增加到1.21篇。

表1。在电子烟和使用电子烟引起的肺损伤爆发期间,推特和Reddit上提到电子烟的独立用户数量和每个用户发布的帖子。
2019年的月份 唯一用户,n (%) 每用户发文数n

推特 Reddit 推特 Reddit
7月 17904 (11.06) 2893 (28.75) 1.68 1.19
8月 28604 (17.67) 3066 (30.47) 1.66 1.2
9月 115373 (71.27) 4105 (40.79) 1.81 1.21

情绪分析结果

情绪的CS模式分析发现,在EVALI期间,对电子烟持积极态度的帖子总体上比Reddit上的负面帖子更常见(8905/12,096,73.62%),而在Twitter上,负面情绪占主导地位(174,448/ 286,703,60.86%)(表2)。在此期间,基于一个小的随机样本的临床结果与使用CS方法的结果相似,仍然表明Reddit有更多的积极情绪帖子,也反映了Twitter有更多的负面情绪帖子,这是基于对帖子内容的人工审查。

月度情绪趋势的结果表明,无论是在Twitter上还是在Reddit上,7月份情绪积极的帖子比例都高于情绪消极的帖子。8月和9月,推特上负面消息的比例高于正面消息的比例。此外,从7月到9月,Twitter上积极情绪的百分比显著下降,而Reddit上的积极帖子在8月和9月占主导地位。

卡方检验(表S1多媒体附件2)的调查结果显示,不同平台之间的情绪总体上存在显著差异。Twitter包含的负面帖子(174,488/ 286,703,60.86%)明显高于Reddit (2281/12,096, 18.86%), Reddit包含的正面帖子(8905/12,095,73.62%)明显高于Twitter(85,209/ 286,703,29.72%)。

除了情绪分析和趋势,我们还使用卡方检验来比较Twitter和Reddit上与情绪表达相关的帖子差异。我们从推特和Reddit上最常用的词汇列表中选择了一些常见的情感词汇。包括积极的关键词安全的,好,而且,包括消极的关键词杀人,坏的,危险的,关心的,而且严重的.统计结果显示,从频率百分比来看,这两个平台整体上存在显著差异。我们发现,在EVALI爆发期间的所有3个月里,积极情绪表达在Reddit上比在Twitter上要显著得多(表S2)多媒体附件2)。

表2。Twitter和Reddit上的情感分析和临床编码。

情绪分析,n (%) 临床编码,n (%)

Twitter (n = 286703) Reddit (n = 12096) Twitter (n = 577) Reddit (n = 613)
积极的 85209 (29.72) 8905 (73.62) 201 (34.8) 291 (47.5)
174488 (60.86) 2281 (18.86) 273 (47.3) 184 (30)
中性 27006 (9.42) 910 (7.52) 103 (17.9) 138 (22.5)

主题关键词分析

健康相关关键词分析

包含电子烟相关关键字的帖子的分布和百分比显示在表3图1显示了2019年7月、8月和9月与健康问题相关的前6个单词的出现频率。排名前6位的词汇是在推特和Reddit上分享最多的。基于TF-IDF评分,如图所示多媒体,我们发现推特上最重要的健康相关关键词包括死亡,肺,戒烟,吸烟,疾病,而且伤害,而Reddit帖子中最重要的词包括死亡,肺,戒烟,吸烟,咳嗽,而且医生

我们进行了卡方检验来比较健康相关的关键字,包括死亡,肺,疾病,风险,危机,生病,医生,癌症,伤害,流行病,研究,损害,危害,有害的,病人,咳嗽,胸部,预防,吸烟,而且辞职这是基于2019年7月、8月和9月的帖子。卡方检验结果(表S3在多媒体附件2)显示,在Twitter和Reddit上发布的与健康相关的关键词在三个月和整体上都存在显著差异。然而,由于Twitter和Reddit上帖子的大小存在显著差异,整体效应量较小。从百分比来看,Twitter上讨论的与健康相关的关键词比Reddit上更多,而负面健康结果在Reddit和Twitter上都被高度讨论。

除了调查与健康相关的关键字的情绪,卡方检验与成瘾相关的关键字(表S4)多媒体附件2)在每个月和整个EVALI爆发期各平台间均表现出显著差异和较小的效应量。从百分比来看,与成瘾相关的关键词在Twitter上的提及率高于Reddit。

在深度临床编码中,负面健康结果在两个平台上被提及的频率(Twitter: 230/577, 39.9%, Reddit: 227/578, 39.3%)远高于积极健康结果(Twitter: 134/577, 23.2%, Reddit: 182/578, 31.5%)。在这些负面健康结果中提到的其他主题包括EVALI/住院,这在Twitter上更为普遍(Twitter: 176/577, 30.5%, Reddit: 146/578, 25.3%),而在Reddit上,对电子烟产品的成瘾或依赖更常被提及(Twitter: 57/577, 9.9%, Reddit: 123/578, 21.3%)。那些在Reddit上提到与电子烟有关的积极健康结果的人更常见,这与之前描述的关键词分析一致;此外,临床编码发现,在Reddit上,电子烟作为一种戒烟方法的提及频率高于Twitter (Twitter: 118/577, 20.5%; Reddit: 177/578, 30.6%)。

表3。Twitter和Reddit上健康相关关键词的分布和百分比。
与健康有关的关键字 2019年7月,n (%) 2019年8月,n (%) 2019年9月,n (%) 总计,n (%)

推特 Reddit 推特 Reddit 推特 Reddit 推特 Reddit
死亡 343 (1.1) 70 (2) 2701 (5.67) 129 (3.5) 32971 (15.77) 493 (9.9) 36015 (12.56) 692 (5.7)
2305 (7.67) 281 (8.2) 11612 (24.39) 411 (11.2) 33394 (15.98) 870 (17.5) 47311 (16.5) 1562 (12.91)
疾病 235 (0.8) 56 (2) 4268 (8.96) 112 (3.0) 7969 (3.8) 297 (6.0) 12472 (4.35) 465 (3.8)
风险 708 (2.4) 147 (4.3) 1231 (2.59) 197 (5.4) 6012 (2.88) 280 (5.6) 7951 (2.77) 624 (5.2)
危机 81 (0.3) 9 (0.3) 216 (0.5) 10 (0.3) 6072 (2.90) 102 (2.1) 6369 (2.22) 121 (1)
生病的 415 (1.4) 148 (4.3) 1054 (2.21) 182 (4.9) 5467 (2.62) 370 (7.5) 6936 (2.42) 700 (5.8)
医生 682 (2.3) 183 (5.3) 2359 (4.95) 228 (6.2) 4623 (2.21) 323 (6.5) 7664 (2.67) 734 (6.1)
癌症 442 (1.5) 84 (2) 782 (1.64) 80 (2) 3691 (1.77) 139 (2.8) 4915 (1.71) 303 (2.5)
受伤 96 (0.3) 31日(1) 1256 (2.64) 45 (1) 3990 (1.91) 104 (2.1) 5342 (1.86) 180 (1.5)
疫情 1091 (3.63) 16 (0.5) 533 (1.12) 24 (0.7) 2920 (1.40) 139 (2.8) 4544 (1.58) 179 (1.5)
研究 523 (1.7) 159 (4.6) 712 (1.49) 178 (4.8) 3006 (1.44) 264 (5.3) 4241 (1.48) 601 (5.0)
损害 1315 (4.37) 78 (2) 882 (1.85) 119 (3.2) 2237 (1.07) 156 (3.1) 4434 (1.55) 353 (2.9)
伤害 1503 (5.00) 139 (4.0) 1888 (3.97) 180 (4.9) 8253 (3.95) 303 (6.1) 11644 (4.06) 622 (5.1)
有害的 492 (1.6) 40 (1) 643 (1.35) 49 (1) 2892 (1.38) 143 (2.9) 4027 (1.40) 232 (1.9)
病人 162 (0.5) 61 (2) 1103 (2.31) 82 (2) 1741 (0.83) 122 (2.5) 3006 (1.05) 265 (2.2)
咳嗽 262 (0.9) 141 (4.1) 415 (0.9) 163 (4.4) 1130 (0.54) 257 (5.2) 1807 (0.63) 561 (4.6)
胸部 105 (0.4) 108 (3.1) 127 (0.3) 133 (3.6) 431 (0.2) 227 (4.6) 663 (0.2) 468 (3.9)
预防 96 (0.3) 6 (0.2) 246 (0.5) 14 (0.4) 529 (0.3) 31日(1) 871 (0.3) 51 (0.4)
吸烟 3486 (11.60) 430 (12.5) 4145 (8.71) 435 (11.8) 15604 (7.47) 604 (12.2) 23235 (8.10) 1469 (12.15)
辞职 3017 (1036) 823 (23.9) 3567 (7.49) 853 (23.2) 17365 (8.31) 1160 (23.36) 23949 (8.35) 2836 (23.45)
图1。在电子烟和电子烟使用相关的肺损伤(EVALI)爆发期间,推特(A)和Reddit (B)上定义健康问题的热门词汇。
查看此图
年龄相关关键词分析

2019年7月、8月和9月与年龄段相关的前6个词汇分别出现在图2推特和Reddit的频率。在与年龄相关的关键词中,孩子们是2019年8月之后推特和Reddit上使用最多的词。推特上的其他常用词汇包括青春,青春,孩子,而且少年.Reddit上的帖子通常包含这样的词家长,学校,而且家庭

在我们的数据集中包括与年龄相关的关键字孩子,成人,孩子,年轻人,老年人,青年,父母,学校,年龄,学生,家庭,青少年,未成年人,母亲,丈夫,妻子,青少年,父亲,而且阿姨分别在2019年7月、8月和9月。卡方检验结果(表S5)多媒体附件2)显示,在这3个月中,Twitter和Reddit上与年龄相关的关键字之间存在显著差异和较小的效应量,并表明Twitter上与年龄相关的关键字比Reddit上更频繁地被提及。临床审查的帖子内容只关注年轻人和年轻人的提及,并发现不同的结果,显示Twitter有22.9%(132/577)的帖子提到了年轻人,Reddit有28.5%(165/578)的帖子提到了这一群体。

图2。在电子烟和电子烟使用相关的肺损伤(EVALI)爆发期间,推特(A)和Reddit (B)上关于年龄组的热门词汇。
查看此图
营销相关关键字分析

关于电子烟营销的常用词汇在推特和Reddit上高度相似,包括销售,商业,市场,黑市,而且促进.在EVALI爆发的3个月里,Twitter和Reddit上排名前5的营销相关词汇的趋势如下所示图3.提到的销售,黑市,而且商业从2019年7月到2019年9月,推特和Reddit的访问量有所增加。

在我们的数据集中包括营销相关的关键字黑市,黑市,市场,销售,新闻,促销,营销,商业,黑市,而且媒体2019年7月、8月和9月。卡方检验结果(表S6)多媒体附件2)显示,在这3个月里,在Twitter和Reddit上发布的营销相关关键词之间存在显著差异,但效应量较小,这表明这些关键词在Twitter上的讨论频率高于Reddit。临床分析侧重于营销法规和政策,结果不同,Twitter讨论政策的时间占8.3% (48/577),Reddit讨论政策的时间占20%(116/578)。

图3。在电子烟和电子烟使用相关肺损伤(EVALI)爆发期间,推特(A)和Reddit (B)上最热门的营销相关词汇。
查看此图
电子烟产品关键字分析

电子烟产品关键字的详细分布和百分比列于多媒体,在推特和Reddit上,与电子烟有关的热门词汇显示在图4.在这两个平台上,关于电子烟成分或产品最常见的词是香烟,以及提及与大麻相关的关键词(杂草生物多样性公约THC,大麻)和酒精也很普遍。在Reddit上,关于产品组件的特定关键字,例如汁,墨盒,而且液体,这种情况更为常见。Reddit上最常见的词汇包括香烟产品,这一数据在不同月份有所不同。推特上最常见的词汇包括香烟烟草,产品并在2019年8月至2019年9月保持一致。基于TF-IDF评分,如图所示多媒体,我们发现推特帖子中最重要的单词包括香烟,烟草,产品,四氢大麻酚,而且尼古丁,而Reddit帖子中最重要的词包括尼古丁,香烟,果汁,而且杂草。电子烟产品相关的关键字在我们的数据集中包括香烟,烟草,产品,四氢大麻酚,香烟,尼古丁,果汁,juul,药筒,液体,大麻,化学品,酒精,电子烟,大麻,cbd,香料,而且成分基于2019年7月、8月和9月的数据集。卡方检验结果(表S7)多媒体附件2)显示,在这3个月里,在Twitter和Reddit上发布的电子烟产品相关关键词之间存在显著差异,但效应量较小,发现基于百分比,更多的电子烟产品相关关键词在Twitter上被提及。临床分析发现了不同的结果,显示大麻相关关键词在Reddit(208/578, 35.9%)上被提及的频率是Twitter(77/577, 13.3%)的两倍多。

图4。在电子烟和电子烟使用相关肺损伤(EVALI)爆发期间,推特(A)和Reddit (B)上定义电子烟成分的热门词汇。THC:四氢大麻酚。
查看此图
戒烟vap

此外,我们的数据集中还包括了与戒烟相关的关键字辞职戒烟、停止而且比较推特和Reddit上的模式差异。卡方检验结果显示,在3个月和整体上,两个平台之间的发帖差异显著,但效应量较小,显示基于百分比的戒烟相关词汇在Twitter上被提及的频率更高(表S8)多媒体附件2)。临床分析显示了不同的结果,Reddit有21.8%(126/578)的帖子与戒烟有关,Twitter有6.4%(37/577)的帖子与戒烟有关。


主要研究结果及影响

随着电子烟近年来变得越来越流行,社交媒体平台上关于其发展方向、政策和健康内涵的讨论也越来越多,这项研究说明了2019年EVALI爆发期间推特和Reddit上情绪和关键词内容的差异。从这段时间内与电子烟相关的帖子频率趋势来看,与电子烟相关的内容在7月至8月期间增长缓慢,在8月至9月期间急剧上升。此外,在EVALI爆发期间,参与这些讨论的Twitter和Reddit用户数量显著增加。与EVALI疫情爆发同时,与电子烟相关的社交媒体内容的频率越来越高,这一趋势在两个流行的社交媒体平台上达到顶峰,这一事实支持了社交媒体作为监测系统的效用,用于探索与公共卫生电子烟相关的危机期间自然发生的实时反应和沟通。

重要的是,根据我们的内容分析,Twitter和Reddit上关于电子烟的帖子主要包含了对电子烟的积极情绪。然而,根据所识别的最流行的内容类型,这两个平台有明显的不同。具体来说,Reddit用户倾向于透露个人吸电子烟的经历和对电子烟好处、政策和产品的看法,包括潜在的限制性电子烟政策可能对电子烟用户产生的负面影响(即,更少地获得有助于戒烟的电子烟产品)。Reddit上提到大麻的次数是推特上的2倍,还经常包括向其他Reddit用户询问特定电子烟产品的安全性,以及哪些症状(如果有的话)应该引起关注或就医。相比之下,推特上包含了更多关于电子烟的主流媒体内容,特别是与EVALI病例的增加有关。我们还观察到推特信息流包含了吸引眼球的负面情绪和更多的负面情绪表达,包括杀了坏的,危险的关注,严重的,此外,还增加了关于电子烟可能对健康造成的负面影响的内容,包括上瘾。虽然两个平台都提到了年轻人,但推特强调了关于青少年中电子烟流行和EVALI的头条,以及如何限制将电子烟产品作为戒烟辅助的成年人,而在Reddit上,与年轻人有关的提及主要是个人描述自己的电子烟行为,包括从青少年开始吸电子烟。

总之,我们在两种社交媒体渠道上观察到内容主题频率上的许多有意义的差异。这些差异可能是由于个人社交网络的方式以及他们在每个平台上讨论的动机。例如,推特上的信息被称为新闻报道的社交媒体平台,记者和主要新闻提供商最常使用推特播报新闻,并在重大事件发生时实时向公众通报最新情况。69].这可能解释了为什么推特上与电子烟相关的负面帖子频率更高,因为在EVALI爆发的整个过程中,记者和他们的观众利用这个平台进行更新和互动,特别是在它演变成一场导致许多人住院和数人死亡的危机时。相比之下,Reddit与其他社交媒体平台的不同之处在于,由于其匿名用户系统和慷慨的字符限制,它促进了更坦诚的讨论,包括关于药物使用行为的交流;这可能就是为什么我们发现描述个人吸电子烟经历的内容更普遍的原因。

与以往工作的比较

我们发现的差异也可能是由于用户之间的差异。例如,Twitter的用户群体主要是白人成年人,他们拥有更高的教育程度,比普通公众更有可能被认为是民主党人,10%的用户创造了80%的推文[70].相比之下,Reddit用户的受教育程度往往不同,居住在城市或郊区。71].美国疾病控制和预防中心发现,在有色人种中,吸电子烟的比例高于白人。72],而另一项研究表明,受教育程度越高,使用电子烟的几率就越低[73].这表明,Reddit上的用户可能比Twitter上的用户更有可能吸电子烟,这解释了他们在个人电子烟相关经历的分享模式上的不同,以及对限制性政策的担忧。

限制

本文的研究结果应在其局限性的范围内加以考虑。首先,我们只分析了这些平台上基于文本的帖子或消息。虽然这为我们提供了来自每个社交媒体网站的大量数据信息,但它不包括可供进一步分析的大量多媒体内容,包括照片、视频和链接。其次,由于Twitter上的字符限制和Reddit帖子的无限长度,每个帖子中的字数之间的差异可能会影响本研究中的情绪和关键字分析。第三,由于我们收集数据的时间安排,我们没有收集与COVID-19及其对电子烟使用者和电子烟政策的影响有关的信息,这使我们无法识别最近的影响。第四,我们最初用于从Twitter和Reddit提取电子烟相关数据集的关键字列表可能包含更多与健康相关的负面关键字,这可能会影响情绪和健康结果方面的结果,导致我们的关键字列表存在潜在的选择偏差。由于这项研究的重点是疫情期间推特和Reddit上与电子烟相关的主题的健康问题,关键字列表包括多个与情绪相关的单词。这会给我们的情绪分析结果带来偏差,但这些词是选择相关帖子和解决我们研究问题的关键。此外,我们应用了GetOldTweets和Pushshift api来基于关键字列表提取数据。由于这些api的提取机制是寻找与某个关键字字段相同的帖子,而不是进一步过滤匹配的帖子,因此提取的数据集可能包括机器人的帖子而不是真实用户的帖子,这可能会对我们的情绪结果产生偏差。 We plan to apply different methods to clean the posts generated by bots in our future studies. However, the use of this data set was in line with the larger aims of this study, which were to better understand the content and sentiment surrounding vaping on Twitter and Reddit to inform the development of potential identification and outreach methods on social media to those at risk of negative health outcomes to improve public health. The fifth limitation was that we applied an existing tool VADER to analyze the sentiment of the posts, and thus, it could bias to our sentiment analysis results, which are common issues for any sentiment analysis tool owing to the complex dynamics of human expressions, emotions, and contexts. In the future, we will also consider creating a sentiment analysis model optimization with social media posts to overcome the current disadvantages of not effectively identifying sarcastic sentences.

未来的发展方向

总的来说,这项研究的结果揭示了推特和Reddit作为公共卫生危机发生和演变时公开可用的社交媒体数据源的优势。与吸电子烟者或有兴趣戒烟的人一起工作的健康从业者应该意识到与电子烟有关的信息和可能的错误信息,并努力评估在各种平台上的社交媒体参与是否会影响持续使用或成为戒烟的障碍。本文分享的结果还可以通知社交媒体公司和公共卫生官员,提醒他们注意这些网站上的电子烟产品营销,并鼓励保护Reddit上旨在支持戒烟的社区。此外,为了改善公共卫生覆盖面,未来的研究可以探索利用每个平台的内容和网络类型的自动检测机制,特别是研究识别正在吸电子烟并可能需要戒烟信息和支持的用户的潜力。这可能有助于制定有效和及时的社交媒体知情的主动外联策略,以分发关于电子烟的健康教育,包括停止电子烟的策略。

致谢

作者在此感谢美国南卡罗来纳哥伦比亚大学(USC)提供的资金支持(资助80002838);南加州大学大数据健康科学中心的部分支持,这是南加州大学卓越倡议计划(授予BDHSC-2021-14和BDHSC-2022);以及南加州大学通过研究和创新中心(ACORN-2022)和美国国立卫生研究院(K02 DA043657, UL1 TR002377和R34 DA054725)提供的研究资助。内容仅为作者的责任,并不代表资助机构的官方观点。

数据可用性

通过向通讯作者提出合理的请求,研究人员可以访问本手稿中分析的数据集。

作者的贡献

DW和EK贡献均等,PAC-R担任资深作者。

利益冲突

没有宣布。

多媒体附件1

用于数据提取的关键字和术语。

DOCX文件,13kb

多媒体附件2

统计分析结果。

DOCX文件,29 KB

多媒体

电子烟产品相关关键词在Twitter和Reddit上的分布及词频-文档频率倒数得分。

DOCX文件,22 KB

  1. 张志刚,张志刚,张志刚,张志刚,等。电子烟在美国成年人中的流行和分布:行为风险因素监测系统,2016年。安实习生医学2018年10月02日;169(7):429-438。[CrossRef] [Medline
  2. 在COVID-19大流行期间,青少年使用电子烟仍是严重的公共卫生问题。疾病控制和预防中心,2021年。URL:https://www.cdc.gov/media/releases/2021/p0930-e-cigarette.html[2021-12-07]访问
  3. Singh S, Windle SB, Filion KB, Thombs BD, O'Loughlin JL, Grad R,等。电子烟与青少年:使用模式、潜在危害和建议。2020年2月03日;133:106009。[CrossRef] [Medline
  4. El-Mahdy MA, Mahgoup EM, e威士MG, Eid MS, Abdelghany TM, Zweier JL。长期接触电子烟会诱发类似于卷烟的心血管功能障碍:尼古丁的作用和接触时间。Am Physiol Heart Circ Physiol 2021年5月01日;320(5):H2112-H2129 [免费全文] [CrossRef] [Medline
  5. Park E, Kwon M, Gaughan MR, Livingston JA, Chang Y.倾听青少年对电子烟的认知和信息来源。儿科护士2019;48:82-91。[CrossRef] [Medline
  6. 莫瑞安,李志强,李志强,李志强,等。青少年对JUUL电子烟尼古丁强度和电子烟状态的认识。药物酒精依赖2019年11月1日;204:107512 [免费全文] [CrossRef] [Medline
  7. 斯特龙博特恩K辛德拉尔J巴克尔J谁,我?对美国青少年戒烟能力的乐观偏见。成瘾2021年11月;116(11):3180-3187 [免费全文] [CrossRef] [Medline
  8. 使用电子烟或电子烟产品相关的肺损伤暴发。疾病控制和预防中心,2020年。URL:https://www.cdc.gov/tobacco/basic_information/e-cigarettes/severe-lung-disease.html#latest-information[2021-09-11]访问
  9. 电子烟疾病最新消息:FDA警告公众停止使用含四氢大麻酚(THC)的电子烟产品和任何从街上获得的电子烟产品。美国食品和药物管理局,2021年。URL:https://www.fda.gov/consumers/consumer-updates/vaping-illness-update-fda-warns-public-stop-using-tetrahydrocannabinol-thc-containing-vaping[2021-09-11]访问
  10. Kazemi DM, Borsari B, Levine MJ, Dooley B.社交媒体平台对非法药物使用监控的系统回顾。J Public Health (Oxf) 2017 Dec 01;39(4):763-776 [免费全文] [CrossRef] [Medline
  11. Skaik R, Inkpen D.使用社交媒体进行心理健康监测:综述。ACM计算调查2021年11月30日;53(6):1-31。[CrossRef
  12. 阿米尔S,德雷泽M,艾尔斯JW。通过社交媒体和数字队列进行心理健康监测。在:第六届计算语言学和临床心理学研讨会论文集。2019年发表于:CLPsych '19;2019年6月6日;明尼阿波利斯,明尼苏达州,美国,第114-120页。[CrossRef
  13. Paul MJ, Sarker A, Brownstein JS, Nikfarjam A, Scotch M, Smith K,等。社会媒体挖掘用于公共卫生监测和监督。见:2016年太平洋生物计算研讨会论文集。2016年发表于:PBS '16;2016年1月4-8日;大岛,HI,美国p. 468-479。[CrossRef
  14. Aiello AE, Renson A, Zivich PN。基于社会媒体和互联网的公共卫生疾病监测。年度修订公共卫生2020年4月02日;41:101-118 [免费全文] [CrossRef] [Medline
  15. 蒋凯,冯s,宋q, Calix RA, Gupta M, Bernard GR.基于词嵌入和LSTM神经网络的个人健康体验推文识别。BMC Bioinformatics 2018 Jun 13;19(增刊8):210 [免费全文] [CrossRef] [Medline
  16. odabam .关于美国人和推特的10个事实。皮尤研究中心,2022年5月5日。URL:https://www.pewresearch.org/fact-tank/2019/08/02/10-facts-about-americans-and-twitter/[2022-03-30]访问
  17. 普杰,金世伟,金俊杰。社交网站在连接和维系社会资本方面的用途和满足感:Facebook、Twitter、Instagram和Snapchat的比较。计算机人类行为,2017年7月;72:115-122。[CrossRef
  18. Berry N, Lobban F, Belousov M, Emsley R, Nenadic G, Bucci S. #为什么我们推特tmh:理解为什么人们使用推特讨论心理健康问题。J Med Internet Res 2017 Apr 05;19(4):e107 [免费全文] [CrossRef] [Medline
  19. Makita M, Mas-Bleda A, Morris S, Thelwall M.心理健康意识周期间推特上的心理健康演讲。问题医疗护理2021年5月;42(5):437-450。[CrossRef] [Medline
  20. 张志强,何伟,冯志强,梁辉,傅志强,谢志涛。利用Twitter进行公共卫生监测,从监测和预测到公众反应。数据2019;4(1):6。[CrossRef
  21. 戴晓霞,王晓明,王晓明。从社交媒体到公共卫生监测:基于词嵌入的推特分类聚类方法。见:2017年东南展会议记录。2017年发表于:SECON '17;2017年3月30日- 4月2日;康科德,北卡罗来纳州,美国p. 1-7。[CrossRef
  22. Allem JP, Majmundar A, Dharmapuri L, Cruz TB, Unger JB。2018年与电子液体相关的Twitter帖子:专题分析。成瘾行为代表2019年12月10日100196 [免费全文] [CrossRef] [Medline
  23. McCausland K, Maycock B, Leaver T, Wolf K, Freeman B, Jancey J.推特上的电子烟倡导者:电子烟相关推文的内容分析。JMIR公共卫生监测2020年10月14日;6(4):e17543 [免费全文] [CrossRef] [Medline
  24. Valdez D, Ten Thij M, Bathina K, Rutter LA, Bollen J.社交媒体对COVID-19大流行期间美国心理健康的洞察:对Twitter数据的纵向分析。J Med Internet Res 2020 Dec 14;22(12):e21418 [免费全文] [CrossRef] [Medline
  25. Rhidenour KB, Blackburn K, Barrett AK, Taylor S.调解医用大麻:探索退伍军人如何在Reddit上讨论他们被污名化的物质使用。卫生公共2022年9月;37(10):1305-1315。[CrossRef] [Medline
  26. Pestana J, Beccaria F, Petrilli E.在Reddit精神病社区使用迷幻物质。动机与模式的质性研究。今日毒品与酒精2021;21(2):112-123。[CrossRef
  27. Green JL, Vosburg SK, Robbins R, Faraone SV, Antshel KM。物质使用轨迹:从Reddit招募的成年人中通过非口服途径使用处方兴奋剂的非医疗使用(NMU)。CNS specter2021年5月10日;26(2):166-167 [免费全文] [CrossRef
  28. Andalibi N, Haimson OL, De Choudhury M, Forte A.通过寻求支持和匿名的镜头来理解社交媒体披露的性虐待。2016 CHI Conference on Human Factors In Computing Systems. 2016年5月发表于:CHI '16;2016年5月7-12日;美国加州圣何塞p. 3906-3918。[CrossRef
  29. 考夫曼MR,巴泽尔AT,科拉科A,塞多克J。“这部剧在很多层面上都切中了我们的心”:分析Reddit上关于HBO《Euphoria》的评论,以了解观众对药物使用和精神疾病的经历和反应。药物酒精依赖2021年3月1日;220:108468 [免费全文] [CrossRef] [Medline
  30. Vosburg SK, Robbins RS, Antshel KM, Faraone SV, Green JL。描述从Reddit招募的成年人中非口服处方兴奋剂非医疗使用的途径。前沿精神病学2021年1月25日;11:631792 [免费全文] [CrossRef] [Medline
  31. Lu J, Sridhar S, Pandey R, Al Hasan M, Mohler G.通过Reddit数据的文本挖掘研究过渡到药物成瘾。见:第25届ACM SIGKDD知识发现与数据挖掘国际会议论文集。2019年7月发表于:KDD '19;2019年8月4日至8日;安克雷奇,美国,AK, p. 2367-2375。[CrossRef
  32. Kwon M, Park E.社交媒体平台上对电子烟的认知和情绪:系统评价。JMIR公共卫生监测2020年1月15日;6(1):e13673 [免费全文] [CrossRef] [Medline
  33. 徐亚,金HM,王勇,吴杰,洪T, McLaughlin M.公众对Reddit上电子烟禁令的反应和担忧:纵向主题建模方法。在:第13届社会计算和社会媒体国际会议论文集:体验设计和社会网络分析。2021年发表于:SCSM '21;2021年7月24日至29日;虚拟p. 391-403。[CrossRef
  34. 肖K,沃特金斯SL. Reddit上的电子烟戒烟:用户如何讨论他们的戒烟经验,社会支持和戒烟建议。爱荷华大学公共卫生学院,2020年。URL:https://www.public-health.uiowa.edu/wp-content/uploads/2020/12/Kamara-Shaw.pdf[2022-03-30]访问
  35. Allem JP, Majmundar A, Dharmapuri L, Unger JB, Cruz TB。Reddit论坛上关于电子烟产品的评论。Tob Prev Cessat 2019年9月12日;5:29 [免费全文] [CrossRef] [Medline
  36. Iqbal M. Twitter收入和使用统计数据。应用业务,2022年。URL:https://www.businessofapps.com/data/twitter-statistics/[2022-01-29]访问
  37. 以下是推特有毒的3个原因,以及你该如何保护自己。通知》2021。URL:https://notifier.so/docs/3-reasons-why-twitter-is-so-toxic-and-how-you-can-protect-yourself/[2022-01-29]访问
  38. satleberg W. Reddit的人口统计数据:谁在使用这个网站?2021年4月6日URL:https://www.alphr.com/demographics-reddit/[2022-01-29]访问
  39. 改变我的想法:Reddit是一个社交网络,而且是最好的一个。Android Authority, 2021年10月17日。URL:https://www.androidauthority.com/reddit-vs-facebook-vs-twitter-3037642/[2022-01-29]访问
  40. Myslín M,朱SH,查普曼W,康威M.使用twitter调查吸烟行为和对新兴烟草产品的看法。J Med Internet Res 2013 Aug 29;15(8):e174 [免费全文] [CrossRef] [Medline
  41. Visweswaran S, Colditz JB, O'Halloran P, Han NR, Taneja SB, Welling J,等。用于Twitter监视电子烟的机器学习分类器:比较机器学习研究。J Med Internet Res 2020 Aug 12;22(8):e17478 [免费全文] [CrossRef] [Medline
  42. 张文杰,张文杰,张文杰,等。网络电子烟叙事与COVID-19的交叉:主题建模研究。J Med Internet Res 2020年10月30日;22(10):e21743 [免费全文] [CrossRef] [Medline
  43. 刘娟,陈志强,陈志强,等。吸烟者参与推特上关于电子烟使用相对危害的信息和错误信息的可能性:来自一项随机对照试验的结果。JMIR公共卫生监测2021年12月21日;7(12):e27183 [免费全文] [CrossRef] [Medline
  44. 陈琳,陆旭,袁健,罗健,罗健,谢震,等。一项关于调味电子烟与健康症状相关性的社交媒体研究:观察性研究J Med Internet Res 2020 Jun 22;22(6):e17496 [免费全文] [CrossRef] [Medline
  45. Struik L, Yang Y.电子烟戒烟:Reddit上一个戒烟社区的内容分析。J Med Internet Res 2021 10月25日;23(10):e28303 [免费全文] [CrossRef] [Medline
  46. Priya S, Sequeira R, Chandra J, Dandapat SK。人们应该从哪里获得新闻更新:Twitter或Reddit。在线Soc网络媒体2019年1月;9:17-29。[CrossRef
  47. Dulam RV, Murthy M, Luo J.看穿烟雾:使用Reddit和Twitter数据对电子烟口味、品牌和市场进行的全球比较研究。arXiv 2020 Feb 4:1-7 [免费全文
  48. Kasson E, Singh AK, Huang M, Wu D, Cavazos-Rehg P.使用混合方法确定2019年EVALI爆发期间推特上公众对电子烟风险和整体健康结果的看法。Int J Med Inform 2021年11月;155:104574 [免费全文] [CrossRef] [Medline
  49. GetOldTweets3 0.0.11。Python包索引。2019。URL:https://pypi.org/project/GetOldTweets3/[2022-01-21]访问
  50. Chandrasekaran R, Mehta V, Valkunde T, Moustakas E.关于COVID-19大流行的推文主题、趋势和情绪:时间信息监测研究。J Med Internet Res 2020年10月23日;22(10):e22624 [免费全文] [CrossRef] [Medline
  51. Pushshift Reddit API v4.0文档。Pushshift》2018。URL:https://reddit-api.readthedocs.io/en/latest/#searching-submissions[2021-10-01]访问
  52. Cambria E, Das D, Bandyopadhyay S, Feraco A.情感分析实用指南。瑞士占姆:施普林格;2017.
  53. 黄敏,ElTayeby O, Zolnoori M,姚林。公众对疾病的看法:基于新闻媒体数据的信息流行病学研究。J Med Internet Res 2018 May 08;20(5):e10047 [免费全文] [CrossRef] [Medline
  54. Hutto C, Gilbert E. Vader:一个节俭的基于规则的社交媒体文本情感分析模型。在:第八届国际AAAI会议论文集关于博客和社交媒体。2014年5月16日发表于:ICWSM '14;2015年5月27-29日;安娜堡,密歇根州,美国p. 216-225。[CrossRef
  55. Turner J, Kantardzic M, Vickers-Smith R.关于大麻二酚的个人和商业推文的信息流行病学检查:术语和情感分析。J Med Internet Res 2021 12月20日;23(12):e27307 [免费全文] [CrossRef] [Medline
  56. Krawczyk K, Chelkowski T, Laydon DJ, Mishra S, Xifara D, Gibert B,等。量化COVID-19大流行的在线新闻媒体报道:文本挖掘研究和资源。J Med Internet Res 2021 Jun 02;23(6):e28253 [免费全文] [CrossRef] [Medline
  57. 盖泽尔,阿里。R.文本挖掘:使用TF-IDF来检查单词与文档的相关性。应用计算机学报,2018年7月16日;21(1):25-29。[CrossRef
  58. 李建平,李志强,李志强。烟草相关推特数据的编码方法研究。J Med Internet Res 2017 Mar 31;19(3):e91 [免费全文] [CrossRef] [Medline
  59. Elo S, Kyngäs H.定性内容分析过程。中华儿科杂志2008年4月2日(1):107-115。[CrossRef] [Medline
  60. van der Tempel J, Noormohamed A, Schwartz R, Norman C, Malas M, Zawertailo L. Vape,退出,twitter ?推特上的电子烟和戒烟。国际公共卫生杂志2016年3月61日(2):249-256。[CrossRef] [Medline
  61. 马丁内斯LS,休斯S,沃尔什-布希ER,祖MH "好的,我们明白了。你抽电子烟”:对推特上关于电子烟的地理编码内容、上下文和情绪的分析。中华卫生杂志2018;23(6):550-562。[CrossRef] [Medline
  62. McCausland K, Maycock B, Leaver T, Jancey J.电子烟相关社交媒体推广和讨论中呈现的信息:范围审查。J Med Internet Res 2019 Feb 05;21(2):e11953 [免费全文] [CrossRef] [Medline
  63. Miech R, Patrick ME, O'Malley PM, Johnston LD.孩子们在抽什么电子烟?一项针对美国青少年的全国性调查结果。Tob Control 2017 july;26(4):386-391 [免费全文] [CrossRef] [Medline
  64. Budney AJ, Sargent JD, Lee DC。吸大麻(大麻):与电子烟类似的问题?成瘾2015年11月;110(11):1699-1704 [免费全文] [CrossRef] [Medline
  65. 索尔斯SJ,克劳斯MJ,康诺利S,卡瓦佐斯-雷格PA。2014年11月Twitter上电子烟广告的内容分析慢性疾病2016年9月29日;13:E139 [免费全文] [CrossRef] [Medline
  66. 评价者间信度:kappa统计量。生物化学医学(萨格勒布)2012;22(3):276-282 [免费全文] [CrossRef] [Medline
  67. 对叙述数据进行编码时建立可靠性的指南。新兴成人2015年5月26日;3(6):375-387。[CrossRef
  68. 李继林,戴凯普M,德雷泽M, Chisolm MS, Berger ZD。健康相关用户在推特上发什么?推特上健康相关用户及其信息的定性内容分析J Med Internet Res 2014 10月15日;16(10):e237 [免费全文] [CrossRef] [Medline
  69. Orellana-Rodriguez C, Keane MT.关注新闻及其在Twitter上的传播:一项调查。计算科学,2018年8月;29:74-94。[CrossRef
  70. Wojcik J, Hughes A.评估Twitter用户。皮尤研究中心2019年4月24日。URL:https://www.pewresearch.org/internet/2019/04/24/sizing-up-twitter-users/[2022-03-22]访问
  71. Duggan M, Smith A. 6%的成人在线用户是reddit用户。皮尤研究中心,2013年7月3日。URL:https://www.pewresearch.org/internet/2013/07/03/6-of-online-adults-are-reddit-users/[2022-03-22]访问
  72. 电子烟在初高中学生中的使用特征-美国,2015。疾病控制和预防中心,2016。URL:https://www.cdc.gov/tobacco/data_statistics/mmwrs/byyear/2016/mm655051a2/index.html[2022-03-22]访问
  73. Assari S, Mistry R, Bazargan M.种族,教育程度和电子烟的使用。中国生物医学工程学报(英文版);2011;30 (1):344 - 344 [免费全文] [CrossRef] [Medline


API:应用程序接口
CS:计算机科学
EVALI:电子烟和电子烟使用相关的肺损伤
TF-IDF:术语频率-逆文档频率
维德:价感字典和情感推理器


编辑:T Leung;提交11.05.22;作者:邓涛,张宏,周r, N Ezike, W Ceron;对作者10.08.22的评论;修订本收到16.09.22;接受29.10.22;发表13.12.22

版权

©Dezhi Wu, Erin Kasson, Avineet Kumar Singh, Yang Ren, Nina Kaiser, Ming Huang, Patricia A Cavazos-Rehg。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 13.12.2022。

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map