发表在第21卷第七名(2019): 7月

2018年Swisher小雪茄相关推文特征:文本分析

2018年Swisher小雪茄相关推文特征:文本分析

2018年Swisher小雪茄相关推文特征:文本分析

原始论文

1南加州大学凯克医学院,加州洛杉矶,美国

2南加州大学计算机科学系,美国加州洛杉矶

通讯作者:

Jon-Patrick Allem,文学硕士,博士

南加州大学凯克医学院

N索托街2001号

加州洛杉矶,

美国

电话:1 8586030812

电子邮件:allem@usc.edu


背景:小雪茄在美国越来越受欢迎,斯威舍是市场的领导者。与使用swisher相关产品相关的背景和体验研究不足,但这些信息可以通过Twitter上的公开帖子获得。

摘要目的:这项研究旨在分析Twitter帖子,以描述Twitter用户最近使用swisher相关产品的经历。

方法:分析了2018年1月1日至2018年12月31日期间包含“swisher”一词的推特帖子。文本分类器用于识别帖子中的主题(n=81,333)。

结果:最流行的话题是个人标签(在一篇文章中提到了一个Twitter账户;32.77%),其次是口味(例如,葡萄和草莓;20.96%),衣着时髦的人使用(例如,烟嗖嗖器;17.44%)。包括其他主题吸食大麻(例如,冲,滚,内脏swisher;6.26%),上诉(例如,像斯威舍;5.92%),不喜欢(例如,对Swisher产品表示不满的帖子;3.53%),购买(例如,买swisher;1.90%),雪茄的比较(例如,提到其他雪茄产品,包括白猫头鹰和Backwoods;1.64%)。

结论:本文描述了2018年推特上发布的人群使用斯威舍小雪茄的常见背景和经历。这些在线信息可能会对与烟草相关的行为产生线下后果,这表明需要公共卫生官员进行反击。调查结果将为我们提供针对斯威士小雪茄的监测、政策和干预目标,以及传播计划和推特上的烟草产品柜台信息。

中国医学网络杂志2019;21(7):e14398

doi: 10.2196/14398

关键字



小雪茄在美国越来越受欢迎,Swisher是市场领导者。1].小雪茄比香烟含有大量的尼古丁和相对较多的一氧化碳[2].已经确定了促成小雪茄使用增长的几个因素,包括其口味的可用性、对使用危害的误解、烟草业的促销策略以及较低的成本[3.4].例如,成年吸烟者认为,小雪茄(与香烟相比)的价格较低是他们开始并继续使用雪茄的一个原因。2].烟草行业的内部文件显示,烟草公司有意模糊小雪茄和香烟之间的界限,以增加对吸烟者的吸引力,而香料的使用促进了这些努力。5].

雪茄消费市场、文化趋势和烟草产品健康政策都在不断变化。6].与少量雪茄使用相关的背景和经历不断变化,因此必须及时提供有关这些问题的信息,为监测、政策和干预目标提供信息,以解决使用少量雪茄的问题。Twitter上的公开帖子可以被监控,以便快速捕捉和描述人们有机地讨论这种产品时使用雪茄的背景。通过这种方式,推特上的帖子可以作为一个焦点小组,提供可能对烟草控制很重要的新见解。在美国成年人中,有24%的男性、21%的女性、21%的白人、24%的非洲裔美国人和25%的西班牙裔美国人使用Twitter。7].在这项研究中,我们从推特上收集了数据来描述2018年与swisher相关的对话。我们的目标是描述公众最近使用斯威舍的经历,包括了解小雪茄的使用背景。


数据收集

包含“swisher”一词的Twitter (twitter.com)帖子从2018年1月1日至2018年12月31日期间的Twitter流应用程序界面(使用Twitter4J库收集推文的过滤流,收集时间无间隔)中获得。“swisher”一词与之前利用社交媒体数据对小雪茄进行的研究一致[8].在此期间,我们共记录了111,263个帖子。

数据处理

为了准备用于分析的数据,我们排除了非英语推文、转发推文、Swisher被识别为姓氏的推文,以及被识别为社交机器人的推文。9最终的分析样本来自57,838名独立用户的81,333条推文。

根据先前的研究[1011],分析样本中的所有推文都进行了基本规范化(例如,所有推文都用小写,删除额外的空格,单词之间的标点符号,以及括号等特殊字符),停止词删除(例如,“a”和“the”等单词),词元化(例如,通过删除词形变化和变体将单词分解为基本形式),对Twitter账户的提及进行规范化(例如,@account_name被@person取代,这是所有账户的通用标记),删除不可打印的字符(例如,其他语言中的表情符号或符号),以及删除标签和url。所有分析都依赖于公开的匿名数据;遵守Twitter的条款和条件、使用条款和隐私政策;并获得了作者所在大学的机构审查委员会的批准。为了保护隐私,本报告没有逐字逐句地报道推文。

话题识别

根据先前的研究[1011],使用单词计数(频率)来检查推文,其中包括一个单词和两个单词的组合。从最初的评估中,作者确定了八个主要主题,包括口味(如葡萄和草莓),衣着时髦的人使用(例如,烟嗖嗖器),购买(例如,买swisher),上诉(如斯威舍),吸食大麻(例如,冲,滚,肠),雪茄的比较(例如,提到了其他雪茄产品,包括白猫头鹰和Backwoods),不喜欢(例如,对Swisher产品表示不满的帖子),以及个人标签(在@person的帖子中提到一个推特账户)。

最终,每条推文都通过检查单个单词或双单词组合(n-grams)的存在来进行分类。如果一条推文包含与某个主题相关的任何单词,则该推文被归类为该主题的一部分。总之,我们使用了一个用Python编写的基于规则的分类脚本,其中检查每条推文是否存在一组表示主题的指定n-grams [1011].对于每个分析,我们在混淆矩阵中展示结果,其中对角线表示主题的流行度,非对角线表示主题重叠。例如,一个假设的帖子,“嘿!@person试试斯威舍的新葡萄口味”可以归为个人标签而且口味.包含两个或两个以上主题的帖子的数量将在这些主题的矩阵的交点处找到。


这8个主题占推文语料库中所有推文的62.95%。剩下的37.05%的推文变化太大,无法划分为一个有意义的主题(例如,每个后续主题的覆盖率都小于推文总数的1%)。最流行的话题是标签(32.77%;看到多媒体附件1对于在本主题中发现的常见短语),然后是口味(20.96%)和衣着时髦的人使用(17.45%)。吸食大麻下一个流行话题(6.26%)是上诉(5.92%),不喜欢(3.53%),购买(1.90%)和雪茄的比较(1.64%)。衣着时髦的人使用而且口味重叠度最高(12.87%),其次是口味而且个人标签在(5.57%;文本框1而且表1).

在“Swisher”的帖子中发现的主题和常用词。这些词是为了为每个主题提供进一步的上下文,不是详尽的,并按字母顺序列出。

个人标签:

@ person

口味:

  • 樱桃
  • 味道
  • 葡萄
  • 芒果
  • 桃子
  • 菠萝
  • 南瓜
  • 草莓

衣着时髦的使用:

  • 打击
  • 通过
  • 泡芙
  • 试一试

吸引力:

  • 渴望
  • 享受
  • 就像
  • 需要
  • 想要

不喜欢:

  • 该死的
  • 没有
  • 狗屎

大麻的使用:

  • 肠道
  • 大麻
  • 杂草

购买:

  • 买了
  • 抓住
  • 支付

雪茄的比较:

  • 边远地区的
  • 白猫头鹰
文本框1。在“Swisher”的帖子中发现的主题和常用词。这些词是为了为每个主题提供进一步的上下文,不是详尽的,并按字母顺序列出。
表1。话题的流行度。对角线表示确定的八个主题的流行程度。非对角线表示主题重叠。所有值都以n(%)表示。

个人标签 口味 衣着时髦的人使用 吸食大麻 上诉 不喜欢 购买 雪茄的比较
个人标签 26656 (32.77) - - - - - -一个 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
口味 4533 (5.57) 17049 (20.96) - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
衣着时髦的人使用 3185 (3.92) 10464 (12.87) 14182 (17.44) - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
吸食大麻 1107 (1.36) 767 (0.94) 1344 (1.65) 5088 (6.26) - - - - - - - - - - - - - - - - - - - - - - - -
上诉 815 (1.00) 855 (1.05) 386 (0.47) 171 (0.21) 4817 (5.92) - - - - - - - - - - - - - - - - - -
不喜欢 661 (0.81) 295 (0.36) 287 (0.35) 72 (0.09) 25 (0.03) 2869 (3.53) - - - - - - - - - - - -
购买 310 (0.38) 393 (0.48) 333 (0.41) 134 (0.16) 20 (0.02) 40 (0.05) 1542 (1.90) - - - - - -
雪茄的比较 301 (0.37) 296 (0.36) 344 (0.42) 82 (0.10) 34 (0.04) 159 (0.20) 20 (0.02) 1332 (1.64)

一个不适用。


主要研究结果

在2018年推特上与swisher相关的帖子的研究中确定的主题,为公众最近使用小雪茄的经历提供了一些见解。口味在这项研究中是一个常见的主题,类似于早期基于推特的研究,重点关注烟草产品,如JUUL [10]和水烟[11].YouTube上发布的与雪茄相关的小视频的内容分析表明,共同的主题包括它们的糖果口味[12].2014年,在美国成年人的全国概率样本中,口味被认为是使用小雪茄和小雪茄的重要原因[3.].研究还表明,对小雪茄中风味风险的感知与这些产品的使用有关,特别是对风险较小的感知[13].此外,超过五分之二的美国初高中吸烟者报告说,他们使用有香味的小雪茄或有香味的香烟。14].综上所述,小雪茄的口味可能被视为联邦监管的优先领域,以降低这些小雪茄对各个年龄段消费者的吸引力,并提供统一的限制,使分销商和消费者难以绕过当地口味的限制。

在之前对与小雪茄相关的公共推文进行的评估中,Stepp和同事们发现,这些推文经常表达与特定品牌(Swisher Sweets和Black & Mild)的联系,并报告吸烟活动[15].在这项研究中,购买,Swisher使用,吸引力,雪茄比较,而且个人标签是数据中的常见主题。这些结果表明,推特用户正在谈论他们的吸烟行为;比较和对比他们对品牌的偏好;并直接与他们的追随者交流这些购买、偏好和活动。这些在线信息可能对与烟草有关的行为产生离线后果[16,这表明公共卫生官员需要反击这样的信息。

吸食大麻在本研究中是一个常见的话题。之前对Instagram帖子的分析显示,Swisher小雪茄经常被去内脏,里面塞满了大麻。8].小雪茄可能是尼古丁和大麻使用的交汇点,引起重大公共卫生问题,包括增加大麻和烟草之间过渡的风险[17],使用频率高[18],以及烟瘾[18].例如,在美国年轻人(18-34岁)中,曾经使用大麻被证明是开始定期使用小雪茄和小雪茄的一个预测因素[19].

之前的研究很少报道推特用户表达对烟草的不满。1011].然而,不喜欢是本研究确定的主题。虽然这一专题与任何其他专题没有强烈重叠,以表明进一步的背景,但它表明,公共卫生从业人员可能会放大一般形式的抱怨,以一般地劝阻烟草使用,特别是很少使用雪茄。

限制

这项研究的重点是推特上的帖子,其发现可能无法推广到其他社交媒体平台。数据收集依赖于Twitter的流媒体应用程序界面,这阻止了从私人账户收集推文。因此,我们的调查结果可能不代表拥有私人账户的个人的态度和行为。本研究中分析的帖子收集自12个月的时间段,可能无法推广到其他时间段。虽然只有一个小雪茄品牌是本次研究的重点,但Swisher是小雪茄市场的领导者,并且一直是之前研究的重点[8].

结论

本文描述了2018年推特上关于斯威舍小雪茄的讨论的常见背景和经历。主要的谈话主题包含某种形式的人际交流(人物标签),可以捕捉帖子的社会性质,标记另一个人,或将他们作为一个值得注意的来源。味道是第二常见的类别,是未来可能会受到监管以降低吸引力的主要特征。调查结果应为监测、政策和干预的目标提供信息,以解决小雪茄问题,以及传播规划和推特上的烟草产品反信息。

致谢

本出版物中报道的研究得到了国家癌症研究所和食品和药物管理局(FDA)烟草产品中心的Grant #U54 CA180905的支持。内容仅为作者的责任,并不一定代表美国国立卫生研究院(NIH)或FDA的官方观点。

作者的贡献

JA和SU构想了这项研究并分析了数据。JA起草了初稿。SU、TC、JU对重要的智力内容进行了修改,并通过了最终稿。JU和TC获得了这项研究的资金。

利益冲突

没有宣布。

多媒体附件1

在人物标记中发现的常见短语的词云。

PDF档案(adobepdf档案),7MB

  1. 美国疾病控制与预防中心2018年8月1日。烟草品牌偏好网址:https://www.cdc.gov/tobacco/data_statistics/fact_sheets/tobacco_industry/brand_preference[2019-03-26]访问
  2. Pickworth WB, Rosenberry ZR, Koszowski B.吸烟小雪茄的毒物暴露:进一步支持产品监管。Tob Control 2017 Dec;26(3):269-276。[CrossRef] [Medline
  3. 尼曼AL,斯特林KL,韦弗SR,马吉德BA,埃里克森议员。小雪茄和小雪茄:用户、感知和使用原因。土律科学2016 7月;2(3):239-251 [免费全文] [CrossRef] [Medline
  4. Sterling K, Majeed B, Nyman A, Eriksen M.成年吸烟者对小雪茄和小雪茄吸烟的风险认知。尼古丁Tob Res 2017年11月1日;19(11):1351-1358 [免费全文] [CrossRef] [Medline
  5. Kostygina G, Glantz S, Ling P.烟草行业使用香料来招募小雪茄和小雪茄的新用户。Tob Control 2016;25(1):66-74。[Medline
  6. Delnevo CD, Hrywna M, Giovenco DP, Miller Lo EJ, O'Connor RJ。很接近,但不是雪茄:某些雪茄是为了逃避监管而设计的伪香烟。Tob Control 2017 12月;26(3):349-354 [免费全文] [CrossRef] [Medline
  7. 佩林A,安德森M.皮尤研究中心。自2018年以来,使用包括Facebook在内的社交媒体的美国成年人的份额基本没有变化。https://www.pewresearch.org/fact-tank/2019/04/10/share-of-u-s-adults-using-social-media-including-facebook-is-mostly-unchanged-since-2018/[2019-05-08]访问
  8. Allem JP, Escobedo P, Chu KH, Boley Cruz T, Unger JB。Instagram上的小雪茄和小雪茄的图片被标签#swisher识别:主题分析。J Med Internet Res 2017 12月14日;19(7):e255 [免费全文] [CrossRef] [Medline
  9. Allem JP, Ferrara E.去偏见社交媒体数据对更好地理解电子烟相关态度和行为的重要性。J Med Internet Res 2016 Dec 09;18(8):e219 [免费全文] [CrossRef] [Medline
  10. Allem JP, Dharmapuri L, Unger JB, Cruz TB。在推特上描述juul相关的帖子。毒品酒精依赖2018年12月1日;190:1-5。[CrossRef] [Medline
  11. Allem JP, Dharmapuri L, Leventhal AM, Unger JB, Cruz TB。2017 - 2018年推特上与水烟相关的帖子:专题分析。J Med Internet Res 2018年12月19日;20(11):e11669 [免费全文] [CrossRef] [Medline
  12. Richardson A, Vallone DM. YouTube:小雪茄和小雪茄的促销工具?Tob Control 2014 1月;23(1):21-26。[CrossRef] [Medline
  13. 尼曼AL,斯特林KL,马吉德BA,琼斯DM,埃里克森MP。口味和风险:美国成年人对小雪茄和小雪茄口味的看法,2015。尼古丁Tob Res 2018年8月14日;20(9):1055-1061。[CrossRef] [Medline
  14. King BA, Tynan MA, Dube SR, Arrazola R.在美国初高中学生中使用少量加味雪茄和加味香烟。青少年健康杂志2014年1月;54(1):40-46 [免费全文] [CrossRef] [Medline
  15. Step MM, Bracken CC, Trapl ES, Flocke SA。关于小雪茄的公共推文的用户和内容特征。美国健康行为杂志2016年1月;40(1):38-47。[CrossRef] [Medline
  16. 安格JB, Urman R, Cruz TB, Majmundar A, Barrington-Trimis J, Pentz MA,等。在推特上谈论烟草与烟草产品的使用有关。Prev Med 2018 12月;114:54-56。[CrossRef] [Medline
  17. aurid - mcgovern J, Stone MD, Barrington-Trimis J, Unger JB, Leventhal AM。青少年电子烟,水烟,传统香烟使用和随后的大麻使用。儿科2018年12月;142(3):e20173616。[CrossRef] [Medline
  18. 沃尔科夫ND, Baler RD,康普顿WM,魏斯SR.大麻使用对健康的不良影响。N Engl J Med 2014 Jun 05;370(23):2219-2227 [免费全文] [CrossRef] [Medline
  19. Cohn AM, Johnson AL, Fryer CS, Villanti AC.在美国年轻人样本中,大麻使用预示着目前很少使用雪茄的开始。毒品酒精依赖2018年12月1日;190:235-241。[CrossRef] [Medline

G·艾森巴赫(G Eysenbach)编辑;提交15.04.19;K Rehberg, L Laestadius同行评审;对作者24.05.19的评论;修订本收到日期:03.06.19;接受18.06.19;发表19.07.19

版权

©Jon-Patrick Allem, Sree Priyanka Uppu, Tess Boley Cruz, Jennifer B Unger。最初发表于《医疗互联网研究杂志》(//www.mybigtv.com), 2019年7月19日。

这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。


Baidu
map