这是一篇根据创作共用署名许可协议(https://creativecommons.org/licenses/by/4.0/)发布的开放获取文章,允许在任何媒介上不受限制地使用、分发和复制,前提是正确引用了首次发表在JMIR公共卫生和监测上的原创作品。必须包括完整的书目信息,https://publichealth.www.mybigtv.com上的原始出版物的链接,以及此版权和许可信息。
青年和年轻人的艾滋病毒感染率仍然很高,他们也是社交媒体的频繁用户。Twitter等社交媒体平台可以促进这些人预防艾滋病的努力,虽然Twitter上存在与艾滋病毒相关的信息,但人们对这些信息对这一人群的影响或影响范围知之甚少。
本研究旨在通过确定与青年和年轻男性(13-24岁)的推文背书(收藏)和参与度(转发)相关的用户和消息特征来解决文献中的这一差距。
在对年轻男性在Twitter上发布的艾滋病毒相关信息的研究数据的二次分析中,我们使用模型选择技术来检查与推文背书和参与度相关的用户和推文级别因素。
来自个人用户账户的推文比来自机构用户的推文获得了更高的认可和参与度(aOR 3.27, 95% CI 2.75-3.89;
研究结果表明,从业人员应与青年合作,在社交媒体上设计和传播艾滋病毒预防信息,纳入与青年受众产生共鸣的内容,并努力挑战污名,培养有利于公开讨论性、性行为和健康的社会规范。
尽管在预防方面取得了进展,但美国青年和年轻成年人中的艾滋病毒发病率仍然是一个持续的公共卫生问题。2010-2016年,与其他年龄组相比,青少年和青壮年的艾滋病毒感染率最高,据估计,这些人群中未确诊的艾滋病毒感染人数不成比例地更高[
社交媒体平台为影响用户的健康信念和行为提供了独特的机会。这些平台在青年和年轻成年人中特别受欢迎;超过90%的年轻人(18-29岁)曾使用过至少一个社交媒体平台或消息应用程序,如YouTube、Facebook或Instagram [
有大量证据表明,年轻人使用社交媒体与健康状况相关;这项研究证明了媒体使用者对健康的正面和负面影响[
围绕健康主题的媒体话语可以在健康相关的信念和行为中发挥工具性作用。在日常接触大众媒体期间或通过有目的的干预,传播与健康相关的信息已被证明通过一系列行为影响健康结果[
先前的研究表明,社交媒体平台上信息内容的特征与与健康相关的信息有关,包括艾滋病毒预防信息[
这项研究是对作为病毒2病毒的一部分收集的数据的扩展分析,病毒2是一项关于美国年轻男性Twitter消息内容的研究[
最初的推文语料库随后被子集化,只包括那些与艾滋病毒相关的内容。艾滋病毒相关内容是通过与青年研究人员合作开发的艾滋病毒相关术语关键字列表(例如,与艾滋病毒、艾滋病、艾滋病毒检测、避孕套、多个性伴侣、性传播感染[STIs]、性风险行为和暴露前预防[PrEP]相关的术语)确定的。这一过程生成了一个包含2009年至2017年发布的24,388条推文的数据集,并将其分为3大类:艾滋病毒预防特定推文(n=5057)、一般性相关推文(n=19,319)和促进风险行为的推文(n=12)。为了保留与艾滋病毒风险和预防最相关的推文,同时将数据集减少到更易于管理的大小,我们包括了与预防相关的推文和促进风险行为的推文的完整样本,以及与一般性相关的推文的随机样本(3091/ 19,319,16.0%)。这产生了来自1541个独立用户的8160条推文的最终数据集,然后由4名研究助理组成的团队对消息内容进行编码(所有结构的类内相关系数均为0.80或更高)并用于分析。用户类型是根据研究小组成员在数据集中手工审查用户简介和每个用户最近发布的帖子确定的,并记录为个人(如个人的个人帐户)或机构(如公共卫生机构、社会服务组织或倡导团体)。不明确的用户类型或研究人员无法确定的用户类型被记录为缺失,并从数据集中删除(n=150)。最后的分析样本包括来自1499个独立用户的8010条推文。父研究所用方法的完整描述已在其他地方发表[
宾夕法尼亚大学机构审查委员会审查了这项研究,并指定其豁免,因为该研究(协议#827833)不符合人类受试者研究的定义。
使用两个不同的二元变量来衡量推文背书和参与度的结果。一条推文如果收到至少1个来自其他用户的喜爱(1=认可,0=未认可),则被归类为认可(1=参与,0=无参与),如果它被转发至少一次,则被归类为参与(1=参与,0=无参与)。
从API中提取每个用户的好友和关注者数量。预测年龄是使用之前验证过的机器学习算法来估计的,该算法通过用户消息的特征来预测用户的年龄[
Tweet语言直接从API中提取,并编码为二进制变量(1=英语,0=其他语言)。发布推文的时间分为3类:美国东部时间上午9点至下午5点发布推文的时间为白天,美国东部时间下午5点至午夜发布推文的时间为晚上,美国东部时间午夜至上午9点发布推文的时间为晚上。发布推文的地理位置在可用的情况下使用推文特定的纬度/经度坐标来测量,否则使用推特用户个人资料中自我报告的位置信息。然后,推文位置被分解成一个变量来代表地区,对应于美国人口普查的4个地区(东北部、中西部、南部和西部)。如果一条推文使用“@user”语法(1=回复,0=不回复)指向另一个用户,则将其标识为回复。推文长度根据推文中的字符数计算,包括“@user”语法(如果存在的话)。
推文的内容由4名研究助理定性编码,由19个非排他性二进制变量组成,对应于推文内容的各个方面。这些类别都是反冒险的;避孕套;艾滋病毒检测;艾滋病毒/艾滋病;幽默;女同性恋、男同性恋、双性恋、变性人或酷儿;错误信息;建模;多个合作伙伴; norms; PrEP; pro–risk-taking; research, education, news; stigma; STIs; substance use; transactional sex; unprotected sex; and unrelated sexual content. Full details of the procedures used in the parent study for coding tweet content have been published elsewhere [
我们估计了一系列逻辑回归模型,以评估用户级和推文级特征对2个离散响应变量的影响:认可和参与。我们使用最小绝对收缩和选择算子(LASSO)作为模型构建技术。LASSO是一种惩罚回归的形式,它迫使不太重要变量的回归系数为零,从而产生具有更少变量和更高预测精度的模型[
由于LASSO回归系数有偏差且不容易解释,我们使用了该技术的一种扩展,称为松弛LASSO,该技术将LASSO方法用于初始模型选择与多重逻辑回归相结合,用于非惩罚系数估计[
最后,为了评估模型的整体预测精度,我们绘制了受试者工作曲线(roc),并计算了曲线下面积(AUCs) [
预测推文背书(A)和参与度(B)的模型的接收者操作曲线和曲线下面积。
用户级和消息级特征的描述性统计(n=8010)。
|
价值 | |
|
||
|
是的 | 4096 (51.14) |
|
没有 | 3914 (48.86) |
|
||
|
中西部 | 663 (8.28) |
|
东北 | 2962 (36.98) |
|
南 | 2014 (25.14) |
|
西 | 2371 (29.60) |
|
||
|
英语 | 7976 (99.58) |
|
不是英语 | 34 (0.42) |
|
||
|
是的 | 959 (11.97) |
|
没有 | 7051 (88.03) |
|
||
|
白天(上午9时至下午5时) | 4411 (55.07) |
|
晚上(下午五时至午夜) | 2146 (26.79) |
|
晚上(午夜至上午九时) | 1453 (18.14) |
|
||
|
2009 | 30 (0.37) |
|
2010 | 6 (0.07) |
|
2011 | 62 (0.77) |
|
2012 | 62 (0.77) |
|
2013 | 158 (1.97) |
|
2014 | 346 (4.32) |
|
2015 | 1174 (14.66) |
|
2016 | 2472 (30.86) |
|
2017 | 3700 (46.19) |
|
||
|
是的 | 2049 (25.58) |
|
没有 | 5961 (74.42) |
|
||
|
是的 | 1438 (17.95) |
|
没有 | 6572 (82.05) |
年龄一个(年),中位数(IQR) | 18.72 (17.13 - -21.64) | |
追随者数,中位数(IQR) | 591年(241 - 1179) | |
好友数量,中位数(IQR) | 435年(273 - 800) | |
消息长度,中位数(IQR) | 94年(71 - 121) |
一个年龄是一个预测年龄,基于推文和用户特征,使用Sap等人开发的机器学习算法计算[
对于每个感兴趣的结果(推文背书和推文参与度),我们使用lasso选择的预测因子估计逻辑回归模型,并通过绘制roc和测量auc来评估模型的整体性能。我们注意到,初始模型包括了中列出的所有变量(不包括结果)
最终模型(得分检验χ26: 884.65)的推文背书结果是一个6变量模型,其中包括以下预测因素:粉丝数;地区;发布推文的一年;用户类型;STI消息内容;以及研究、教育和新闻消息内容。如在
如
预测Twitter用户认可和参与的变量的逻辑回归分析总结(n=8010)。
预测 | 支持,优势一个(95%置信区间) | 敬业度,aOR (95% CI) | ||||
|
||||||
|
年龄 | - - - - - -b | 0.92 (0.90 - -0.94) | |||
|
追随者数(100个) | 1.01 (1.00 - -1.01) | 1.01 (1.00 - -1.01) | |||
|
个人用户数量 | 3.27 (2.75 - -3.89) | 1.77 (1.52 - -2.05) | |||
|
||||||
|
|
|||||
|
|
东北 | 1.46 (1.31 - -1.99) | 1.69 (1.32 - -2.15) | ||
|
|
南 | 0.85 (0.82 - -1.25) | 1.16 (0.91 - -1.48) | ||
|
|
西 | 1.06 (0.71 - -1.08) | 0.68 (0.53 - -0.88) | ||
|
|
|||||
|
|
晚上 | - - - - - - | 1.08 (0.90 - -1.31) | ||
|
|
白天 | - - - - - - | 1.36 (1.17 - -1.59) | ||
|
邮件长度(10字) | - - - - - - | 1.04 (1.02 - -1.06) | |||
|
回复 | - - - - - - | 0.45 (0.36 - -0.57) | |||
|
一年 | 1.30 (1.23 - -1.38) | - - - - - - | |||
|
信息:规范 | - - - - - - | 1.62 (1.15 - -2.29) | |||
|
信息:研究、教育、新闻 | 0.77 (0.65 - -0.92) | - - - - - - | |||
|
信息:STI | 0.59 (0.47 - -0.74) | 0.61 (0.47 - -0.78) |
一个aOR:调整的优势比。
b不适用。
c参照组:中西部地区。
d参考组:晚上。
最终模型(得分检验χ29: 404.89)的推文参与结果包括以下9个预测因素:预测的用户年龄、关注者数量、用户类型、推文长度、回复推文(@user)、发布时间、地区、规范消息内容和STI消息内容。如在
如
这项研究旨在评估年轻男性发布的与艾滋病毒风险和预防相关的推文的用户级别和推文级别特征与认可和参与之间的关系。我们的分析表明,用户和推文本身的特征都与推文背书和参与度有关。鉴于促进与有关艾滋病毒预防的媒体内容的积极互动是公共卫生社交媒体战略的一个关键组成部分[
我们发现,与机构用户相比,来自个人账户的推文获得认可的可能性高出3倍,获得参与度的可能性高出75%。这一发现表明,消息来源是如何接收艾滋病毒相关推文的一个重要因素,来自机构用户的艾滋病毒相关消息可能不会与年轻人产生强烈共鸣。先前的研究表明,虽然在线艾滋病毒信息的机构来源可能被认为更可信,但同龄人的经历可能在塑造态度和自我效能以改变行为方面更有影响力[
结果表明,与粉丝较少的用户相比,拥有许多粉丝的用户更有可能获得推文背书和参与度;每增加100名关注者,获得认可和参与的几率就会增加0.5%。这并不是一个令人惊讶的发现,因为拥有更多的粉丝会增加一个人的推文曝光机会,从而增加给定的推文得到认可或引起参与的可能性。我们没有发现用户的朋友数量与认可或参与度之间有任何联系,这表明在Twitter上拥有强大的追随者可能比通过友谊与其他用户保持高度联系更重要。拥有大量追随者的用户可能是名人或社交媒体影响者,或者只是被认为是名人或社交媒体影响者,可以利用他们的影响力来提高艾滋病毒预防信息的可见度。然而,考虑到该数据集中关注者的高度倾斜分布,认可或参与的几率与关注者数量之间的关系可能并不能说明全部情况。与名人网红(例如,粉丝超过1万的有影响力的用户)相比,用户更有可能参与微网红(例如,粉丝少于1万的有影响力的用户)发布的信息,因为他们与这些微网红之间的联系更紧密[
本研究的结果对民意领袖干预的实施具有启示意义。POL干预措施旨在确定、招募和培训社区的关键意见领袖,以促进健康行为并挑战危险的社会规范[
研究结果还表明,推特上的信息内容与推文背书和参与度有关。提到性传播感染的推文获得的支持和参与度下降,主要关注研究、教育或新闻的推文显示出较低的支持水平。然而,反映社会规范(关于自己或他人如何表现或应该如何表现的观点)的推文获得了更高的参与度,这表明年轻人渴望参与关于同龄人感知到的行为或对这些行为的评价的对话。这些结果对努力开发预防艾滋病毒的卫生传播工具具有重要意义。围绕艾滋病毒和性传播感染的耻辱可能会扼杀有关性健康的对话,因为有证据表明,在不够匿名或保密的情况下,年轻人倾向于远离对这些问题的直接讨论[
研究发现,信息的其他特征与认可、参与或两者都有关。预测年龄越大的用户获得粘性的几率越低,这可能反映了青少年和年轻人在平台使用上的差异。不同地理区域的支持和参与度有所不同,来自美国东北部的消息获得的支持和参与度最高,这反映了之前研究中看到的Twitter活动的地理分布[
将社交媒体信息纳入艾滋病毒预防方法的公共卫生工作将需要围绕信息创建、传递和评估制定新的战略。使用利用社交媒体文化元素的语言和风格,例如在信息内容中加入模因和可分享元素,可能比仅基于事实和知识的呼吁更能与年轻人产生共鸣[
这项研究有几个显著的局限性。首先,我们的推文背书和参与度的结果捕捉了与社交媒体内容的主动互动,而不是被动暴露于推文内容。年轻人可能会因为羞耻感或尴尬而犹豫是否认可与性和性健康有关的信息,但可能仍在匿名阅读这些信息[
年轻人广泛使用社交媒体平台,为艾滋病预防提供了新的交流机会。关于性和性健康的讨论在这些平台上广泛存在,这为公共卫生信息在这些对话中发挥作用提供了机会。要让年轻人就这些敏感且往往被污名化的话题进行接触,就需要采取创新战略,促进与艾滋病毒预防信息的有意义联系。公共卫生从业人员应与年轻人合作,设计和传播这些信息,纳入与青年受众产生共鸣的内容,并努力挑战污名,培养有利于公开和诚实地谈论性、性行为和健康的社会规范。
定性编码消息频率表(N=8010)。
调整优势比
应用程序编程接口
ROC曲线下面积
最小绝对收缩和选择算子
民意领袖
预曝光预防
接收工作曲线
性传播感染
这篇手稿(部分)来自宾夕法尼亚大学艾滋病研究中心支持的研究(行政补充P30 AI04500821:识别年轻男性使用社交媒体预防艾滋病毒的关键特征)。支持本研究结果的数据可根据合理要求从通讯作者处获得。
所有作者都对研究构想和设计做出了贡献。数据收集和整理由JO、SB、BS和RS进行。形式分析由JO进行。RS提供资金获取和监督/监督。初稿由JO、SB、ECK和BS共同撰写。所有作者都审阅和编辑了之前的手稿版本,并阅读并批准了最终手稿。
没有宣布。