这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。gydF4y2Ba
Twitter代表了一个社交媒体平台,医用大麻药房可以通过该平台迅速推广和宣传大量零售产品。然而,到目前为止,还没有研究系统地评估药房的Twitter行为,以及这些行为如何影响社交网络的形成。gydF4y2Ba
这项研究旨在描述在加利福尼亚州两个大型大麻市场经营的药房中常见的网络行为和共享的追随者网络。gydF4y2Ba
从旧金山湾区和大洛杉矶地区的119家药房的目标样本中,我们使用Twitter API从药房帐户收集元数据。对于每个城市,我们根据共享的追随者来描述药房的网络结构,然后用鲁汶模块化算法经验地推导出社区。采用主成分因子分析将12个推特测量值简化为一组更精简的网络行为维度。最后,通过二次判别分析验证了所提取维度对药房所属社区的分类能力。gydF4y2Ba
模块化算法在每个城市中产生了三个具有不同网络结构的社区。主成分因子分析将12种网络行为简化为5个维度,包括账号年龄、发帖频率、引用、超链接和药房账号的用户参与度。在二次判别分析中,这些维度正确地分类了旧金山湾区75%(46/61)的社区和大洛杉矶71%(41/58)的社区。gydF4y2Ba
两个城市中最集中和连接最强的药房拥有更新的账户,更高的日常活动,更频繁的用户参与,以及更多的嵌入式媒体、关键字和超链接的使用。从网络结构和网络行为维度得出的测量方法可以作为大麻药房和消费市场在线监测的关键上下文指标。gydF4y2Ba
在过去的15年里,美国大麻的使用发生了以人口为基础的巨大变化[gydF4y2Ba
值得注意的是,这些争论与美国各地药房越来越多的医疗和娱乐大麻产品相吻合。加州是世界上最大的大麻合法市场,医用大麻患者报告说,他们会根据产品定价和药房的供应情况,以及他们收到医生建议的具体情况,改变购买行为。gydF4y2Ba
据估计,每2000条推文中就有一条与大麻有关[gydF4y2Ba
考虑到社交网络对消费者偏好和行为的良好影响[gydF4y2Ba
更重要的是,对Twitter上的药房进行系统调查,可以深入了解药房在互联网上的行为,以及这些行为如何影响共享追随者社区的形成。因此,这项比较研究在来自旧金山湾区(SFBA)和大洛杉矶(GLA)的两个大麻药房样本中检查了一组12个Twitter网络行为。对于每个大都市区域,我们基于共享的关注者可视化整体网络结构和社区形成,然后用主成分因子分析将网络行为简化为更精简的维度集。最后,我们利用二次判别分析来调查提取的网络行为维度是否在加利福尼亚州的药房社区之间有显著差异。gydF4y2Ba
我们调整了有针对性的抽样方法,以选择SFBA和GLA的大麻药房。传统上,这些方法被用于社会科学和公共卫生研究,以接触社区或医疗环境之外的"隐藏"人群(如医用大麻患者或注射吸毒者)[gydF4y2Ba
在加州大麻药房的背景下,我们包括了来自旧金山医疗药房计划、奥克兰大麻监管委员会、伯克利医用大麻委员会和洛杉矶医用大麻ID计划的持牌、注册和商业分区的药房。然后,我们将初始数据库与Leafly、WeedMaps和THCFinder进行了交叉引用,这三家流行的大麻网站允许用户在美国各地(包括加利福尼亚州)定位药房。这些网站包括简化的平台,提供关于社交网络个人资料的全面信息,这使我们能够扩大我们最初的数据库,并在Twitter上创建更大的药房账户集。在最后的药房账户样本中,我们收集了截至2016年2月16日的关注者的账户id和最后3200条可用推文。最后,从账户的元数据中得出了12种网络行为,分为三大类:账户年龄、发布频率和推文组成(gydF4y2Ba
推特网络行为的定义。gydF4y2Ba
CyberbehaviorsgydF4y2Ba | 定义gydF4y2Ba | |
|
|
|
|
整体年龄gydF4y2Ba | Twitter帐户存在的天数gydF4y2Ba |
|
发推特的总天数gydF4y2Ba | 某账号至少发送一条推文的天数gydF4y2Ba |
|
|
|
|
微博收集gydF4y2Ba | 从帐户时间轴收集的推文总数gydF4y2Ba |
|
发微博的天数百分比gydF4y2Ba | 自账户创建以来,有一条推文的天数百分比gydF4y2Ba |
|
Max。每天的推文gydF4y2Ba | 一个账号在一天内发布一条推文的最大次数gydF4y2Ba |
|
每天平均推文数gydF4y2Ba | 一个账号每天平均发推的次数gydF4y2Ba一个gydF4y2Ba |
|
绝对偏差中位数gydF4y2Ba | 每天推文的绝对偏差中位数(MAD)gydF4y2Ba |
|
|
|
|
标签(#)gydF4y2Ba | 收集到的包含标签的推文的百分比gydF4y2Ba |
|
提到(@)gydF4y2Ba | 收集到的直接提到其他用户的推文的百分比gydF4y2Ba |
|
Retweet (RT)gydF4y2Ba | 收集到的推文被转发的百分比gydF4y2Ba |
|
媒体gydF4y2Ba | 收集到的包含嵌入式媒体的推文的百分比gydF4y2BabgydF4y2Ba |
|
超链接(http://)gydF4y2Ba | 收集到的包含超链接的推文百分比gydF4y2Ba |
一个gydF4y2Ba不包括账号未发推的天数。gydF4y2Ba
bgydF4y2Ba图像、视频和文档。gydF4y2Ba
有了每个药房及其追随者的账户信息,我们从药房网络中创建了一个投影,边缘权重表示共享的追随者[gydF4y2Ba
鲁汶方法[gydF4y2Ba
在创建网络数据和计算社区后,我们使用力向图绘制算法将每个城市的网络可视化。这种网络可视化算法将具有更多共同追随者潜力的节点彼此放置得更近,并排斥潜力有限或没有潜力的节点。为了本研究的目的,来自同一社区的药房使用彩色节点进行可视化。gydF4y2Ba
假设共享追随者网络。gydF4y2Ba
对于这12种网络行为,我们计算了描述性统计数据来描述每个城市的社区。研究人员还进行了Wilcoxon秩和和和Kruskal-Wallis检验,以探讨城市和社区之间在12种网络行为上是否存在统计学上的显著差异。然后,我们使用网络行为的12x12相关矩阵进行主成分因子分析(PCA),以提取有经验意义的维度。PCA提供了一种方法来解决网络行为之间的多重共线性,并得到一组更简洁的维度来解释数据的可变性。最后,我们采用二次判别分析(QDA)来确定提取的网络行为的分类精度[gydF4y2Ba
整体而言,共检查119个药房帐户,其中SFBA有61个,GLA有58个。每个网络行为的平均值显示在gydF4y2Ba
在SFBA网络中,21% (n=13,用绿色标记)的药房位于连接较弱的社区,所有成员都有适度的Twitter粉丝。另外38% (n=23,用橙色标记)位于相当集中的药房社区,较小的账户之间有很强的相互联系。最大的社区占样本的41% (n=25,用紫色标记),并且通过最受欢迎的药房有很强的相互联系。在GLA中,占网络38% (n=22,用橙色标记)的社区拥有两个拥有最多追随者的药房,尽管其成员之间的联系很弱。一个小而弱连接的网络占网络的17% (n=10,用绿色标记),只有两个拥有相对较大的追随者群体。尽管Twitter上的粉丝数量不多,但剩下的45%的网络(n=26,用紫色标记)形成了最大、最紧密的联系社区,这表明任何一对成员之间都有相当一部分的共享粉丝。gydF4y2Ba
推特网络行为的描述性统计。gydF4y2Ba
CyberbehaviorsgydF4y2Ba | SFBAgydF4y2Ba一个gydF4y2Ba(n = 61)gydF4y2Ba | 杯子gydF4y2BabgydF4y2Ba(n = 58)gydF4y2Ba |
|
|
的意思是gydF4y2Ba | 的意思是gydF4y2Ba |
|
账户年龄,日(年)gydF4y2Ba | 1107.8 (3.0)gydF4y2Ba | 1006.2 (2.8)gydF4y2Ba | 报gydF4y2Ba |
发推特的总天数gydF4y2Ba | 285.5gydF4y2Ba | 202.6gydF4y2Ba | .14点gydF4y2Ba |
微博收集gydF4y2Ba | 965.4gydF4y2Ba | 590.3gydF4y2Ba | . 21gydF4y2Ba |
Max。每天的推文gydF4y2Ba | 15.1gydF4y2Ba | 16.4gydF4y2Ba | .87点gydF4y2Ba |
平均每天的推文gydF4y2Ba | 3.0gydF4y2Ba | 2.9gydF4y2Ba | 开市gydF4y2Ba |
疯了gydF4y2BadgydF4y2Ba每天的推文gydF4y2Ba | 0.8gydF4y2Ba | 0.8gydF4y2Ba | .92gydF4y2Ba |
发微博的天数百分比gydF4y2Ba | 25.9gydF4y2Ba | 24.1gydF4y2Ba | 点gydF4y2Ba |
带有媒体的推文百分比gydF4y2Ba | 20.4gydF4y2Ba | 21.0gydF4y2Ba | .98点gydF4y2Ba |
使用#的推文百分比gydF4y2BaegydF4y2Ba | 40.4gydF4y2Ba | 40.4gydF4y2Ba | .92gydF4y2Ba |
使用@的推文百分比gydF4y2BafgydF4y2Ba | 26.1gydF4y2Ba | 27.6gydF4y2Ba | 54gydF4y2Ba |
使用RT的推文百分比gydF4y2BaggydF4y2Ba | 10.2gydF4y2Ba | 10.5gydF4y2Ba | 点gydF4y2Ba |
带有超链接的推文百分比gydF4y2Ba | 55.9gydF4y2Ba | 51.8gydF4y2Ba | 票价gydF4y2Ba |
一个gydF4y2Ba旧金山海湾地区。gydF4y2Ba
bgydF4y2BaGLA:大洛杉矶。gydF4y2Ba
cgydF4y2Ba的gydF4y2Ba
dgydF4y2BaMAD:中位数绝对偏差。gydF4y2Ba
egydF4y2Ba# =标签。gydF4y2Ba
fgydF4y2Ba@ =用户提及。gydF4y2Ba
ggydF4y2BaRT:转发。gydF4y2Ba
子图中(gydF4y2Ba
作为gydF4y2Ba
中所提取社群的网络行为平均值gydF4y2Ba
在旧金山湾区和大洛杉矶地区共享追随者网络。gydF4y2Ba
旧金山湾区和大洛杉矶地区的共享追随者网络子图。gydF4y2Ba
主成分因子分析得出五个相关因子(特征值>1.0)描述了SFBA药房的Twitter行为(gydF4y2Ba
我们将SFBA药房的第三个因素归类为gydF4y2Ba
旧金山湾区12种网络行为的主成分因子分析结果。gydF4y2Ba
CyberbehaviorsgydF4y2Ba | 活动gydF4y2Ba | 年龄gydF4y2Ba | 长寿gydF4y2Ba | 订婚gydF4y2Ba | 引用gydF4y2Ba | ||||||
特征值gydF4y2Baa、bgydF4y2Ba | 4.3gydF4y2Ba | 2.2gydF4y2Ba | 1.4gydF4y2Ba | 1.2gydF4y2Ba | 1.0gydF4y2Ba | ||||||
|
帐户的年龄gydF4y2Ba | 0.02gydF4y2Ba |
|
−0.02gydF4y2Ba | 0.01gydF4y2Ba | −0.18gydF4y2Ba | |||||
|
发推特的总天数gydF4y2Ba | −0.06gydF4y2Ba | 0.29gydF4y2Ba |
|
−0.05gydF4y2Ba | −0.13gydF4y2Ba | |||||
|
发微博的天数百分比gydF4y2Ba | −0.04gydF4y2Ba | −0.20gydF4y2Ba |
|
0.06gydF4y2Ba | 0.12gydF4y2Ba | |||||
|
微博收集gydF4y2Ba | 0.28gydF4y2Ba | 0.19gydF4y2Ba | 0.32gydF4y2Ba | −0.11gydF4y2Ba | −0.03gydF4y2Ba | |||||
|
Max。每天的推文gydF4y2Ba |
|
0.03gydF4y2Ba | 0.07gydF4y2Ba | 0.10gydF4y2Ba | −0.01gydF4y2Ba | |||||
|
平均每天的推文gydF4y2Ba |
|
−0.03gydF4y2Ba | −0.15gydF4y2Ba | −0.06gydF4y2Ba | 0.02gydF4y2Ba | |||||
|
疯了gydF4y2BacgydF4y2Ba每天的推文gydF4y2Ba |
|
−0.05gydF4y2Ba | 0.05gydF4y2Ba | 0.06gydF4y2Ba | 0.02gydF4y2Ba | |||||
|
带有媒体的推文百分比gydF4y2Ba | 0.05gydF4y2Ba | −gydF4y2Ba |
0.14gydF4y2Ba | −0.07gydF4y2Ba | −0.29gydF4y2Ba | |||||
|
使用#的推文百分比gydF4y2BadgydF4y2Ba | −0.03gydF4y2Ba | −0.21gydF4y2Ba | −0.06gydF4y2Ba | 0.16gydF4y2Ba |
|
|||||
|
使用@的推文百分比gydF4y2BaegydF4y2Ba | 0.01gydF4y2Ba | −0.01gydF4y2Ba | 0.02gydF4y2Ba |
|
−0.10gydF4y2Ba | |||||
|
使用RT的推文百分比gydF4y2BafgydF4y2Ba | −0.01gydF4y2Ba | 0.07gydF4y2Ba | 0.02gydF4y2Ba |
|
0.05gydF4y2Ba | |||||
|
带有超链接的推文百分比gydF4y2Ba | 0.03gydF4y2Ba | 0.14gydF4y2Ba | 0.10gydF4y2Ba | -0.11gydF4y2Ba |
|
一个gydF4y2Ba当特征值为1.0或更大时,支持维数的存在。每个网络行为的值表示为变量最大旋转因子负荷。gydF4y2Ba
bgydF4y2Ba粗体因子负载表示大于或等于.40的值。gydF4y2Ba
cgydF4y2BaMAD:中位数绝对偏差。gydF4y2Ba
dgydF4y2Ba# =标签。gydF4y2Ba
egydF4y2Ba@ =用户提及。gydF4y2Ba
fgydF4y2BaRT:转发。gydF4y2Ba
我们发现GLA药房的网络行为维度高度相似(gydF4y2Ba
大洛杉矶地区12种网络行为的主成分因子分析结果。gydF4y2Ba
CyberbehaviorsgydF4y2Ba | 活动gydF4y2Ba | 长寿gydF4y2Ba | 订婚gydF4y2Ba | 引用gydF4y2Ba | 超链接gydF4y2Ba |
特征值gydF4y2Baa、bgydF4y2Ba | 3.0gydF4y2Ba | 2.4gydF4y2Ba | 1.8gydF4y2Ba | 1.3gydF4y2Ba | 1.2gydF4y2Ba |
帐户的年龄gydF4y2Ba | 0.14gydF4y2Ba |
|
0.05gydF4y2Ba | 0.26gydF4y2Ba | 0.29gydF4y2Ba |
发推特的总天数gydF4y2Ba | 0.10gydF4y2Ba |
|
0.01gydF4y2Ba | 0.08gydF4y2Ba | 0.08gydF4y2Ba |
发微博的天数百分比gydF4y2Ba | 0.16gydF4y2Ba | 0.20gydF4y2Ba | 0.25gydF4y2Ba | 0.39gydF4y2Ba | 0.29gydF4y2Ba |
微博收集gydF4y2Ba | 0.22gydF4y2Ba |
|
0.00gydF4y2Ba | 0.02gydF4y2Ba | 0.01gydF4y2Ba |
Max。每天的推文gydF4y2Ba | 0.33gydF4y2Ba | 0.05gydF4y2Ba | 0.14gydF4y2Ba | 0.26gydF4y2Ba | 0.32gydF4y2Ba |
平均每天的推文gydF4y2Ba |
|
0.03gydF4y2Ba | 0.02gydF4y2Ba | 0.06gydF4y2Ba | 0.12gydF4y2Ba |
疯了gydF4y2BacgydF4y2Ba每天的推文gydF4y2Ba |
|
0.03gydF4y2Ba | 0.05gydF4y2Ba | 0.08gydF4y2Ba | 0.09gydF4y2Ba |
带有媒体的推文百分比gydF4y2Ba | 0.11gydF4y2Ba | 0.01gydF4y2Ba | 0.01gydF4y2Ba |
|
0.21gydF4y2Ba |
使用#的推文百分比gydF4y2BadgydF4y2Ba | 0.08gydF4y2Ba | 0.00gydF4y2Ba | 0.19gydF4y2Ba |
|
0.09gydF4y2Ba |
使用@的推文百分比gydF4y2BaegydF4y2Ba | 0.01gydF4y2Ba | 0.00gydF4y2Ba |
|
0.13gydF4y2Ba | 0.01gydF4y2Ba |
使用RT的推文百分比gydF4y2BafgydF4y2Ba | 0.00gydF4y2Ba | 0.03gydF4y2Ba |
|
0.07gydF4y2Ba | 0.01gydF4y2Ba |
带有超链接的推文百分比gydF4y2Ba | 0.11gydF4y2Ba | 0.00gydF4y2Ba | 0.01gydF4y2Ba | 0.04gydF4y2Ba |
|
一个gydF4y2Ba当特征值为1.0或更大时,支持维数的存在。每个网络行为的值表示为变量最大旋转因子负荷。gydF4y2Ba
bgydF4y2Ba粗体因子负载表示大于或等于.40的值。gydF4y2Ba
cgydF4y2BaMAD:中位数绝对偏差。gydF4y2Ba
dgydF4y2Ba# =标签。gydF4y2Ba
egydF4y2Ba@ =用户提及。gydF4y2Ba
fgydF4y2BaRT:转发。gydF4y2Ba
在GLA中,各维度对药房社区的分类准确率为71%(41/58),橙色和紫色社区的分类准确率较高(gydF4y2Ba
旧金山湾区社区药房分类表。gydF4y2Ba
旧金山湾区(N=61)gydF4y2Ba | 分类社区gydF4y2Ba | ||
真正的社区gydF4y2Ba | 橙色gydF4y2Ba | 绿色gydF4y2Ba | 紫色的gydF4y2Ba |
橙色(n = 23)gydF4y2Ba |
|
0gydF4y2Ba |
3.gydF4y2Ba |
绿色(n = 13)gydF4y2Ba | 2gydF4y2Ba |
|
2gydF4y2Ba |
紫色(n = 25)gydF4y2Ba | 3.gydF4y2Ba |
5gydF4y2Ba |
|
一个gydF4y2Ba粗体对角线表示正确分类的群落。gydF4y2Ba
来自大洛杉矶地区药房二次判别分析的分类表。gydF4y2Ba
大洛杉矶地区(N=58)gydF4y2Ba | 分类社区gydF4y2Ba | ||
真正的社区gydF4y2Ba | 橙色gydF4y2Ba | 绿色gydF4y2Ba | 紫色的gydF4y2Ba |
橙色(n = 22)gydF4y2Ba |
|
0gydF4y2Ba |
4gydF4y2Ba |
绿色(n = 10)gydF4y2Ba | 3.gydF4y2Ba |
|
5gydF4y2Ba |
紫色(n = 26)gydF4y2Ba | 4gydF4y2Ba |
1gydF4y2Ba |
|
一个gydF4y2Ba粗体对角线表示正确分类的群落。gydF4y2Ba
作为一个流行的社交网络平台,Twitter可以让人们对有争议的社会现象进行快速的信息交流,它代表了一个不受监管的领域,大麻药房可以通过定期交流和与大量受众的接触形成社区。在这项研究中,SFBA和GLA的网络都包括一组极具影响力的药房,拥有大量共同的追随者。然而,SFBA的网络结构比GLA的网络结构更强连接和集中,GLA有4个大型药房,占据相对独立的网络空间。在这两个城市中,连接最紧密的药房拥有更新的账户,更高的日常活动,更频繁的用户参与,以及更多的嵌入式媒体、关键字和超链接的使用。因此,每个城市的社区之间的网络结构和网络行为都有显著差异,这为上下文指标提供了证据,可以用于监视Twitter上药房之间的信息交换。gydF4y2Ba
在大型且相互关联的药房社区中,网络行为表明定期向共享的关注者发布推文,这些关注者可能包括具有强烈共同利益的患者、消费者和大麻行业人群。这些高度活跃的药房的年轻化也可能证明了新的营销策略的出现,这些策略简化了产品促销,共享信息,并在Twitter上更大的共享经济中培养品牌忠诚度[gydF4y2Ba
相比之下,网络边缘的药房共享关注者潜力较低,并表现出更多一般性的网络行为(例如,纯文本推文),不向关注者提供吸引人的内容或其他资源的链接。由于社会经济地位较高的人群更有可能发送和接收超链接[gydF4y2Ba
关于药房之间的社区形成,我们将共享追随者概念化为一种亲和力形式,表明他们选择共同关注的药房具有共同的兴趣和从属关系。通过将这一功能整合到社交网络中以了解药房之间的相互联系,共享的追随者代表了一种可能在药房之间流动的潜在资源,并有助于形成社区,以应对药房之间独特的网络行为模式[gydF4y2Ba
虽然这项研究利用共享追随者潜力来了解药房之间的网络结构和社区形成,但我们承认社会网络可能以多种方式表现出来。一个严格的流动网络,而不是共享的追随者网络,在药房之间使用共享或点赞的推文,可能会展示不同的社会互动和信息传播动态[gydF4y2Ba
类似地,网络行为维度区分社区的能力表明,元数据可以为Twitter上的药房和消费者行为提供额外的见解。利用药房类型(如非营利组织、送货和医疗服务)、州和地方法律规定以及地理空间特征等元数据来利用这些维度的大型研究,可能会改善对药房社区的检测[gydF4y2Ba
这项研究的结果表明,推特上的网络结构和药房行为的多个维度塑造了加州两个最大的大麻市场。随着加州在2016年11月的投票中成功通过了64号提案,21岁及以上成年人娱乐性大麻使用合法化进一步强调了确定在线大麻营销的政策影响的必要性,并通过可能影响基于人群的消费的网络行为的上下文测量来监测社区活动。此外,在线市场和移动应用程序的出现表明,药房的数字化已经开始将消费者从店面转移到高科技协作消费平台,这些平台可以个性化产品选择和自动化购买。随着推特作为这一数字范式转变的关键部分,本研究中使用的可扩展方法将作为更严格的设计的基础,纵向跟踪社区形成和药房之间的网络行为模式。gydF4y2Ba
药房社区网络行为的描述性统计。gydF4y2Ba
药房社区之间Twitter网络行为的规范加载。gydF4y2Ba
大洛杉矶地区gydF4y2Ba
主成分因子分析gydF4y2Ba
二次判别分析gydF4y2Ba
旧金山海湾地区gydF4y2Ba
本研究由RTI国际的独立研究与发展(IR&D)赠款和战略投资基金(SIF)支持。这篇论文的早期版本在2016年国际计算社会科学会议上发表。gydF4y2Ba
没有宣布。gydF4y2Ba