欢迎光临散文网 会员登陆 & 注册

坤流分析

2023-08-22 12:20 作者:Laplace欧拉  | 我要投稿

一、引言

        众所周知,坤流由众多梗组合,包括“鸡你太美”、“真的是你呀”、“你干嘛呀”等,但不论什么梗流都会存在兴盛和衰落。本文主要目的在于探讨坤流的形成与演变,包括趋势分析和因素分析两部分,以助于其它梗的演变分析。由于B站数据难以获取,故使用百度指数中的“鸡你太美”、“蔡徐坤”和“只因你太美”的日均搜素指数。

二、趋势分析

(一)数据处理

         搜索指数的时间为2019年3月至2023年7月,使用TOPSIS方法进行综合评价,“鸡你太美”、“蔡徐坤”和“只因你太美”各自的比重为38.84%、14.99%和46.17%。

(二)基础分析

图1原始数据趋势图
图2 坤流演变趋势图

        不论是原始数据还是综合评价,都可以发现2019年3月至2019年12月,坤流经历了兴起、鼎盛和衰落三个阶段。鼎盛时期即4月份,“鸡你太美”搜索指数达到日均23073次,“蔡徐坤”搜索指数达日均115827次,“只因你太美”则达2358次,综合评价为0.536,而衰落时最低评价为0.075,热门词“蔡徐坤”搜索指数也仅19614次。将这一阶段称为“坤流盛世”,当然此时的作品受限于素材而相对单一,例如“当蔡徐坤穿越到《我的世界》生存”@GoldenEggs 。

        2020年1月至2020年11月,搜索指数有所回升,存在两个峰值期,即3月和8月,综合评价分别为0.163和0.136,这三者在3月的搜索指数分别为2805、57908和1023,在8月的搜索指数分别为1692、51189和625。将这一阶段称为“坤流之治”,此期间的作品如“【蔡徐坤】仙剑鸡侠传”@金色传说竹鼠 。

        2020年12月至2022年5月,这一段时间搜索指数非常低,“蔡徐坤”一词的最高搜素指数为27848次,最低则为2333次,综合评价也相应为0.072和0.011。将这一阶段称为“坤流低谷”,这一时期优秀作品相对较少,但也有如“鸡汤你太美”@爱吃波肉的肥羊 相对较好的作品。

        2022年6月至今,受各种原因,搜索指数骤增,三者目前最高搜索指数分别为13147、135952和22981,综合评价为0.567,目前最高。这一时期也存在一定跌落,即今年5月份综合评价降为0.23,“蔡徐坤”搜索指数降为16601次,但值得注意的是“只因你太美”在今年1月份达到整个时期最高,这与其余两个有较大差异。将这一阶段称为“坤流中兴”,这一时期优秀作品众多,如“鸡你太美官方MV”@哦呼w 。

        总之,“坤流”目前经历了“坤流盛世(2019.3-2019.12)”、“坤流之治(2020.1-2020.11)”、“坤流低谷(2020.12-2022.5)”和“坤流中兴(2022.6-)”。“坤流”理论上上在2021年后就基本不会单独产生优秀作品,社会因素或强力宣传起了重大作用。

(三)时间序列分析

图3 分解图
图4 月度图

        “坤流”作品的产生是否具有季节性呢?据图3和图4明显发现具有季节性,1、2、7和8月增长较快(分解图从2019年1月开始–第三幅,月度图可看横线),这主要受寒暑假影响,这也说明学生群体的重要影响(提醒适度玩梗)。

        在R语言中使用auto.arima()实现最优ARIMA模型的选取,ARIMA(0,2,2)即2阶差分后平稳,2阶后自相关减少到零,偏自相关逐渐减少到零。模型的均方根误差为0.099,ACF1值为0.028,而使用指数平滑的均方根误差为0.1,ARIMA较指数平滑稍好。ARIMA模型的残差没有通过显著性检验,可接受残差的自相关系数为0。

图5 残差正态Q-Q图
图6 ARIMA(0,2,2)

        使用forecast函数预测今年8月、9月和10月,从相对值看,呈增长趋势并大于7月0.4的综合评价。当然这只说明坤流的流行程度可能上升。

三、因素分析

(一)传播模型

        社会网络中不仅有疾病的传播,还有时尚、观点和流言等信息的传播。经济网络中的危机扩散。在线社会网络上的信息传播行为既有一些共性的特征,也呈现出各自不同的特点。例如,由于微博极强的实时性特征,使得微博上信息的传播速度异常之快。在经典传染病模型中,N个个体的状态有易感染状态S、感染个体I和移除状态R,记s(t)为t时刻易感染的比例,i(t)则为感染病例,被传染的概率为β。SIS模型中,每一个感染个体以定常速率γ再变为易感染个体,对于大规模网络,设初始时刻感染个体比例为i(0),有公式:

SIS模型

        当λ=β/γ>1时,对应Logistic增长曲线。例如我们设定i(0)=0.0001,β=0.7,γ=0.3,t从0到50,大约t=27时,比例就达到一半,17和28近似拐点(第一期)。理论上,在第一期某个时刻发生突变进入第二期,将感染比例迅速提升,再突变进入第三期,感染比例再迅速提升。比如在第一期t=17时进入第二期,感染比例由0.078增长至0.22,在t=21时进入第三期,感染比例由0.432增长至0.471。这里我们猜测“坤流之治”和“坤流中兴”都可能是由于某种突变因素导致,受限知识范围和能力,具体细节暂无法详细分析。

示例图

(二)因素分析

        由于影响因素众多,本文着重分析流量当期值与“坤流”综合评价的关系。从流量当期值趋势图可以看出总体呈现上升趋势,但几乎每年12月都有小幅下降。

流量当期值趋势图

        从相关系数来看,“坤流”和流量当期值线性关系很弱,仅0.143。在滞后阶数为2时,进行格兰杰因果检验:基于变量综合评价与流量,显著性P值为0.794,不呈现显著性,不能拒绝原假设,综合评价不可以引起流量变化。 基于变量流量与综合评价,显著性P值为0.023**,呈现显著性,拒绝原假设,流量可以引起综合评价变化。


        本文基于“坤流”发展划分了四个时期,进行简单预测,概述了传播模型,并简略分析了流量和“坤流”的关系。而实际上,有着众多因素影响着“坤流”,比如股价,传播模型也应当更加复杂,受限于知识水平,分析相对粗略,望更多人士能够进行分析。

坤流分析的评论 (共 条)

分享到微博请遵守国家法律