欢迎光临散文网 会员登陆 & 注册

【PJSK】资讯站活动剧情翻译视频的数据分析

2023-05-31 23:28 作者:涼风_青叶  | 我要投稿

摘要

        本文对Project_SEKAI资讯站(uid=13148307,https://space.bilibili.com/13148307/)到第94期为止的PJSK活动剧情翻译数据进行了相关性分析和主成分分析。相关性分析结果发现播放、弹幕、点赞、投币、收藏、转发6项指标相互之间高度相关(ρ=0.78~0.96),评论数指标与前述6项指标关联较小(ρ=0.34~0.55),活动期数与这些指标间呈负相关趋势,但关联较小。基于上述成果,采用主成分分析方法(PCA)将播放、弹幕、评论、点赞、投币、收藏、分享/转发共7项指标降至2维进行分析。降维得到的2个维度可分别解释为剧情翻译视频的受欢迎度,以及排除受欢迎程度后,观众在该视频下发表评论的倾向强弱。结果显示25时角色Banner的欢迎程度维度指标较高,往下依次是其余男性角色、VBS和WS的女性角色、L/n和MMJ的角色&MIKU。小豆泽心羽、白石杏的评论倾向维度指标特别高,其次是宵崎奏、L/n和MMJ的角色&凤笑梦&MIKU、其余角色。数据分析结果同样在一定程度上反映了角色热度,同时也反映了各期剧情因各种原因引发的讨论度高低。

简介

        Project_SEKAI资讯站(下称资讯站,https://space.bilibili.com/13148307/)是手游《世界计划 多彩舞台 feat.初音未来》(下称PJSK)的非官方资讯站,上传了PJSK各期活动的剧情翻译视频。

        B站上的视频共有7个数据维度:播放量、弹幕数、评论数、点赞数、硬币数、收藏数、分享数。以下是截至2023年5月25日12时15分,第94期活动时,活动剧情的各项数据指标,部分值得注意的数值被标红或标绿。

统计数据来自ijndjdjdj(uid=85770317)

数据分析

1.数据相关性分析

        得到数据后,首先对7个数据维度进行了相关性分析。分析结果如下,格中的数字为相关系数ρ,数值介于-1~1之间。ρ越接近1表示正相关性越强,即一者上升暗示另一者也上升。ρ越接近-1表示负相关性越强,即一者上升暗示另一者要下降。ρ越靠近中间值0,则表示两个指标之间的相关性越弱。

order = 活动期数,view = 播放量,danmaku = 弹幕数,comment = 评论数,like = 点赞数,coin = 硬币数,favorite = 收藏数,share = 分享数

        注意到七个维度除了评论一项,均互相表现出高度相关(ρ=0.78~0.96)。评论数与剩余的六个维度存在一定的正相关性,但相关程度较弱(ρ=0.34~0.55)。活动期数与七个维度总体上呈现负相关,但相关系数的绝对值不是很大,即关联程度不是很大。


2.数据排名

        同时,按照角色Banner的各项维度均值,在各维度下对角色进行了排序。

图源:ijndjdjdj。排名工作实际也由ijndjdjdj完成。

        结果显示,播放量、弹幕数、评论数、点赞数、硬币数、收藏数、分享数这7项指标的排名没有太大差异,在总体趋势上均显示出25时角色→WS角色→VBS角色→L/n角色和MMJ角色的趋势。但同时注意到,小豆泽心羽和白石杏在评论数排名中的位次相较于其它排名更加靠前。

3.主成分分析(PCA)

        结合1和2中的结果,采用PCA算法将经归一化处理(所有数据除以该项维度的平均值)的7维度的数据降至2维。新得到的2维数据是在尽可能保存高维数据信息量的基础上,由最初的七个维度的数据经过线性变换得来,可以看作是高维数据的抽象概括。同时,这两个维度具有相互正交的特点,即相互没有关联性或关联性尽可能小。结果如下。

Title为活动标题,以资讯站翻译为准。Id为活动期数。Dimension1和Dimension2即主成分分析算法对最初的七个维度数据降维到2维得到的结果。

        再次以角色为单位,对Dimension1和Dimension2的数据进行平均,结果如下。

        结合先前的分析成果,可以对Dimension1和Dimension2的意义做出具体解释。Dimension1可被解释为七个维度数据的总体高低程度评分,下称Dimension1为“热度维度”。Dimension2可被解释为在排除了热度维度的影响后,观众在该剧情翻译下留下评论的倾向大小,下称Dimension2为“评论倾向维度”。

        结果显示,25时角色的“热度维度”大大高于其它角色,其次为其余的男性角色,VBS和WS的女性角色,最后为L/n和MMJ的角色以及MIKU。

        结果又显示,小豆泽心羽和白石杏的“评论倾向维度”大大高于其他角色。其次为宵崎奏,再其次为L/n和MMJ的角色、凤笑梦和MIKU,最后为其余角色。

讨论

        活动期数与七项热度指标呈较弱负相关,即,已经翻译完成越久的活动剧情,热度指标倾向于更高,但并不呈现强相关这一点,可以反映PJSK玩家对于资讯站活动剧情翻译的需求程度很高,并且玩家对回看入坑前活动剧情的积极性也很强。

        “热度维度”的统计结果同样与谷价、活动冲榜难度、二创数量等角色热度反映指标产生了呼应。不过在这里,25时角色的活动剧情热度相较于其它角色要尤其地高,甚至是远高于其余男性角色。这支持25时的高热度一定程度上是由其剧情带来的观点。

        小豆泽心羽和白石杏的“评论倾向维度”大大高于其他角色,显然这可以解释为部分心羽Banner和杏Banner的活动剧情的争议性,以及心羽×杏,或者杏×心羽CP的争议性带来的结果。宵崎奏的“评论倾向维度”同样较高,可能是类似原因导致。可以看到第47期活动“总有一天,从绝望的深渊”和第89期活动“Immiscible Discord”(均为宵崎奏Banner)的“评论倾向维度”特别高,而这两期活动的剧情都因角色关系描写、角色分配引发了一些争议。

ko~hane~~!

结论

        本文使用数据分析方法处理资讯站的剧情翻译视频数据,取得了较好结果。结果对于指示角色热度、分析角色热度产生原因、指示剧情内容相关舆情均具有重要意义。未来可针对剧情内容相关舆情方向,对活动剧情视频中的弹幕、评论具体内容进行分析。■

【PJSK】资讯站活动剧情翻译视频的数据分析的评论 (共 条)

分享到微博请遵守国家法律