欢迎光临散文网 会员登陆 & 注册

【PJSK】Pixiv插图与小说数量统计结果与分析——数量·共现频率·非全年龄占比

2021-08-07 22:07 作者:涼风_青叶  | 我要投稿

写在前面

        入坑PJSK后的第一篇专栏!这篇专栏是在《世界计划 彩色舞台 feat. 初音未来》登场的主要角色(6位虚拟歌手除外)在Pixiv[1]的插图数和小说数的统计结果及其分析,统计范围包括了5个乐队的20个角色。

        本篇专栏共统计了三部分内容。

  • 第一部分插图数与小说数的统计。

  • 第二部分,笔者借助Python统计Pixiv上存在角色共现的插图与小说(例如,既有星乃一歌,又有天马咲希的插图有几张 / 小说有几篇),并据此尝试分析了PJSK现在的热门CP

  • 第三部分,笔者呈现了这些角色的非全年龄插图,和非全年龄小说占比

        作为统计向专栏,本篇专栏不包含笔者对任何角色、CP等的主观评价,也不代表笔者对任何乐队、角色、CP的偏好。数据仅为客观事实呈现,可在一定程度上反映,但不能完全代表角色 / CP人气高低。

统计说明

        有角色共现的插图数和小说数使用Python统计,Python代码见文章末尾。这一统计在2021年8月6日晚25时(即7日凌晨1时)左右(UTC+8,下同)完成。

25時、Pythonで。

        角色的非全年龄插图 / 小说数用Python统计存在技术上的困难,因此为手动统计,与之配套的全部插图 / 小说数(包括:全年龄 + R-18 + R-18G)也是手动统计的。这一统计于2021年8月7日晚19时左右完成。

        由于不明原因,在相同条件下,用Python统计得的插图 / 小说数总是比手动统计得到的要少一些,恳请可能知道原因的读者通过评论区 / 私信与笔者交流。

插图数与小说数的统计

        角色从上到下排列的顺序,是游戏“角色档案(キャラクタープロフィール)”中呈现乐队和角色的顺序。角色名的翻译以及各乐队的代表色参考了萌娘百科[2]。

表1 各角色在Pixiv上插图数与小说数统计结果,手动统计,统计完成于2021年8月7日晚19时(UTC+8)。

分析小结

        直接观察表1,可以知道:

  • 在Pixiv上,有关“25时,在Nightcord。(25時、ナイトコードで。)”的成员的作品数是最多的;

  • 其次是Wonderlands×Showtime(ワンダーランズ×ショウタイム)和Vivid BAD SQUAD;

  • 有关Leo/need和MORE MORE JUMP!的成员的作品相对较少。

存在角色共现的插图与小说的统计

        从左上到右下的一串有色格子中,是带该角色tag的作品的数量。数值的背景色和数值大小有关,蓝色表示低,红色表示高。

        白色格子中是同时带对应两个角色tag的作品的数量。比如表2中第3行第2列,和第2行第3列的“90”,都代表“同时有星乃一歌和天马咲希tag的插图的数量是90张”。

        表2是插图数统计,表3是小说数统计。

表2 角色共现的插图数统计结果。有色格子中,是带该角色tag的插图的数量;白色格子中,是同时带对应两个角色tag的插图的数量。
表3 角色共现的小说数统计结果。有色格子中,是带该角色tag的小说的数量;白色格子中,是同时带对应两个角色tag的小说的数量。

 

        接下来计算角色之间的共现频率。共现频率通过“A出现在带B的tag的作品中的频率”定义。比如表4中第3行第2列中的32%,表示“带星乃一歌tag的插图,同时也有天马咲希的tag的概率是32%”。

        表格带有反映数值大小的数据条。

        表4是插图数统计,表5是小说数统计。

表4 用插图数计算得的角色共现频率计算结果
表5 用小说数计算得的角色共现频率计算结果

分析小结

        从大体上讲,同一队成员的共现频率远高于非同队成员,有兄弟姐妹关系的成员(司&咲希、雫&志步、绘名&彰人)的共现频率稍高于无兄弟姐妹关系的成员。

        在把握大体趋势的基础上,我们就可以从表格中一目了然地“看见”PJSK的热门CP分布情况。对于队内CP,格外高的共现频率值得注意,比如穗波&志步、爱莉&雫、绘名&瑞希。对于队外CP,注意高共现频率,比如一歌&奏。

非全年龄插图和非全年龄小说占比统计

        久 等 了!

        在后面两列中,最高的1个值标红色,第2~5高的值标橙色。最低的1个值标蓝色,第2~5低的值标绿色。

表6 非全年龄插图占比统计
表7 非全年龄小说统计

Python代码

        技术就是生产力,麻麻再也不用担心搞统计费力费时了!

        不能用浏览器访问Pixiv可能导致代码不能正常运行。

        运行该代码后,在程序所在文件夹将出现一个.xlsx格式的工作表文件,该文件中即有所需数据。不过,数据都是还没有排版过的版本。

参考资料

[1]pixiv,https://www.pixiv.net/

[2]萌娘百科 万物皆可萌的百科全书,https://zh.moegirl.org.cn/Mainpage

萌娘百科使用协议CC BY-NC-SA 3.0,协议原文见https://creativecommons.org/licenses/by-nc-sa/3.0/legalcode。

【PJSK】Pixiv插图与小说数量统计结果与分析——数量·共现频率·非全年龄占比的评论 (共 条)

分享到微博请遵守国家法律