【PJSK】谁又是全Sekai最大的话痨?角色台词句数和总字数统计的继续,第一第二竟是…
写在前面
本篇专栏统计了从开服至今(2021年10月27日,第38期活动“Revival my dream”开展期间)所有场景对话、活动剧情、卡牌故事、主线剧情中,26名主要角色的说话情况:包括说了几句话,说了几个字,其中几个是汉字,几个是假名等。

UP主黒鯨(黒鯨的个人空间_哔哩哔哩_bilibili)提供了用于本专栏的台词文本,向其表示诚挚的感谢。

统计说明
①什么是假名、平假名、片假名(已知道的读者可以跳过)
日语的书写形式是假名掺杂着汉字。汉字大家都很熟悉,而其中的假名就可以看作是日语的字母。
一歌はミクの歌が好きです。
(一歌喜欢Miku的歌。)
这句话中,“は”“です”“ミク”等不是汉字的部分就是所谓的“假名”。
假名又分平假名和片假名。像“あいうえお”这样笔画圆润,像是草体字的就是平假名;像“アイウエオ”这样笔画笔直,像是楷体字的就是片假名。
一般来讲书写日语使用平假名。但是,专有词、外来语等,一般用片假名拼写。专有词比如:ニーゴ(25,在剧情中用作指代“25时,在Nightcord”的简称)。外来语比如:ギター(Guitar)、ショー(Show)。
②“一个字”“一句话 / 一次发言”在本文中怎么判定
每说一个汉字、一个假名(无论是平假名还是片假名,无论是大的(あ、つ)还是小的(ぁ、っ)),就算是说了一个字。标点符号、特殊符号、阿拉伯数字和拉丁字母不算是字。
“Amiaはよく「てへっ☆」っと笑います。”
(Amia经常“诶嘿☆”这样笑起来。)
这句话在统计时只算12个字(“は”、“よ”、“く”、“て”、“へ”、“っ”、“っ”、“と”、“笑”、“い”、“ま”、“す”)。
在游戏界面中一次性显示在文本框里的内容,无论长短,无论是否换行,无论有几个逗号 / 句号,均算作一句话,或者一次发言。
(2021.10.28更新)幼年期剧情也纳入统计范围。
(重要:2021.10.29更新)幼年期剧情也包括了小学时期、中学时期的台词。以“某某的声音(○○の声)”的形式出现的角色台词也纳入统计范围。25时的四人在Nightcord上使用网名相互交流的台词也纳入统计范围。

统计结果
其它字符包括了文本中除换行字符外,所有不属于平假名、片假名、汉字中任何一类的字符,也就是上述“不算字”的字符。
总字数是平假名数、片假名数、汉字数的总和。汉字占%的计算公式为:汉字数÷总字数×100%。
角色从上到下按总字数从多到少排列。
较多的数据用红色加粗表示,较少的数据用绿色加粗表示。




其它统计结果与分析
统计发现除MIKU以外的所有虚拟歌手,发言句数和总字数都偏低。这与各虚拟歌手在各Sekai的实装情况(包括实装与否、实装顺序)有关系。MIKU从一开始就在5个Sekai同时登场,因此是虚拟歌手中发言最多的。
统计发现句均字数最多的角色是神代类;句均字数最少的角色是朝比奈真冬。

关于上一条的原因,进一步统计发现,神代类的台词有最高的长句比例,非幼年剧情中(算上符号)达到40、45、50个字的长句在所有台词中分别占21.4%、12.9%、6.9%,而所有角色的平均值分别是12.9%、7.1%、3.5%。而朝比奈真冬的台词中,有很多是非常简短的句子,比如,“为什么?”“这样吗”。
全游戏的句均字数(平假名+片假名+汉字)是19.60个字。略少于同类的社交手游音游《BanG Dream! 少女乐团派对》在相同条件下统计得的24.28个字。
统计发现,青柳冬弥、神代类、朝比奈真冬的台词中汉字占比最高;镜音铃、凤笑梦、天马咲希的台词中汉字占比最少。
全游戏的汉字百分比是17.64%,和《BanG Dream! 少女乐团派对》在相同条件下统计得的17.72%基本一致。■
每个角色的话加在一起已经有1363138个字了,需要114本有30页的20×20作文本才能全部抄完,而且里面还没有标点符号。■