欢迎光临散文网 会员登陆 & 注册

【PJSK】谁又是全Sekai最大的话痨?角色台词句数和总字数统计的继续,第一第二竟是…

2021-10-27 23:56 作者:涼风_青叶  | 我要投稿

写在前面

        本篇专栏统计了从开服至今(2021年10月27日,第38期活动“Revival my dream”开展期间)所有场景对话、活动剧情、卡牌故事、主线剧情中,26名主要角色的说话情况:包括说了几句话,说了几个字,其中几个是汉字,几个是假名等。

本文撰写于望月穗波的生日(10月27日),为穗波送上一句生日快乐!

        UP主黒鯨(黒鯨的个人空间_哔哩哔哩_bilibili提供了用于本专栏的台词文本,向其表示诚挚的感谢。

统计说明

①什么是假名、平假名、片假名(已知道的读者可以跳过)

        日语的书写形式是假名掺杂着汉字汉字大家都很熟悉,而其中的假名就可以看作是日语的字母。

一歌はミクの歌が好きです。

(一歌喜欢Miku的歌。)

        这句话中,“は”“です”“ミク”等不是汉字的部分就是所谓的“假名”。

        假名又分平假名片假名。像“あいうえお”这样笔画圆润,像是草体字的就是平假名;像“アイウエオ”这样笔画笔直,像是楷体字的就是片假名。

        一般来讲书写日语使用平假名。但是,专有词、外来语等,一般用片假名拼写。专有词比如:ニーゴ(25,在剧情中用作指代“25时,在Nightcord”的简称)。外来语比如:ギター(Guitar)、ショー(Show)。

②“一个字”“一句话 / 一次发言”在本文中怎么判定

        每说一个汉字、一个假名(无论是平假名还是片假名,无论是大的(あ、つ)还是小的(ぁ、っ)),就算是说了一个字。标点符号、特殊符号、阿拉伯数字和拉丁字母不算是字。

“Amiaはよく「てへっ☆」っと笑います。”

(Amia经常“诶嘿☆”这样笑起来。)

        这句话在统计时只算12个字(“は”、“よ”、“く”、“て”、“へ”、“っ”、“っ”、“と”、“笑”、“い”、“ま”、“す”)。

        在游戏界面中一次性显示在文本框里的内容,无论长短,无论是否换行,无论有几个逗号 / 句号,均算作一句话,或者一次发言

        (2021.10.28更新)幼年期剧情也纳入统计范围。

        (重要:2021.10.29更新)幼年期剧情也包括了小学时期、中学时期的台词。以“某某的声音(○○の声)”的形式出现的角色台词也纳入统计范围。25时的四人在Nightcord上使用网名相互交流的台词也纳入统计范围。

统计结果

        其它字符包括了文本中除换行字符外,所有不属于平假名、片假名、汉字中任何一类的字符,也就是上述“不算字”的字符。

        总字数是平假名数、片假名数、汉字数的总和。汉字占%的计算公式为:汉字数÷总字数×100%。

        角色从上到下按总字数从多到少排列。

        较多的数据用红色加粗表示,较少的数据用绿色加粗表示。

“第一和第二竟然是欧尼酱和我?”
“……怎么还是我最少,不是很明白。”

其它统计结果与分析

  • 统计发现MIKU以外的所有虚拟歌手发言句数和总字数都偏低。这与各虚拟歌手在各Sekai的实装情况(包括实装与否、实装顺序)有关系。MIKU从一开始就在5个Sekai同时登场,因此是虚拟歌手中发言最多的。

  • 统计发现句均字数最多的角色是神代类句均字数最少的角色是朝比奈真冬

But why?
  • 关于上一条的原因,进一步统计发现,神代类的台词有最高的长句比例,非幼年剧情中(算上符号)达到40、45、50个字的长句在所有台词中分别占21.4%、12.9%、6.9%,而所有角色的平均值分别是12.9%、7.1%、3.5%。而朝比奈真冬的台词中,有很多是非常简短的句子,比如,“为什么?”“这样吗”。

  • 全游戏的句均字数(平假名+片假名+汉字)是19.60个字略少于同类的社交手游音游《BanG Dream! 少女乐团派对》在相同条件下统计得的24.28个字。

  • 统计发现,青柳冬弥神代类朝比奈真冬的台词中汉字占比最高;镜音铃凤笑梦天马咲希的台词中汉字占比最少。

  • 全游戏的汉字百分比17.64%,和《BanG Dream! 少女乐团派对》在相同条件下统计得的17.72%基本一致。■

  • 每个角色的话加在一起已经有1363138个字了,需要114本有30页的20×20作文本才能全部抄完,而且里面还没有标点符号。■


【PJSK】谁又是全Sekai最大的话痨?角色台词句数和总字数统计的继续,第一第二竟是…的评论 (共 条)

分享到微博请遵守国家法律