在统计中窥见贴贴?结合心理分析,邦邦日服现有活动剧情的爬取,及其词频分析!(下)
写在前面
在《哪个角色最常用“?”和“!”?邦邦日服现有活动剧情的爬取,及其词频分析!(上)》[1]中,笔者利用Python和Bestdori,爬取得到日服至今(2021/05/14)的所有活动剧情文本,并进行了词频分析(以下是上篇链接,以表格形式给出的分析初步结果,请点击下方文章卡片查看)。

仅观察(上方专栏结果中的)表格,我们就能得到许多“邦邦冷知识”:
标点符号使用之最(最多篇):省略号无疑是白金燐子说得最多,活动文本中17.49%是字符“…”。问号(?)为市谷有咲(1.73%),感叹号(!)为北泽育美(5.33%),波浪号(~,或者与它长得像的符号),青叶摩卡不负众望拿到第一(3.46%)。

标点符号使用之最(最少篇):省略号使用最少的是弦卷心,字符“…”仅占活动文本的0.69%。问号(?)为PAREO(0.49%),感叹号(!)为八潮瑠唯(0.02%),波浪号(~,或者与它长得像的符号)白鹭千圣使用最少(<0.005%),其次为八潮瑠唯(0.01%)、友希那&纱夜&燐子(0.02%)。
关于语言方面,不同角色使用郑重语敬语(です・ます)的习惯不一样,多的每千字符近40次,少的每十万字符半次也不说。
最常说“喜欢(好き・すき)”这个词的角色,其实是PAREO(1.77次/千字),然后是多惠(0.79次/千字)。
……

那么:
大家都是“喜欢(好き・すき)”,那“喜欢”的对象是一样的吗?
为什么千圣、友希那、纱夜、瑠唯会用“あなた”这个日语第二人称?为什么弦卷心也用?为什么别人就不用?
注意到略显高冷的角色(例如友希那、纱夜)和比较活泼的角色(例如香澄、育美),她们剧情文本中标点符号和词汇的出现规律有差异。角色性格对标点符号使用和词汇使用有何影响?
本文作为下篇,是对上篇内容所得结果的讨论与补充,也是对以上三个问题的解答尝试。希望各位读者能从一个新的角度,更加了解BanG Dream!的各位角色,祝阅读愉快!

目录
一、不同的“喜欢”——通过分析关联词确定“喜欢”的对象
二、“あなた”这个第二人称意味着什么?
三、性格对标点和用词的影响——结合MBTI进行分析
参考资料

一、不同的“喜欢”——通过分析关联词确定“喜欢”的对象
一对关联词A和B,就是说当词A出现时,词B更可能在一句话中同时出现。打个比方,在香澄的台词中,“キラキラ(Kirakira)”和“ドキドキ(Dokidoki)”就是一对典型的关联词:当香澄说了“キラキラ”这个词之后,往往她接下来就要说“ドキドキ”了。

我们已经知道,最经常说“喜欢(好き、すき)”这个词的角色有(按角色编号从小到大):花园多惠、山吹沙绫、上原绯玛丽、北泽育美、冰川日菜、宇田川亚子、鳰原令王那、仓田真白[1]。下面以花园多惠为例,使用樋口耕一持有著作权的自由软件“KH Coder”,搜索她的台词中与“すき”“好き”“大好き(Daisuki)”这三个词关联最大的词语,得到结果如下:

我们看到“ポピパ(Popipa)”这个词不仅排在前面,而且排在了所有关联词的第一位。

不过分析也不总是一帆风顺。以下是北泽育美的台词经相同操作得到的结果:

“ソフトボール(垒球)”“ハロハピ(HHW)”这两个词都有出现。但是,由于样本量不大,我们并不能判定育美是“喜欢垒球多些”还是“喜欢HHW多些”(事实上也没有判定的必要)。
但是位于第二位的词是“サンタ(圣诞老人)”?!育美喜欢圣诞老人吗?
当然不是。原来,“圣诞老人”并不是“喜欢”的接受方,而是“喜欢”的实施方。
でも……サンタさんを笑顔にするんだよ?サンタさんの好きなものがないとダメだと思う
但是…… 要让圣诞老人露出笑容哦? 没有圣诞老人喜欢的东西大概是不行的
——活动《圣诞老人要来我家》第2话:育美的想法
我们可以试着找找其他角色“喜欢”的对象,总结各角色台词中“喜欢”的关联词如下:
沙绫:朋友(“朋友”这个词出现11次,和“喜欢”一起出现了2次。其中一次是喜欢和朋友在一起的时间,但另一次其实是喜欢很关心“朋友”并且容易害羞的有咲)
绯玛丽:兰(绯兰糖?未必,其中有几次是大家喜欢兰,有几次是兰喜欢大家,还有一次是兰的爸爸喜欢兰……)
日菜:PasPale、可丽饼(只是在问别人“喜欢”吃怎么样的可丽饼)、粉丝(Fans,和“圣诞老人”一样其实是“喜欢”的实施者)(并没有“哦内酱”)
亚子:游戏(别急着怪亚子玩物丧志,“Roselia”或“哦内酱”其实是和“カッコイイ(帅气)”关联的)
令王那:PasPale(并没有RAS和“CHU²大人”,不过,和“CHU²大人”关联最大的词确实是“PAREO”,其次是“はい”)
真白:(样本量不够大,未能得到有意义的结果)


二、“あなた”这个第二人称意味着什么?
2.1 第二人称使用情况概述
在进入正题前,还是应当先对邦邦角色使用第二人称代词的情况进行概述。
第二人称指与“说话者”相对的“听话者”,比如,“你”“你们”。
邦邦角色的第二人称使用情况如下表,不在表格中的角色,不常用第二人称词语:


2.2 关于“貴方”的被冷落
众所周知“貴方”是日语的单数第二人称代词之一,好比汉语的“你”,英语的“You”。但是,“貴方”不是口语常用词。
米澤陽子(2016)于2014年在日本首都圈以问卷形式,对年龄从10岁到60岁不等的428人,就“貴方”一词的使用进行了调查[2]。结果却显示即使是对于与自己地位相同者,也有62.9%的人是从不使用“貴方”一词的,33.6%的人要“视情况而定”,3.5%的人从来不用。
提及“貴方”一词的用法,在日语中它可以是正式的第二人称①,也常用于妻子称呼丈夫②[3]。相对应地,米澤陽子的调查报告指出了人们不倾向于使用“貴方”一词的原因:多数人认为“因为是郑重的称呼,让人感觉有距离感,冷冰冰的”“感觉像被撇开了,不太好”“太正经拘谨”等等①,少数人则由于采纳意思②,反过来觉得“貴方”这个词“过于亲密”“让人觉得不好意思”。

2.3 解释环节,“貴方”人称的使用与角色塑造的关系猜测
我们已经知道“貴方”有两种意思:①正式第二人称;②妻子对丈夫称呼。邦邦角色使用“貴方”,自然只可能是意思①。
而意思①是让人感到“有距离感”的,即,使用“貴方”一词的角色,在主观或客观上,与其他角色存在距离。如此可知,这样的角色可能具有高冷属性,也可能具有大小姐属性,等等。如此或许就解释了为什么友希那、纱夜、千圣、瑠唯这4个“邦邦高冷担当”,以及心、CHU²两位大小姐,均会使用“貴方”这一第二人称,而其他人不用。


三、性格对标点和用词的影响——结合MBTI进行分析
3.1 MBTI简介
接下来我们要分析角色性格对标点和用词的影响,为此必须要有一套办法分出人的性格(比如把角色分成“高冷的”“活泼的”等等)。MBTI就是一种分析性格的相对有力且便捷的工具。
MBTI(Myers–Briggs Type Indicator,迈尔斯-布里格斯类型指标)是一种人格分类方法。它将人格分成了如图所示的16个种类。

每种人格用4个字母表示,第一个字母为E/I,第二个字母为N/S,第三个字母为F/T,第四个字母为P/J,它们表示人格的4个维度,分别具有如下意思[4]。
限于篇幅,本文对MBTI本身的介绍只能点到为止,有兴趣的读者可自行查阅资料了解。




以下是从Personality Database[5]获得的BanG Dream!一些主要人物的MBTI人格数据。Personality Database通过网友投票获得各个现实与虚拟人物的MBTI人格,但是未必准确,仅供参考。


3.2 MBTI与标点与用词的关系
我们求不同维度角色的数据平均值。但在求平均值前,去掉了一个最大值和一个最小值,避免一些“大户”一人拉高平均值的情况发生。
同一维度两个方向差异较大时,较大值以红色加粗表示。



3.3 结论
关于标点符号,我们发现E或N或F或P型人格的角色,有多用感叹号(!)、波浪号(~)、长音(ー)等表示感情的符号的趋势。P型人格的角色使用问号(?)比J型多。I型人格的角色使用省略号(……)比E型多(因为排除了一个最大值和最小值,所以已经排除了白金燐子的影响)。

符合直觉地,被认为是TJ型人格的角色,提及“时间”“计划”“预定”等计划性词语的次数,以及提及“练习”这个词的次数,都要更多。被认为是SJ型人格的角色更常发表傲娇发言“才没有(別に)”

被认为是I或N或F型人格的角色更经常地使用敬语です・ます。被认为是I或F型人格的角色更常道歉。被认为是F型人格的角色更常在口头表现出喜悦。

结果显示与学习有关的词的使用,以及“喜欢”这个词的使用,和MBTI人格没有显著关系。■

上篇传送门:


参考资料
[1]涼风_青叶,哪个角色最常用“?”和“!”?邦邦日服现有活动剧情的爬取,及其词频分析!(上),https://www.bilibili.com/read/cv11287090
[2]米澤陽子,二人称代名詞「あなた」に関する調査報告,日本語教育163号 2016.4
[3]日语维基百科,あなた,https://ja.wikipedia.org/wiki/あなた
[4]百度百科,迈尔斯布里格斯类型指标,https://baike.baidu.com/item/%E8%BF%88%E5%B0%94%E6%96%AF%E5%B8%83%E9%87%8C%E6%A0%BC%E6%96%AF%E7%B1%BB%E5%9E%8B%E6%8C%87%E6%A0%87/854525
[5]https://www.personality-database.com/