欢迎光临散文网 会员登陆 & 注册

【BanG Dream!】很有感情,很有精神——台词文本情感分析初探

2021-12-27 22:21 作者:涼风_青叶  | 我要投稿

写在前面

        人具有阅读文本,分析其中所含情感,甚至其中潜台词的能力——冬天到了,请阅读下面四句描述“下雪”的例句:

  1. 耶耶耶天哪天哪居然下雪了!!哇哇哇哇像撒上奶油般的街道真的好好看!!

  2. 哇塞,居然下雪啦!开心诶,这不就又有雪景可以欣赏了吗?

  3. 看窗外兄弟 / 姐妹,下雪了,开不开心?

  4. 下雪了。我很开心。真的。嗯。

        虽然这四句话都描写“下雪”这一事件,并且都含有“开心”这个关键词,但说话人的情绪积极性,是从1到4逐句递减

        1,常见于各大社交平台,是看见雪这一“真实的魔法”时的狂喜2,一般的开心,适用于日常口语交际;3,转述下雪这一事实,只是个中性的问句4,尽管有个“开心”,这个“开心”则可能是因为雪把说话人今天刚晒干的被子又弄湿了,可能是因为说话人的姐姐答应Ta“当且仅当明天天晴,明天一起出去约会”——总之这个“开心”不是真心的

真情像梅花开过,冷冷冰雪不能淹没……

        话说回来,我们能让电脑判断文本中蕴含的情绪吗?答案是——虽然在很多方面尚不能做得和人类一样好——但是可以。事实上,通过程序判断文本中情绪的积极性和消极性的技术,目前已在电商、舆情分析等领域得到一定应用。

        本篇专栏将对用程序分析《BanG Dream!少女乐团派对》中角色台词蕴含的情绪的方法做一个初探,并按照情绪积极性对角色进行排序。

怎么用Python判断文本中的情绪

        textblob是一个Python包,内置了可以分析英语文本中蕴含的情绪的程序。它通过判断其中出现的描述情绪的词语的数量、文本使用的句式、文本中出现的意象等方式,判断文本中包含的情绪积极性。具体的工作原理较为复杂,在此不继续做介绍了。

        我们首先看到如下3句长度相等,但包含的情绪不同的英语段落(附中译):

1. I really love Poppin'Party, their sweet sounds and powerful lyrics can always delight me and fulfill my heart with unlimited courage.(带有积极情绪的一句话。中译:我真的很喜欢Poppin'Party,她们那甜美的歌声、有力的歌词,总能让我心情愉悦,同时使我心中充满无限勇气。)

2. It's widely known that the younger twin sister of that guitarist is the chairperson of the student council of the high school nearby.(在情绪上中性的一句陈述句。中译:那位吉他手的双胞胎妹妹是附近高中的学生会长,这是广为人知的。)

3. Hina is sad, because she has to do a pile of exhausting tasks now. Even worse, Sayo went for practice and will not be with her today.(带有消极情绪的一句话。中译:日菜很难过,因为她现在非要干一堆累人的活不可。更糟的是,纱夜出去练习了,今天不会陪着她了。)

        我们将这三句话输入程序,将会返回介于-1与1之间情感极性参数。其中,数值越大情感越积极,1为情感最积极,-1为情感最不积极。以下是程序代码:

        以下是程序的输出结果:

        我们看到,带有积极情绪的第1句返回了正值结果在情绪上中性的第2句返回的结果接近0;带有消极情绪的第3句返回了负值结果。三个返回结果都介于-1与1之间。

数据处理

        textblob只支持分析英语文本,所以我们首先要取得各个角色台词的英语版本。台词获取范围是国际服截至2021年12月21日实装的所有活动剧情、卡面小故事和回忆小故事、主线剧情和乐队剧情。角色覆盖范围是35个主要角色、米歇尔和麻里奈,共37位

正射必中(An arrow shot correctly will always hit its target)

        然后用如下只有15行的代码处理英语台词。

        该代码能将37个角色的台词的情感极性输出到已事先准备好的Result_SentiAna_En.xlsx这一Excel文件中。经Excel排序、排版得到如下结果:

结论与分析

  • 所有角色的台词,通过程序判定,都被认为是偏向情绪积极的。

  • 心、PAREO、育美、伊芙、香澄被认为是台词情绪最积极的几个角色。尤其是心,情感极性高出别的角色一大截。

  • 有咲、瑠唯、兰、美咲和米歇尔、纱夜的台词被认为情绪没有那么积极

        台词积极性高还是比较好解释的。我们注意到积极性排名较高的角色,总的来讲给人这样两个印象:①平时情绪就很高涨;②很少(不是从不!)陷入烦恼当中。排名最前的五个角色,甚至附带着往下位列第六的亚子,无一例外都是元气系的角色。

        台词积极性低的角色稍微难解释一些。对于这些角色的特点,笔者通过观察大致总结出以下几个有待验证的规律:①言语风格冷淡;②傲娇;③苦劳人。论言语风格,兰和瑠唯是不用说的“冰冷系”,有咲、美咲,甚至于往上几位的纱夜、友希那、LAYER,都可归为较冷淡,语言中情感透露少的一类。情感透露少,情感极性自然偏向中性,在“全员正值”的邦邦企划则可能表现为情感极性数值低。论傲娇,我们看到邦邦的几个傲娇担当,除了CHU²排在中间位置,剩下的都靠后甚至在最后五名中。“傲娇”中“傲”的部分很可能会拉低情感极性。至于苦劳人,我们看到苦劳人双咲组在最后五名中都榜上有名。整天辛苦能有好气么(■

“请把我的歌,带回你的家,请把你的微笑留下……”


【BanG Dream!】很有感情,很有精神——台词文本情感分析初探的评论 (共 条)

分享到微博请遵守国家法律