用数据盘点osu!5位数萌新的成长历程
你TM写成论文了是吧!
一、前言
音乐游戏(Music Games)是电子游戏的一种,玩家配合音乐的节奏做出游戏动作,并主要以游戏动作与节奏的吻合程度进行评判。音乐游戏相对于射击类电子游戏(如FPS),其游戏画面和内容更加绿色健康。通过游玩音乐游戏,不但可以起到放松身心的作用,还能锻炼玩家的乐感、提升反应能力和肢体协调能力,因此是比较受欢迎的游戏类型。
osu!是由Dean Herbert于2007年开发的一款PC端音乐游戏,经数年的发展,游戏已具有四种模式,其中osu!std(以下简称osu!)为最早开发的游戏模式,游戏画面主要由圆圈和其外周逐渐缩小的渐近环构成,玩家需要配合音乐节奏,当圆圈与渐近环重合当用游标点击。点击精准度将作为判定依据。osu!的谱面难度主要与圆圈大小(Circle Size,简称CS)、渐近速度(Approach Rate,简称AR)、判定难度(Overall Difficulty,简称OD)、生命值排放量(HP drain rate,简称HP)四个量化参数以及物件排列方式有关。在osu!中存在两套排名系统用来评价玩家的游戏水平,一套是基于谱面得分的排名系统,谱面得分主要与最大连打数相关(近似呈二次方正比),每张谱面的成绩会采用该系统进行排序。另外一套为基于表现点数(Performance Point,简称PP)的排名系统。PP系统为了更能体现玩家的真实水平,以与分数排名系统类似的参数但不同的算法计算一张谱面的PP值,而玩家的综合PP值则主要由最高PP的100张谱面的成绩加权求和得到,该综合PP值也作为玩家全球排名的依据。
游戏水平的提升一直是玩家的重要目标。通过对历史游玩记录进行分析,有助于玩家更为精准地掌握自己的游戏水平,更能通过大数据分析了解技术的瓶颈,以更高的效率提升游戏能力。本文以一位osu玩家(我)作为样本,对各种渠道获得的海量的据进行了尽可能全面的数据分析,从基本情况、游戏行为、游戏水平和成绩四个方面对该玩家的osu!成长历程进行系统性的盘点。

二、研究方法
2.1 数据源
osu!官网。从osu!官网可获得的信息主要包括(1)用户的基本信息(2)谱面基本信息和排名列表,这些信息除了用户的全球排名和游玩次数显示一段时间的历史记录,多只显示当前值且实时更新。若为osu!Supporter,还可获得用户玩过的谱面列表和谱面的国内/区内排名列表。osu!官网是所有第三方站点获取数据的数据源。
osudaily。osudaily是由osu玩家Adri创建的用于记录玩家游戏基本统计信息的网站,每天更新并存档玩家的排名、pp、游玩次数等信息。
osutrack。osutrack是由osu玩家Ameo创建的用于记录玩家BP更新的网站,在访问/刷新页面时更新并存档玩家的bp信息,因此可以从此站点获得历史bp信息。
pp+。pp+是由osu玩家Syrin开发的pp算法,该算法能够分别计算玩家在瞄准、打击准度、手速等多个方面的pp值,旨在更为精确地反映玩家在各个技巧上的水平。
本地replay存档。本地replay留存了自注册账号以来的所有replay数据(不包含failed),可通过分析replay数据获得按键次数数据、打击偏差标准差(Unstable Rate,UR)和miss数据等,是十分关键的第一手资料。
2.2 分析工具
本工作采用python进行数据获取、清洗、整理、分析和可视化工作。主要引用库如下:
request、urllib等爬虫相关库
pandas、numpy、matplotlib:数据分析三件套
osuparse:用于处理replay文件
circleguard:用于计算replay的UR,分析miss情况等。
其他依赖库,包括时间序列分析所用到的time、datetime,数据读取/写入所用json等。
2.3 数据爬取
谱面成绩信息的爬取于2021年12月2日21时开始,3日2时结束。对osudaily中osu!std玩家的所有数据的爬取于2021年12月3日9时开始,11时结束。osutrack和pp+数据获取于达到2021年12月2日19时48分(即达到100K后立即获取)。数据爬取过程中该玩家没有进行任何游玩。数据分析所用数据截至以上爬虫结束时间。
2.4 部分数据分析方法
本节简述涉及到“同分段玩家平均水平”和本地数据的分析方法。
”同分段玩家平均水平“数据的获得:采用osudaily注册用户中pp值在3780±100pp的505位用户的各项指标数据作为”同分段玩家“的样本进行分析。
UR分析:要进行UR分析,replay数据(osr文件)是必要的。通过将各BP成绩对应的成绩提交时间和谱面hash值与本地replay文件信息相匹配,匹配出671个replay,通过python的circleguard库对replay的UR进行计算即得所需数据。
按键模式分析:按键模式的分析同样需要replay数据。使用python的osrparse库解析replay文件,获得每张replay的各按键次数即得所需数据。

三、数据分析
3.1 基本情况

用户名:JaSpirit,uid:20309693
注册时间:2021年1月11日
游玩方式:左键右板,以食指为主指的强双,普通握笔手法,牵拉型(drag)笔势,屏幕宽高比1.5:1,映射大小45mmx36mm
达到100K时间:2021年12月2日 19时48分
从注册到达100K:
所用时间:325天(近11个月),其中14天21小时(357小时)游戏时间,平均每天66分钟,占每天的4.6%
游戏次数:15916,平均每天49次,每小时游戏时间44.6次,每次81秒
共pass了827个谱面集的1313个谱面(仅包含可提交成绩谱面)
达到100K时的PP:3779.43,平均每天11.6pp,每小时游戏时间10.6pp
达到100K时的准确率:98.39%
达到100K时的总命中次数:4338775
3.2 游戏行为分析
3.2.1 每月游玩次数

自1月注册以来,共进行15916次游玩,平均每月1447次,除3月外,其余每月的游戏次数均在约1000以上。
3月是该玩家遇到的第一个瓶颈期,实在没有玩下去的动力而于3月10日主动锁定了1个月的osu账户。不过之后的瓶颈期再无类似情况发生。
3.2.2 每天的游玩时间分布

通过对本机电脑存档的replay的时间戳进行分析,获得每天游玩时间的分布,可见,游玩时间主要集中于深夜(22-24时),其次是晚上(17-20时)及上午(11-12时)。
3.2.3 BP更新频率

5月-11月这六个月,平均的BP更新频率为:18天更新1次bp1,6天更新1次bp前5,3天更新1次bp前10,0.9天更新一次bp前50,0.5天更新一次bp前100。
在这六个月中,以10月份的表现最为出色,平均每3天更新1次bp前5。
3.3 游戏水平分析
3.3.1 全球排名与PP历史记录

虽说osu的pp系统一直被人诟病,但其确实能够在很大程度上反映玩家的游戏水平。一些重要的时间节点如下:
1000pp:2021.2.7
2000pp:2021.6.7
3000pp:2021.10.5
可见,1000-3000pp期间,约每4个月增长1000pp。
3000pp之后经历一次排名影响较大的pp系统改动(Xexxar's rework,2021年11月11日生效。增长约85pp,该分段pp平均变化值为-110pp,排名变化约25000名)。
3.3.2 PP与游玩时间的关系

从此图中看出该玩家的进步情况比平均水平略快。
3.3.3 准确率与游玩时间的关系

由于该玩家对准确率要求较严,因此相比于平均水平,准确率达到较高的值(98%)较早。
3.3.4 历史BP记录(PP)

此图展示的是以pp为纵轴的历史BP记录,并以不同颜色和形状的图案标记成绩评级,可见BP主要由S评级构成,其次为A,其他评级较少。关于成绩评级分布的详细分析见下文。
3.3.5 历史BP记录(UR)

对BP成绩的UR分析属于本工作的创新点之一,由图中可见,UR总体上呈现降低的趋势(平均每天降低0.36),但与时间的相关性不如PP高。同时,UR也与游戏模式有关,如某些mod对AR的改变会对读图有影响,进而影响打击准确率。对最近100个BP的分析表明,NM成绩的UR均值为170.9±38.2,对DT成绩的UR均值为250.0±40.1。
3.3.6 按键模式变化

对按键模式的分析同属本工作创新点。从图中可见,该玩家注册游戏之后立即由单戳改为强双,但4月份开始逐渐偏离强双,直至9月初强制改回。但目前按键模式也并非严格强双,而是在连打时具有主指(食指,x),且在~100bpm重叠物件时存在倾向于中指(z)单点的一种混合按键模式。此两种特征导致综合的按键比率十分接近于50%(50.4%)。
3.3.7 pp+数据

pp+数据显示该玩家在串瞄准度(flow aim)和打击准度(accuracy)上具有明显优势,而在跳瞄准度(jump aim)和游标准度(precision)方面较差,这意味着该玩家对按键手的控制较游标手的控制更好,擅长打串图但不擅于跳图。
3.4 成绩分析
3.4.1 成绩评级历史记录

3.4.2 A评级比率

此图展现的是该玩家(红色五角星)和同分段玩家的A评级占A及以上评级的成绩比率,可见该玩家的A评级比率处于较低水平(29.4%),这意味着该玩家更倾向于把谱面da到S。
3.4.3 谱面成绩评级分布

3.4.4 谱面星级分布

上图呈现了不同成绩分布谱面星级分布(KDE),可发现S评级谱面分布较宽,但于5星开始密度急剧下降;A和B评级的谱面则集中于5星左右,这也与该玩家打图习惯吻合,此后,S评级谱面分布将继续展宽,其右边界继续右移,而A和B评级的谱面分布仍将保持正态分布之形状,继续右移。
3.4.5 AR和CS与成绩评级的关系

此图展现的是谱面的AR和CS两个参数与谱面成绩评级的关系,可见,无论何评级,谱面的AR和CS都分别集中于9.0和4.0,其中A评级分布更加密集,且有向更高CS移动的趋势。
3.4.6 AR和谱面长度与成绩评级的关系

此图展现的是谱面的AR和谱面长度两个参数与谱面成绩评级的关系,其中谱面长度用谱面最大连击数表征,可见S评级和A评级的谱面分布具有明显差异,最显著的差异在于谱面长度,S评级长度基本处于1000以下,明显少于A评级,这意味着该玩家在长图上的耐力不足,有待提升。
3.4.7 按mod BP PP序列

上图展现的是按mod分类、按PP排序的的BP序列,从此图中可明显看出该玩家以NM为主(仅NM pp加权总值=3691),另外,该玩家在DT上也有一定水平(含DT pp加权总值=2938),但并不特别擅长HD和HR(仅HD pp加权总值=1680,含HR pp加权总值=867)
3.4.8 成绩排名分析
在1313张玩过的谱面当中,有9张谱面的成绩进入全球前50,且23张谱面的成绩为国榜第1。约16%的谱面成绩处于国榜前10名、全球前150名和全球排名比率前1%(排名比率为全球排名与谱面总通过次数之比值),可谓成绩喜人。



四、总结与展望
本工作对该玩家的osu!游戏历史和游戏水平进行了系统性的回顾和科学全面的分析,对该玩家今后的游戏技术提升具有指导意义。今后一段时间,该玩家将主要致力于游标瞄准度的提升,并且锻炼低AR(AR≤8)以及高AR(AR≥9.6)的读图能力。希望该玩家借助知识的力量,通过osu!获得多方面能力的提升。

