欢迎光临散文网 会员登陆 & 注册

B站新16位id规律的极粗略观察

2023-08-24 00:55 作者:溟浩  | 我要投稿

前不久,突然发现空间链接出现了十六位uid:

16位uid

联想到弹幕反查的本质就是穷举,而对于十六位id,进行穷举代价极大:

会出现大量的重码,合理推测B站已经更换了散列算法(之后有空看看是什么样的...现在我手头毕竟没有十位数uid的号,所以无法猜测)

如图,原本只需要几分钟不到的过程现在如此痛苦,因此试图找到新版id分配的规律,以减少猜测范围(尽管最新散列算法是什么仍未可知,但找到uid分布规律仍是有意义的)

通过获取用户关注列表的方式,可以对其关注列表中前250位的用户的uid进行统计,经过筛选即可整理出16位uid,在足够多样本下,可粗略观察到uid的分布规律.

爬取结果:去重后共爬取到55508个uid,排序后进行观察

观察结果:

标()的为不确定的位,可能会因样本数量不足而存在误差

号段均为闭区间:

  1. 346156-345158

  2. 349297(2)

  3. 349307(4)-349309(5)

  4. 349310(3)-349314(6)

  5. 349325(5)-349329(9)

  6. 349434(9)-349434(9)

  7. 349435(0)-349438(1)

  8. 353699(3)-353699(7)

  9. 353710(4)-353712(5)

  10. 354636(6)

  11. 354637(2)-354637(4)

本来应该有个分布相关的统计图,神志模糊了画不出来,鸽了

结论:b站新16位uid分布呈一定规律性,通常其分布以六位数号段为单位集中

根据本次爬取的结果,可将暴力猜测的组合限定为多个固定的十位区间,大幅降低了穷举成本.


附件:

爬取结果 https://github.com/Werewolf-Wu/Bilibili_uid_spider_werwu/blob/main/result.txt

B站新16位id规律的极粗略观察的评论 (共 条)

分享到微博请遵守国家法律