中文VOCALOID与Synthesizer V统计月报收录与识别规则
第1条 为规范《中文VOCALOID与Synthesizer V统计月报》(下简称《统计月报》)的收录与识别,制定本规则。
第2条 《统计月报》的本期数据、历史数据等均依据天钿Daily。
第3条 当天钿Daily数据库与Bilibili API数据不符时,使用Bilibili API的数据。
第4条 所有时间均使用北京时间(东八区/UTC+8时区)。
第5条 各期的收录的投稿时间段为公历当月1日4时至次月1日4时;统计时间段为次月1日4时至5时。
第6条 只收录Bilibili平台“音乐”分区“VOCALOID·UTAU”二级分区的稿件,有以下特殊情况:
a) 收录在收录的投稿时间段内投稿,在统计时间段之前转入VOCALOID·UTAU二级分区的稿件。
b) 收录在收录的投稿时间段内投稿,在统计时间段之前转出VOCALOID·UTAU二级分区的稿件。
c) 不收录不在收录投稿时间段内投稿的稿件,无论其转区情况如何。
第7条 不收录在统计时间段结束之前处于“删稿”等异常状态的稿件。
第8条 依据虚拟歌手(软件歌手)的名称进行自动识别、收录:
a) 要求名称出现在稿件视频的标题(title)、标签(tags)、简介(desc)等至少一处。
b) 优先依据标题进行虚拟歌手的识别,如果标题没有虚拟歌手的名称,则依据标签、简介进行识别。
c) 如果标题中有“COVER”(不区分大小写)、“翻唱”或“翻调”等字样,则只对这些字样前的标题内容进行识别。
第9条 只对拥有汉语(中文)VOCALOID或Synthesizer V声库的虚拟歌手进行自动识别,并且不考虑声库是否公开发售。
第10条 虚拟歌手的名称仅指官方命名,例如“洛天依”“言和”等,有以下特殊情况:
a) “初音未来”“初音ミク”均会被识别。
b) “星尘Minus”(不区分大小写)、“Minus”(不区分大小写)均会被识别。
第11条 如果使用无汉语VOCALOID或Synthesizer V的声库创作汉语歌曲,则不会被自动识别、收录。
第12条 主要收录汉语歌曲(中文曲);标题含有日语平假名、片假名的不会被自动收录;其它语言,诸如英语、俄语、自造语等,会可能会被收录。
第13条 不收录转载、搬运等稿件。
第14条 不收录“推荐歌曲”“环绕声”“中文字幕”等形式的稿件。
第15条 将会对虚拟歌手的团组进行统计,如无官方明文修改,《统计月报》认为“Vsinger”包括洛天依、言和、乐正绫、乐正龙牙、徵羽摩柯与墨清弦;“五维介质”包括星尘、海伊、苍穹、赤羽、诗岸与星尘Minus。
第16条 在《统计月报》当期发布前,对于一些不能被程序自动识别但符合要求的特殊稿件,将会进行手动识别和收录,这些特殊稿件包括:
a) Bilibili拜年纪(拜年祭)等不能标识虚拟歌手名称而具有相当影响力的。
b) 无汉语VOCALOID或Synthesizer V的声库创作的汉语歌曲,并在统计时间段之前达到1万播放量的。
c) 标题含有平假名、片假名而实际上是汉语歌曲,并在统计时间段之前达到1万播放量的。
d) 因天钿Daily数据库异常,不能正确表示标题、标签或简介的。
第17条 在《统计月报》当期发布后,收到来自评论区、私信等方式进行提醒的“漏收”特殊稿件,提醒人数在3人及以上时,将会进行手动识别和收录,并在《统计月报》下期发布之前修改当期内容。
第18条 本规则自2021年5月《统计月报》起开始实施。