欢迎光临散文网 会员登陆 & 注册

我们失去的是一艘诺亚方舟

2020-03-13 04:40 作者:沦为翻译的黑喵  | 我要投稿

始发于微博头条文章:https://card.weibo.com/article/m/show/id/2309404481857990295614


在这里我就直接进入主题吧:

这篇文章包括以下内容:

1、我为什么要扒这个数据?

2、数据中可能存在的不足

3、中文同人在AO3上的数量及分级分布变化趋势

4、我的个人想法


1、我为什么要扒这个数据?

      “227”事件其实只是个契机。我早在去年开启“AO3tag翻译计划”(目前该计划因为个人及其他原因已停摆)的时候就用AO3进行过爬虫练习。如果大家还有印象的话,去年6月至9月微薄上曾对中文用户涌入AO3进行了一定范围内的讨论。OTW官方新闻传送门:https://archiveofourown.org/admin_posts/12907。为此AO3还特地成立了中文的标签管理员(Tag Wrangler)。

       所以这次爬数据,我除了分析伟大长城对AO3中文同人的影响外,还分析了AO3中文同人三年来的趋势。这次数据并不针对孤立事件,反而是为了分析多年来的几次事件(虽然我也不一定说得清具体是什么事件)的叠加影响。


2、我获取了什么数据,数据中可能存在哪些不足?

        先说说数据可能存在的问题。首先,分级这个是作者自己决定的,可能存在偏颇(如果你对某篇同人的分级存在异议,欢迎通过Abuse Report进行汇报,Report支持中文)。其次,AO3早期在发布文章的时候如果作者没有修改语言选项的话会默认显示为英文,但这个bug已经在2019年11月被修复(官方公告:https://archiveofourown.org/admin_posts/14605),所以2019年11月中旬之前的语言数据可能会有误差,但之后的数据我认为可以认定为完全准确的。最后,2020年3月31日的估算数据可能偏高。我是直接按3月1日至3月10日的数据乘以三来计算的,但随着镜像网站和一些代理网站陆续被ban,我估计实际数据会比预估要低。

         那么我爬了什么数据呢?我以2020年3月1日为节点,往前每30天取样一次,按分级爬了AO3上的同人文总篇数,中文同人总篇数,英文同人总篇数。然后以此为基础,我推算了AO3上非英文同人的总篇数,全部同人文/中文同人/非英文同人的增量,还有全部同人/中文同人/非英文同人总篇数和增量的分级分布。非英文同人总篇数这个数据是我今天(3月12日)早上扒的,因为昨天晚上睡前我发现中文同人在AO3所有同人的占比中不高,但在非英文同人占比中相当高,今天爬出来的数据也很有趣,下面会详细分析。


3、结果

        当然,为了证明我吃了两碗面,我得先剖开肚子:(1)我的代码在github上是开源的:https://github.com/batcat229/AO3Counting ,之后修正的数据也会再放上去。原始数据的文件是没有放的,因为程序运行之后就会生成。但是这个程序还有瑕疵,这里不展开讲,如果有人对代码感兴趣的话,可以过来私我交流。(2)关于分级,大家已经进行了很多讨论了,AO3官方的分级定义及建议在这里:https://archiveofourown.org/faq/tutorial-posting-a-work-on-ao3?language_id=zh-CN#pwtrating 下拉还有关于大警告的定义。


(1)总量趋势

AO3全部同人总数表(累进图示)

           那么先上一张AO3所有作品的总量趋势,说一下这类图表要怎么看。这个图是累进图,也就是说所有分级的文的会直接叠起来,最上面的边界就是总篇数。图例有些被水印挡住了,但知道从上到下分别是”Explicit(成人级)“,”Mature(***)“,”Teen And Up Audiences(青少年以上)“,”General Audiences(普遍级)“和“No Rated(无分级)"(与图标顺序刚好相反)就行,后面的图标颜色也会保持一致。如果之后的图标出现了总数(”Total“)的话,Total数据会以橙色标出。最后一个数据是我的推测数据,就是单纯把从3月1日到3月11日增加的数量乘以三来模拟3月31日的数据,以满足30天取样一次的时间区间。

           那么从图上我们可以看出,AO3的同人总量一直在平稳增长,但在3月1号之后突然开始爆发。那么是不是AO3被ban之后中文同人反而报复性增长呢?请看下图:

AO3中文同人总数表(累进图示)

        如图所示,中文总数量在2018年11月7号之后突然开始爆发式增长,在2020年3月1号之后增长速度稍微放缓。这个放缓在增量图里会更加明显。考虑到AO3已经强制要求用户在发文的时候选择语言,所以排除了3月1号之后在AO3上发文的中文作者选错语言的可能。

AO3排除中文作品后的非英文同人总数表(累进图示)

       对比预测增长相对正常的非中文非英文同人总数后,我只能推测是因为AO3英文作品在3月初出现了一个井喷才导致了那个异常值。考虑到AO3官方1月16号的公告(https://archiveofourown.org/admin_posts/14779),可能这次爆发与Watchmen Kinkmeme参与Open Doors计划(计划介绍,目前没有中文:https://opendoors.transformativeworks.org)有关。


(2)增量趋势

 

AO3全部同人增量表(累进图示)
AO3排除中文同人的非英文同人增量表(累进图示)

       这两张图还是累进图。无论是全AO3的同人增量还是排除中文的外语同人增量除了最后推测值异常外基本上三年来都是比较稳定的,当然最近几个月增量也开始有增长的趋势。那么中文同人的增量是怎么样的呢?

AO3中文同人增量表(累进图示)

        中文的同人增量明显是有周期地增长的。我标出的时间点是增长开始的时间点。造成这种现象的原因可能是多样的,我这里不会展开说,希望其他有识之士可以深入分析。但2020年3月1日之后的滑坡,证明伟大的长城已经发挥作用了。而且据传今天雨果计划关站,相信实际数据会比我现在推测得要低。


(3)增量分级分布

AO3中文同人增量趋势(分级占比对比)

         我之前在自己的微薄上放出的是总量分级对比趋势,但这个增量对比才比较能反映变化趋势。先说一下这个表要怎么看:想知道哪个时间段间增加的中文同人的分级分布,只需要在始终两个时间节点内对这个图进行一个“切片”,切出来的颜色面积比例即为那个时间段上传的中文同人的分级分布。我之前在预告微博里做的判断是错的,从这张图看来,早在2018年4月开始,中文同人中G级和PG13同人的比例开始逐步减少。

AO3全部同人增量趋势(分级占比对比)
AO3排除中文的非英文同人增量趋势(分级占比对比)

      对比可见,AO3上的同人总体趋势大致保持平稳,成人向的内容也在略微逐步增加,而非中文非英语的同人则基本上保持了相对平稳的比例。

      首先,这肯定了其他人统计中认为中文同人相对于其他同人尺度较大的推论,也间接证明了的确有中文同人作者把AO3当作停车场。但是我们必须注意到,在AO3上中文同人的分级分布是产生了明显变化的。其中的缘由相信各位创作者已经心中有数了。

      那么,可能有人会问,是不是中文同人成人向作品变多导致AO3成人向作品的比例变大的呢?


(4)中文同人的占比

占比对比

       还是先说一下这张图要怎么看。一骑绝尘的哪个红线是中文同人作品总数占非英文同人总数的比例,中间蓝色那条是中文同人作品总数占全AO3同人总数的比例,最下面绿色那条是除中文同人外的非英语同人作品占AO3同人作品总数的比例。

      AO3毕竟还是美国的网站,在AO3上的英文同人是占压倒性优势的。截至昨天统计时,AO3总同人数将近580w,其中英文同人占了近500w,所以中文同人始终只是AO3的一个添头而已。但是中文作者的确在AO3上逐渐获得了一席之地,从最开始的0.74%,逐渐爬到了2020年3月1日的4.38%。昨天我去搜非英文同人数量的时候,我才发现,原来中文已经占领了非英文同人的半壁江山。但现在,伟大的长城效果立竿见影,我们的比例马上就掉下去了。而且这些数据是绝对准确的,因为计算比例并不需要考虑时间跨度,我并没有调整数据。


4、碎碎念

       不知不觉写了几千字。相信大家在看完原始数据之后都产生了自己的想法。如果你只需要看客观数据,那么到这里就可以关闭页面了,接下来是我的一些碎碎念。

        首先,和其他吃瓜群众不一样,我也是同人创作者,我也使用过lof和AO3。看到中文同人的数据变化,我第一反应是:这侧面证明了中文创作环境的确在收紧。如果中文平台足够好,我相信绝大部分创作者是更喜欢使用自己母语的平台的。之前我看到的大部分”数据分析“,总是试图证明”AO3作者“比”lof作者“更”黄暴“。这里不谈文学创作和淫秽色情之间的关系,我觉得不了解创作群体经历的人不配说这样的话。

        然后,我在预告微博里也说过,我国人口占世界20%,但是在AO3上的作品比例仅为4%

,就算考虑到国内有lof,AO3本身有使用门槛,这个比例我个人还是觉得偏低了。AO3努力过,它向中文作者敞开怀抱,创建了绝无仅有的中文志愿者团队,甚至让颇有怨言的英语使用者要包容;创作者也努力过,他们创作,学习使用外语平台,然后试图让大家看到作品。我只能说,这个结果是我们都不想看到的。

        其次,有人问过我,这次事件是不是能有更深层次的讨论。当然!这次事件早就不是一个粉丝团队和平台使用者的矛盾了。这次事件能延伸开的话题很多,分级制度,创作自由,流量粉丝真实情况。但这个我不敢展开说,我怂,我只能说:创作不死。只要坚持创作,我们就赢了

         最后,我把AO3比作诺亚方舟,是因为它在限制创作的洪水中,给我们提供了一个安全可靠的地方,让我们可以肆意创作。有人迫使这艘船离开了我们的生活,但她依然会傲立海上,为其他需要的人提供一个他们需要的平台。


我们失去的是一艘诺亚方舟的评论 (共 条)

分享到微博请遵守国家法律