欢迎光临散文网 会员登陆 & 注册

「科普向」我关注的主播/Up数据到底是真是假?关于前台数据那点事

2021-08-18 03:18 作者:暗切线  | 我要投稿

首先,我不确定这篇文章是否能发出来 发不出来会截图 如果你是在群里看到 那就是发不出来  

许久没更新干货,道个歉。工作原因,需要离开一阵子 快结束了。 因为现在老板不是很懂技术,又要求保密。 所以最多也就能写这样的科普文了,其余的都在保密范畴。

切入正题吧,我们前台看到的数据是真是假?

不限平台,不限内容形式得看,绝大多数是假的。

不过B站的视频播放数据,抖音的点赞评论和自己看到的观看数据是真的。

假数据区分:平台给的 + 内容创作者自己刷的

个人认为, 这两种情况必须区分来讲。

平台给的

1.挽尊算法

这是很久以前的一个公司起的名字,为了新Up继续学习和创作,前期会定时给视频一些观看数据少的可怜的加点观看量。实际观看量高了就不给了。

相对公平,对于真正热门的内容也没什么影响。更重要的是,可以留住一些新人创作者,使得他们不至于流失。至于多少是真的 前期可以看自己发布的东西观看量增长是否比大部分埋没的视频快来大致判断。观察了下B站点播视频的机制。没有挽尊。

2.直播人气加成

人气不等于人数。算出来的一个值 大约是人数的5-10倍,各平台不一样。官方直播间和主播直播间也不一样。

一般单一值很难确定这个用户是否在线。所以本身人气值就是很多数据混合而成。比如弹幕长链接连接数。视频CDN链接数。单位时间打赏人数。单位时间弹幕发送人数。播放器打点人数。都有相应系数。这些东西有一两样异常的时候平台也很容易追查出盗流或是主播自己刷人气的情况(没有安全的,想查都能查)

原因嘛,算是行规?都加,谁家不加血亏。主播也不爱播。目前以带货为生的平台一班是无加成的。

3. 跟平台买量

大体量有推荐算法的平台一般直接推给真实用户了。真实观看。有些就后台帮你改库。

内容创作者自己刷

这个话题可就有意思了 先看看原理

直播:第三方用边缘节点服务器 甚至是终端机直接刷那几个数据。

点播:两种方式 第一种和直播一样。第二种,刷互动量,发些无用的废话,使得推荐几率增高。赚取真实观看量。

内容平台(微博小说网站等):发无用废话。


平台反作弊方式

必须明确的是,只要数据留存够全,都能分析出来哪些是刷的量。就比如我以前很喜欢看用户流水日志。简单几行Python就能发现一大堆问题。刷量没被发现,就是平台懒得理你,不要抱有侥幸

常规反作弊手段:

1. IP 设备号 请求头分析:不多赘述都能理解,所以刷量需要大量设备和不同网络环境。

2. 请求匹配分析:参考直播。几项数据,如果不合理,比如弹幕长连接和视频链接数差很多。

3. 时间维度分析:举个例子,正常直播,一般再过几分钟之后才有推送,观众也不会突然一波上线。如果一开播猛增播放量,肯定是刷的无疑。或者比如观看请求时间间隔都差不多,那也是刷的。毕竟正常人类看东西不会给自己装个计时器还是一大帮人一起装。

4. 推荐机制直接防止。比如抖音。视频推荐给喜欢这类视频或者作者的用户 同时,视频曝光度取决于单条视频的完播点赞。创作者划分也很细。单条视频买量根本不管。但是,账号的受众群体就很容易花了。下一次推不到正确的用户,几项数据惨淡。多买几次,账号就废了。只能老老实实买官方的,至少知道推得是垂类用户。

5 根本不管:吃的就这口饭,流量就是钱。甭管真的假的,有流量就有钱赚。管你是不是刷量。机器发的废话也是用户活跃度,不要白不要。

差不多说完了 有遗漏的也就这样吧 不是干货,就不放群号了。祝数据民工安好~早日把账号做起来。


「科普向」我关注的主播/Up数据到底是真是假?关于前台数据那点事的评论 (共 条)

分享到微博请遵守国家法律