知乎限流:工程师跑了500万条用户数据,发现这
你好,我是小饿。这个「年」终于过去了,很多运营同学,尤其是教育领域的同学,也都正式回到了工作岗位。
新的一年里,在平台选择上,大家面临很多重要的选择。知乎作为国内最大、最有影响力的知识分享社区,一直以来广受关注,很多运营人把知乎作为自己打造个人 IP 的重要平台,很多企业也在知乎上通过分享专业行业知识塑造品牌形象。
过去的一年,我们看到或听到了很多不同的观点,「知乎红利期过了」「知乎也开始做下沉市场了」,甚至有大 V 声称自己的账号被限流,于是大批大 V 开始逃离知乎……
各路大神的说法不一样,该听谁的?分享一篇后端开发工程师 @二胖并不胖 的文章,倒不是他的行文有多好,而是这篇文章传递了一个至关重要的观念,看证据,这个观念一旦建立,不仅可以少走很多弯路,还可以减少内心的焦虑,甚至改变自己看待世界的方式。
正文
知乎第一大 V 张佳玮的一条知乎想法再次引起了大 V 们对知乎「限流」的热议。
大 V 们为什么会觉得知乎在「限流」,可能各位吃瓜群众不太了解。近期大 V 们发布的文章和回答的点赞数明显不如以前多了,部分关注者也看不到他们的动态,所以大 V 们才会认为知乎对自己的流量做了限制。也因此,张公子才会做上图中的「测试」。
知乎官方也进行了回应:
当然,知乎官方否认对大 V 进行了「限流」操作,解释说只有用户屏蔽了相关「话题」后才会阻止这部分用户查看到大V们的动态。
很多大 V 和关注者们提出了质疑,并且给出了「证据」,场面一度陷入尴尬……
知乎是否对用户进行了限流操作呢?这个二胖其实是不太关心的,因为我的赞同数一直不多……
反而我对大 V 们的日常动态更感兴趣,顺便也想看看大 V 们的赞同数是不是真的少了,于是就有了下面这一份统计。
申明:以下统计为民间统计,不代表知乎官方,仅供参考。
以下统计由后端开发工程师 @二胖 完成,非科班数据分析工作者,如果数据图表做得比较丑,请凑合看。
好啦,正式开始,文章可能有点长,请大家耐心观看,谢谢。
1
数据描述
我在 2018 年 1 月的时候爬过一次知乎的用户信息,去重后的用户数据量在 500 万。
此次统计所用的数据就是我今年 1 月份抓取的。我将截至 2018 年 1 月,粉丝数超过 10K 的用户作为大 V 筛选出来。所以,你的粉丝数如果在 2018 年 1 月时还没有超过 10K,这份报告里面可能就不会包含你的数据喽。
通过筛选,我一共找出了 5043 个万粉大 V,然后我对这 5043 人的信息进行了更新。也就是说,这 5043 个人数据的最后更新日期是 2018 年 11 月。
这里解释一下,我当时抓取知乎用户信息的策略是遍历用户的粉丝和关注者,从概率上讲,漏掉大V的可能性是比较小的。也就是说,当时的数据量是比较真实的,10k 粉丝以上的大 V 大约有 5000 人,当然现在肯定远远不止了。
在更新数据(重新抓取大 V 们的数据)的过程中,我发现其中有 4986 个账号能访问,57 个账号已经停止使用知乎,可能该账号已注销,如下图所示。
数据包含两部分,第一部分是这 4986 个大V的基本信息,也就是你们能在大 V 的知乎首页上看到的信息,比如职业、地点、赞同数、粉丝数等。
数据的第二部分是大 V 们的动态信息,包括发布文章、收藏回答、关注问题、回答问题、点赞回答、点赞文章、发布想法、关注话题、创建问题、关注专栏、关注收藏夹、收藏圆桌等动态的产生时间、赞同数量等信息,合计 225 万条数据。
2
大 V 基本信息分析
知乎大 V 的男女比例:
知乎将性别信息分类为三类。第一类是 1,代表男性;第二类是 0,代表女性;第三类是 -1,可能是机构号或者认证号吧,其中李开复老师的账号的性别是 -1。
从上图可以看到,男性大V的数量是远远大于女性大 V 的。
大V们都来自哪里:
知乎大V粉丝数排行 Top15:
下表左列是知乎用户的名字,右列是大V的粉丝数量,看看有你们眼熟的人吗?榜首张家玮,知乎联合创始人周源、黄继新、张亮纷纷进入 Top 10。
知乎女性大 V 粉丝数排行 Top10:
大 V 回答问题的数量排行 Top10:
我一直很好奇轮子哥为什么有那么多时间刷知乎,一如既往地占据榜首的位置。
大 V 获得赞同的数量排行 Top10:
张公子稳居第一,不愧知乎第一大 V。
大V获得收藏的数量排行 Top10:
从下表可以看出,大家很关心做饭。
3
关于「限流」
大 V 们感知被「限流」的原因就是自己的回答和文章「获赞」少了,那我们就来统计一下这两个参数。
近五年大 V 们回答问题的活跃度:
由于时间过于密集(Kibana 的图表有点难看),所以就没有在图表中标注时间。x 轴是时间序列(13 年 ~ 18 年,间隔单位为周),每一根竖条代表大 V 们一周回答的问题数量,2018 年 10 月 29 日开始的这一周数量最多,大 V 们回答了近 5000 个问题。可以看出这 5 年大 V 们回答问题的积极性是在升高的。
近五年大 V 们发布文章的活跃度:
可以看到,大 V 们发布文章的活跃度走势和回答问题的活跃度走势不太一样。从 2018 年 8 月 20 日开始,大 V 们发布文章的数量开始持续走低,直到 2018 年 10 月的最后一周开始上涨,11 月的第一周开始了爆发式的增长。
这是为什么呢?因为 10 月末 11 月初有太多的事情发生,金庸大侠和李咏永远离开了我们、IG 历史性地获得了胜利…
不管是大 V 们是真想写点什么,还是为了蹭一把热度,总之文章的发布量是上去了。
正常情况下,大 V 们获得赞同的数量和他们发布回答和文章的数量走势应该一致。所以,我统计了一下大 V 们文章获赞和回答获赞的数量基于时间的变化。
首先看看大 V 们文章获赞的数量走势:
上图给出了三个重要的时间点,大 V 们文章获赞的走势和发布文章的数量走势大致相同,只是有些细微的不重合,似乎看不出什么端倪。
那么接下来再看看大 V 们发布的回答获赞的数量走势:
上图是截至 2018 年 11 月第二周,大 V 们在每个时间段回答的问题获赞数量的走势。这张图我们需要对照下面这张图来看,下图是大 V 们在每个时间段回答问题的个数统计。
可以看到,两者的走势出现了比较大的差异。2018 年 9 月以来大 V 们发布回答的赞同数量急剧下降,难道是被「限流」了吗?这个不好说,也有可能因为回答问题的时间距离统计的时间太近,赞同数还没有上去。
如果真是由于回答的问题距离统计时间太近而造成赞同数量较低的话,那么 2017 年 8 月 7 日到 2018 年 3 月 12 日这段时间大 V 们的获赞数量下降又是怎么回事呢?这段时间大 V 们回答问题的数量事实上是处于上升趋势的。
可能是这段时间大 V 们写的回答质量不高?还是说知乎推出了推荐功能,分散了用户的注意力?当然也有可能是我收集的数据不全,或者统计错误了。
4
哪些大 V 最活跃?
2017 年 11 月到 2018 年 11 月的一年时间里,知乎大 V 们回答问题数量的排行榜:
2017 年 11 月到 2018 年 11 月的一年时间里,知乎大 V 们发布文章数量的排行榜:
看到上面几张图的时候,我还是挺震惊的。现在已经有这么多机构号入驻知乎了,并且发文和回答最活跃的竟然是各个机构号。
由此可见,其实大 V 们感受到被「限流」,可能不是真的被「限流」了,而是被其他大 V(比如机构号)冲淡了粉丝们的时间线。
1. 粉丝关注的人越多,能收到大 V 的动态也越多,平均点开每个大 V 的文章次数自然就少了。并且某些机构号一天可以发 10 多篇文章,敢问在座的各位大 V 谁能做得到。
2. 知乎推出的推荐版块,大大分散了用户的注意力。就连我自己,也都经常刷「推荐」版块,而很少去看关注的人的动态。
所以,也许这就是传说中的所谓的知乎红利期已经过去了的证据吧。蛋糕就那么大,谁都想来分一块呗。
目前看来,想要获赞和涨粉,只有让回答和文章上「推荐」,这才是最快的途径。那么问题又来了,你的文章上不上推荐谁说了算呢?知乎呗。
限流并不可怕,限制推荐才可怕。
比限制推荐更可怕的是,推荐出来的文章或者回答,很多都是「抖音」和「快手」风。
一个平台做大了就是这样,只有迎合了大部分用户的口味才能挣钱,才能变现。所以大 V 们吐槽归吐槽,事实还是很难改变了,又不能逼着自己录点小视频放在知乎上。
5
关于涨粉
在任何情势下,都有人可以快速涨粉。写文章大约有两种原因,一是写自己愿意写的,二是写别人愿意看的。
大多涨粉快的大 V 都选择了第二种。我们只要监控知乎热榜和知乎推荐一段时间,就不难发现大家的口味。可是呢,那些东西,有时真的没办法逼着自己去写。
这里给大家列举个几个大 V 们回答得最多的 Top10 问题,想涨粉先去把这 10 个问题回答了吧。
这里我单独把女性大 V 回答最多的 10 个问题列出来给大家看看。
6
一点干货
最后给大家推荐一下知乎大 V 关注得最多的知乎专栏,也许你们能在这里获得不少的启发。
作者 | 二胖并不胖
来源 | 大数据前沿 ( bigdataqianyan )
下一篇:没有了
相关文章:
相关推荐: