小红书推荐算法的秘密
最近偶尔会有人来公司找我聊聊天,但话题嘛,都是围绕小红书转的,有意思的是基本每次到最后,都会聊到小红书的推荐算法是什么?
根据我的观察,来者不管对小红书是否真正的理解,但大家普遍都有一个共识“小红书的流量是有算法的”,不要笑,这样的共识很重要,因为有算法,就会有权重,这也是一切逆推的基础。
1 有哪些流量入口?
在开始聊算法之前,我也想和大家一起统一一个概念,很多人都说小红书的流量都来源于推荐,但实际上,小红书上的流量入口有很多,并非完全都来源于推荐。
这里我做了个整理,可以发现小红书的流量入口大致可以分为六个。
1、搜索结果页:打开小红书App,搜索词后进入搜索结果页
2、发现页:打开小红书App选择顶部发现页
3、关注页:打开小红书App选择顶部关注页
4、个人页:打开小红书App点击笔记博主头像进入个人页(含其他形式进入主页)
5、附近页:打开小红书App选择顶部附近页
6、站外:站外带来的流量(含PC与H5)
我们常说的推荐以及算法,其实就是指的“发现页”流量。
聊到这了,顺便说一句,其他的流量入口就不存在权重和算法吗?其实也存在,比如搜索结果页,谁排前面谁排后面,这都是有学问的,只要不是随机的,不是人工的,就一定有算法;但每个流量入口给用户的价值并不相同,每个流量入口的算法也自然各不相同,不能一概而论。
当然,你也可以去问小红书客服,小红书会不会限流?笔记有没有权重?小红书客服会告诉你,什么都没有。不过对于我们而言,只能内心一笑,一切尽在不言中。
2 小红书的推荐算法
明确一下,我们这里聊的推荐算法,只是针对小红书发现页的算法。
在小红书一篇笔记发布到推荐的流程是什么样的?
1、笔记发布
2、语义分析/分类/打标签
3、平台审核
4、分配流量池(权重:账号状态,账号在类目内表现情况,类目竞争情况)
5、增加流量池(权重:互动情况,用户行为,笔记发布时间)
6、推荐结束
稍微做个分析,我们会发现,一篇笔记的流量推荐主要由“2、4、5”组成,其中2是为了将笔记内容做识别,匹配给有需求的用户,4/5的意义就是给大众用户推荐好的内容。
所以我们做一下总结,小红书推荐流量的本质就是两件事,一个是如何精准匹配用户,一个是如何判断“好”的笔记。
我们先说如何精准匹配用户,这就涉及到了语义分析,也涉及到了给笔记分类目和打标签,目前为止,小红书的识别已经不止文字了,假设文字基本不写,也能通过图片或视频来识别内容是什么。
你或许会疑问,聊算法怎么扯到精准匹配了?因为精准匹配就是推荐算法的前提。
首先平台为了让用户感觉推荐满意,保险起见,会尽量推送你近期有浏览行为的相关笔记,我相信你应该有过在小红书搜索某个产品后,推荐页会立刻推荐相关产品的其他笔记的经历,就是这个原因。
这个问题代表什么呢?代表一篇笔记必定是有分类的,必定是有受众人群的,假设你不是受众人群,平台会推荐给你吗?完全不会。因此发布一篇笔记之后,本质上不是在与所有笔记竞争,而是与同样分类下的相似笔记在竞争,这个时候你问其他博主今天流量好不好,其实没什么意义,大家的类目都不同,竞争关系也不同。
这就是你在小红书,极少看到一篇笔记有上百万的点赞的原因,是小红书用户量不多吗?不是,是因为这些笔记没有机会被推送给“全部用户”。
精准匹配到这里就结束了,下一步就进入到了推荐算法环节,也就是平台如何判断一篇笔记“好”。
不用多想也知道,平台本身无法判断笔记好坏,于是就会借助用户的力量,让用户自行投票(点赞收藏评论)来决定笔记好不好。
讲到这,又会多出一个疑问,一篇新笔记刚发布,肯定是没有人投票的,只有小红书把笔记推荐出去,才会有人根据内容来投票,新笔记发布的时候推荐多少人合适呢?推荐的少了,从统计学的角度来说,不太具备科学性;推荐的多了,万一这篇笔记就是不好,那岂不是给用户推荐了垃圾内容了?
怎么办呢?于是平台出了一个新办法,根据权重综合决定这篇笔记该拿多少初始流量。
这些权重,比如:
1、账号状态
当前账号有没有违规?是不是限流?是不是垃圾营销号?有没有保持活跃?一切正常且表现良好的,自然给的多一点,不正常,那就按最小原则来分配;这就是有些批量运营的账号或者断更账号发布笔记流量少的原因。
这里不得不提一句,有些账号一注册就会被认为账号异常,比如用虚拟运营商的手机号注册,就会被识别为疑似异常账号,别问为什么,问就是其他灰产都是这么干的。
2、账号在类目内表现情况
近期账号在该类目下是不是连续发布笔记(主运营类目)?是不是经常出爆文(笔记写的好)?好,那就多给点。这就是有些博主出过爆文,再次发布一篇同类笔记,爆文概率非常高的原因,一部分是掌握了当前用户的喜好,一部分也是初始流量给的就多。
3、类目竞争情况
当然,其他两项都是决定多给和少给的问题,但决定具体给多少,实际上是类目竞争情况决定的;
比如夏天发一篇羽绒服的笔记,受众必然是近期浏览过羽绒服的用户,但夏天啊,哪有多少人看羽绒服?假设全国一天就1万人,每天还新增几十篇笔记,为了保证每个正常的笔记都有流量可推,所以就会减少初始流量的绝对值,比如只给100个曝光,剩下的流量还得留给好的笔记呢。但要是夏天发裙子,那就会有所不同,裙子在夏天本来流量就大,初始流量可分配的也就多了一点。
以前零克Club群里总会有人问,初始流量池是多少?是100还是200?看过以上这段话,你就应该知道了,没有绝对值,也不是直接用100还是200去定义的,而是根据不同的类目当前的流量情况,在结合账号状态以及历史笔记表现情况(权重)来综合得出的,而且完全由系统自动执行,我相信就连小红书的运营,也办法告诉你初始流量池是多少。
有了初始推荐流量后,不少用户就能看见这篇笔记了,有的点进来觉得不错,点了个赞,有的点进来觉得不行,直接退出了,这些用户的动作,都会成为小红书判断笔记质量的因素。
小红书的内容算法CES全称community engagement score;
模型是:CES=点赞数*1分+收藏数*1分+评论数*4分+转发数*4分+关注数*8分
我相信你们都看过上面网传的小红书推荐CES算法,但实际上,这已经是2017年以前的小红书算法,当时的小红书还无法获取用户太多的动作(没有埋点),仅能凭借基本的用户互动来判断笔记质量。
放到现在,如果单独只看用户的互动,这个CES的互动评分(互动以重要程度排序)还是合理的,但现在2022年了,不只看互动了,小红书也看笔记的完播率,跳出率等等。
何况如果小红书的算法就是简单的加法和乘法,那么小红书的程序员都可以下岗了,更别提判断因素仅仅有“互动”。
因此,一篇笔记有了初始流量池后,小红书会根据以下几方面来判断笔记的质量:
1、点击率
2、互动率(含转发等)
3、完播率/完读率
4、互动值
其中互动值(点赞收藏评论),完播率是我们能看见的,而点击率,互动率都是我们暂时无法看见的,每一个行为也都是用户的一种表态,因此用户做出动作的,一定会权重占比更高,比如点赞,收藏以及评论,其中评论最复杂,所以评论的权重一定比点赞收藏更高,同理点赞收藏肯定也比完播率这些不用做出动作的要更复杂,核心就是互动难度越高,权重占比越高,平台就是根据这些综合得出一篇笔记到底算不算优秀,值不值得去推荐。
有些零克Club会员会问,到底有多少点赞才能进入下个流量池?到底有多少点击率才能进入下个流量池?看完上文这段话,你就知道我也回答不了这个问题,小红书的人也回答不了这个问题,因为小红书的算法根本就不是按互动绝对值作为衡量优秀标准的,衡量标准是动态的,要按照当下类目其他笔记表现来算。
如果大家都很差,那么你稍微好点,就可以了,如果大家都很好,那么就很难了。
就像高考时大学的录取分数线也是动态的一样(某些),是由实际录取的最低成绩的学生决定的,我也称之为动态平衡机制。
假设,我们能过了初始流量这一关,那么就可以进入下一个流量池了,但这里进入下个流量池并不是非黑即白的关系,不是只有表现最好的10%才能进入,剩下90%都进不去,而是10%进入更好的流量池,40%进入小一点的流量池,余下的小部分才不会分配流量。(具体%是不清楚的,只是举例子)
与初始流量池的考核逻辑一致,如果下一个流量池表现很好,就能进入再下一个流量池,直到这个类目下没有匹配流量可以进行推送为止。
我猜看到这里,你会有个疑惑,如果我的笔记表现还行?类目流量也很大,是不是就能一直无限推下去?
实际上是不会的,因为我们一直都少提了一个因素,就是时间因素,新发布的笔记权重最高,老笔记的权重相应递减,这点很好理解,平台肯定不希望推荐一些旧东西。所以在逐渐进入新流量池时,时间因素也会发挥重要作用,比如发布了1-2天的笔记,表现很好,你会明显感受到笔记流量还是很多的,但是即便你的笔记表现很好,互动率很高,10多天的笔记也基本没什么流量了,这个就是时间的原因。平台不会把流量放在一篇旧笔记上!这也是作为博主必须持续不断的更新笔记的原因,老本是吃不起的。
目前来看,小红书的自然流量最长也就在30天左右,这还是极好表现的笔记或者是小众类目(内容不多)的笔记,一般的笔记也就在3-14天结束自然推荐。
至此,整个小红书的流量推荐就结束了。
3 知道算法又如何?
看完上面文章,了解小红书算法之后,我猜你会觉得,好像知道了和没知道,没啥区别?
其实这挺正常,因为看完文章后会发现无法利用小红书算法作弊。
很多人想了解算法,就是想通过逆向思维进行作弊,比如知道点赞高就能有流量,那么直接刷点数据呗?知道算法有什么Bug,就利用算法的Bug薅点流量呗?
但是根据现在的结果来看,会发现小红书算法非常复杂,很难通过简单的动作就进行干预,这对不少人来说,无疑感觉很失望,最终还得通过识别用户的兴趣,做好内容才行,还是不能投机取巧。
但这也合情合理,算法的意义就是尽可能的公平,让做的好的,有能力的博主脱颖而出,这也是算法存在的意义。
在我看来,了解算法背后的逻辑和意义,并非为了去作弊,而是通过算法知道自己的笔记被如何运行在了小红书上,如何被推荐,为什么流量好,为什么流量不好,通过算法的原理去反思问题在哪里,去优化问题,这才是学习算法的真正意义。
而且有些算法上的问题也是完全可以被实际应用调整的,比如笔记的类目和标签(可以用零克追踪zz.lingke.pro查询)被小红书官方打错了,举个例子,洋娃娃的衣服本应是玩具类目,结果被分到了时尚,理论上不会有什么好的效果,这个时候我们就应当调整笔记的内容,更多的出现玩具和洋娃娃这样的词,笔记就会被分到正常的类目下,流量也会顺其自然的好起来。
再比如我们发布了一篇笔记,互动不错,发现笔记每天都有流量,但是每天都不多,这时候就要反思是不是类目过于小众,当前类目的流量是不是总体就不够大导致的,最佳方法当然就是调整账号的方向。
相应的可根据算法进行反思调整的可能点还有很多,但这依赖于根据真实场景的分析,而非别人的提醒。
但以上都是基于免费的自然流量而言,假设自己的内容就是认定不错,就是每次无法突破小流量池怎么办?小红书也提供了动态平衡下的人工可干预机制,付费购买薯条,也就是付费购买流量,但诚实的说,这不便宜。
相关文章: