有一个「活性」数据,比「活跃」更重要
工具改变一个时代,或者说,时代的变革都离不开工具的变革,这或许是工具类的产品给我们带来的最大的吸引力。
拍照工具的变革,引起了自拍的时代,而且这个时代将会一直持续下去,直到被下一个工具再次改变。
时代便是如此被工具所影响,作为产品经理而言,我们也将会被工具所影响,包括墨刀、钉钉、石墨等等,越来越多新的工具变革在悄悄的改变着这个行业。
当然,这篇文章的主角:MTA(腾讯移动分析),也会持续发生新的变革,发挥他作为工具的使命价值,为整个移动互联网行业带来新的数据驱动方式。
数据驱动产品/运营,永远不会是一个即定的目标,而是一个可持续的过程,在这个过程中,我们手中用来做数据监控,分析的工具,将会直接影响我们日常的工作,影响我们对产品走向的判断,影响我们的决策。
最终,数据工具将会影响我们的产品是成功,或是失败。
事实上,我对于接下来要展开讲述的主题抱有十分的期待,如果能够进入MTA的迭代排期,我将十分庆幸,能够是这样一款产品的受众用户。
我所期待的,便是 “活跃天数”的一小步变革。
一、活跃天数概述
活跃天数是MTA比较早的一个功能了,具体上线时间未知,记忆中2017年,已经存在这个模块了。
简单来讲,活跃天数是在统计周期内记录用户的登录天数为数据对象,我们认为,周期范围内,活跃天数越多,用户的粘性越强,活跃天数越低,用户的粘性越弱。
在MTA提供的Demo数据里,我们发现在2018-5-25至2018-6-1日 这7天的周期里,5-29日这一天,有两天登录行为的用户占比11%,有5天登录行为的用户占比5%
(由于是Demo数据,又或者是因为该模块的设计问题,导致数据难以解读,以上数据仅作为文章观点阐述,不代表正式数据解读)
我们可以通过Demo数据来做一次简单的解读:
该产品的用户粘性并不是十分强,高频用户仅占活跃用户的5%,而一周内,仅存在两天登录行为的用户却占比11%。
换个说法,会更容易阐述我的观点:低频用户是无限接近流失用户的,案例对象在5月29日的活跃用户里,存在11%的用户即将流失。
正常情况下,喜欢的将会更加喜欢,不喜欢的将会更加不喜欢,常态数据从来不是瞬间的变化,他是一个持续的趋势,是A点到B点的一个过程。
(活动,服务器崩溃,业务异常等特殊事件会导致数据瞬间的变化,但这种变化并不是常态的,而是由事件触发的。)
这个过程恰恰就是数据所反馈给我们的核心价值之一。
常态下,人们不可能突然从喜欢变成不喜欢,一个连续使用7天的用户 不可能突然流失;必然会经过 活跃7天,活跃5天,活跃2天 这些阶段,活跃天数变化的过程,恰恰是用户粘性变化的最好体现。
借助活跃天数,我们可以判断用户的粘性,产品的健康度,这更加有利于我们去打造一款深受用户喜爱的产品。
我曾打造过这样一款产品,在30天的观察周期里,超过50%的用户,活跃天数在25天以上,超过70%的用户,活跃天数在20天以上。
这个数据表明,我的用户对这款产品十分满意;他们愿意让这款产品成为日常生活中的一部分,就如同微信一样,融入到我们的生活当中;且在不发生突发事件的情况下,会有较长的安全周期,用户不会太快的流失。
如果超过50%的活跃天数在5天以下,我可能就会很焦虑了,因为我即将面临一半用户以上的流失。
二、“活性”概念阐述及应用场景
我将通过活跃天数来判断用户粘性的数据指标称之为“用户活性”,以活跃天数为基础,辅助以加权分,得到用户活性分,再对活性分进行等级划分,得到用户活性等级。
活性是一个可量化的词,我们可以说某款产品的用户活性高,这将会是一款非常不错的产品,我们也可以说某款产品的用户活性低,那这款产品就要注意了,他的用户随时都有可能流失。
对用户活性进行数据量化,其价值远超活跃数据,流失数据,留存数据,后者反馈的是一个即定的结果,而活性反馈的则是一个变化中的过程。
我相信,作为产品经理的我们,必然经历过或者正在经历一些数据迷宫, 他的表现形式是这样的:
- 第一天,新增10000用户, 日活20000用户
- 第二天,新增10000用户, 日活20000用户
- 第三天,新增10000用户, 日活20000用户
- 第四天,新增10000用户, 日活20000用户
四天总共新增了40000用户,但日活却未曾发生过变化,我们当然可以对数据进行解读(任何数据都是可被解读的,尽管有时候我们难以接受)。
解读一:来了多少用户,流失多少用户,产品留存有问题(新用流失:需要关联留存率深入分析);
解读二:新用户的增量,和老用户的流失持平。(老用户流失:若用户生命周期有限,非可持续化的产品,必然出现的场景,需要关联用户生命周期深入分析)
可是,真实的情况却比以上两种解读要复杂的多,第一天活跃的20000用户,和第二天的相比,并不是同一批用户。我们并不能因为日活未发生变化,就判断用户流失;我们也不清楚第一天活跃的20000用户里有多少是第二天流失了的,有多少是持续留下来的。
未能解开的谜题还有很多,我们需要一些新的数据维度,来帮我们解开这个谜题,活性不是唯一解开谜题的数据,但却是可以解开一部分谜题的数据维度。
2.1 用户活性等级是对活跃的精细化数据分析
我们不妨补充一些假设性质的数据,来看看会发现什么奇妙的变化,以每一天活跃用户数为样本,将数据进行精细化处理。
- 第一天,50%高活性等级,30%中活性等级,20%低活性等级
- 第二天,40%高活性等级,40%中活性等级,20%低活性等级
- 第三天,30%高活性等级,40%中活性等级,30%低活性等级
- 第四天,30%高活性等级,30%中活性等级,40%低活性等级
日活不变的情况下,我们可以发现用户的活性等级越来越低了,这表示产品对用户的粘性逐渐降低了,我们会震惊于到了第四天有接近40%的用户即将流失,因为用户活性等级正在持续的降低,当降低为0时,也就流失了。
2.2 活性等级变化趋势代表了用户粘性的变化趋势
固定周期内,活性等级的占比变化趋势,也能够为我们预测活跃数据走向提供了正面的参考价值,这源于我在前文所提到的观点“喜欢的会更喜欢,不喜欢的会更不喜欢” 。
人们对某件事物的情感变化是一个线性的过程,而非点性的变化,这一点将会给我们做产品的方法带来本质的改变,或许,我们可以尝试回答下列几个问题:
- 产品/运营在什么时候去做提升活跃的功能?
- 产品/运营在什么时候去做拉新的功能?
- 产品/运营在什么时候去做提升留存率的功能?
目前,我能想象到的答案有两个:
- A:活跃降低的时候提活,新增降低的时候拉新,流失大的时候做留存;
- B:任何时候都需要持续的做提活,拉新,提升留存。
没有意外的话,你的答案会属于两者之一。
在现有工具里,我们仅仅能给出这两个答案,这和我们的经验,能力,技能无关,仅仅是因为我们缺少一款工具,是因为我们所掌握的数据稍显欠缺的原因导致。
引入活性数据,会给我们第三个答案,基于他的预测特性,不妨一同思考一番。
- 在活性降低,而活跃数据尚未改变时,提升活跃度(如同文中的案例)
- 在活性较高时,去做新用户增长。(如70%的日活用户都是高活性的用户)
- 在主要活性等级不高时,去做留存。(如70%的日活用户只是中活性的用户)
2.3 活性等级的占比率是基于动态数据分析的结果
活性等级的占比率依赖的是变化的日活,每一天的数据样本都是不同的,这是另一个维度的数据分析方式。
传统的占比率,都是基于固定的或者说是持续增长的数据样本,比如日活率。
我们知道日活率是必然降低的,提升日活率的唯一方法是“老用户回归”,不管我们如何调动新用户的活跃度,能够达到的效果仅仅只能是放慢日活率的降低速度,无法对日活率起到提高的作用。
原因在于:
日活率的计算公式=当日登录用户/总用户数
流失的用户将会对日活率产生永久的影响。而新用户的活跃度极限情况,只能保障日活率不再降低,这几乎是不可能的。这要求我们的新用户不再出现流失,新用户的活跃度仅能让我们减缓活跃率的降低速度,而不能提高活跃率。
只有老用户的回归,在不增加总用户数的情况下,增加当日登录用户才能达到提升活跃率的目的。
活性等级的占比率,则比活跃率更能准确的表达用户的活跃状态,由于每天的分母样本不同(日活用户),导致每天的数据占比不同。不会受到累计用户的影响,能够更准确的反应当前阶段产品真正的健康状态。
我们再来看一组案例,仍然是以日活20000来做数据推演:
- 第一天 70%高活性等级 活跃率10%
- 第二天 50%高活性等级 活跃率7%
- 第三天 70%高活性等级 活跃率6.5%
我们可以准确的解读出,第二天日活用户活跃度降低,第三天用户活跃度显著提升,如果用活跃率来判断,我们能得出的结论仅仅只是第三天阻止了活跃率的降低趋势。
实际上随着我们累计用户的数量增长,活跃率作为参考指标的辨识度将会越来越低,也许10%高活性等级的占比,在活跃率上体现出来的数值不到0.0001%。
三、一小步,活跃天数变活性
活性的取材样本来自于 活跃天数,以目前MTA所提供的活跃天数模块,是不足以支撑对用户活性的观察的,甚至大部分用户不知道如何使用活跃天数,也不知道活跃天数有何使用场景,存在何种价值。
很遗憾,我也属于那大部分用户中的一员……
仅仅需要MTA继续向前一小步,就能让活跃天数变成用户活性,而这一小步,却能改变整个移动互联网数据分析的方式,能够影响所有APP开发者判断、分析、预测的方式,能让产品经理,在更加合适的时间,做合适的事情。
用户活性的第一特征是指观察固定周期内的活性,而非持续累加的数据,活性所反应的信息,也是指观察周期内真实的状况,不受周期外的数据影响,其中就包括 已经确定流失的用户。
当我们筛选统计周期为7日时,便是表示观察用户在7日内的活跃天数;在这个期间里,最大值不会超过7,最小值也不会超过1。
而在视觉的表达里,用户活性的数据分析则包含单日占比,相对上一日的增长幅度,以及7日的趋势走向三个主体分析维度。
粗略画了个构思原型,仅供参考:
后续,我们在观察产品数据时,活性等级相关的数据将会仅次于新增和活跃数据的观察力度,某种意义上而言,活性数据或许比活跃数据的力度更重。
因为活性数据,能够更准确的反应用户的粘性,且能对活跃数据的走势进行相对准确的预测和监控。
我会在文末的附文里,带上我对用户活性等级的设计方案,在我所孵化的早期项目里,多是以监控活性来做迭代规划,由于工具的缺失,我的做法只能是导出用户的登录日志,再用excel进行计算分析。
活性数据的读取,计算和呈现对于许多团队而言,成本都是非常昂贵的,而且可行度是比较低的,除非企业规模达到一定量级,能够组建自己的数据中心团队,用来探索第三方所不能提供的数据,对于中小型团队而言,几乎无法触及,无法实现。
如果你擅长excel的使用,或许也可以尝试像我一样,导出用户的登录日志,并通过excel来计算自己想要的数据,可excel的计算承载能力是极其有限的,一旦度过项目初创期,引来数据大量增长时,就没有办法使用excel来进行计算了。
这是我们需要依赖工具的原因,很少有团队能够独立负担活性数据的挖掘成本。
此时,作为受众用户而言,我们其实特别期待诸如MTA(腾讯移动分析)类似的第三方数据统计分析系统,能够为我们带来这样一个能力,能够为APP的开发团队,产品团队追加赋能。
我仍然认为,数据驱动产品,数据驱动运营远远未达到终点,我们目前所使用的主流数据维度十分薄弱,还需要引入更多的维度,来帮助我们达到数据驱动产品的目的。
由衷的希望能尽早的看到MTA的活跃天数能够迈出一小步,让我们能够近乎0成本的使用“活性数据”来观察,监控产品的健康度,也能更加细致的了解产品用户的粘性。
根据我的实践,活性数据的引入会带来以下变化是可以确定的:
- 预测活跃度的走向趋势;
- 活跃降低之前,提升活跃,而非降低之后再来提升;
- 活跃较高时,拉动新增,避免“来多少,走多少”;
- 更准确的判断用户粘性;
- 更准确的判断产品健康度。
你希望在你的团队引入 活性数据 这样一个新的数据分析维度吗?
你觉得,这会给我们的产品工作带来什么样的变化呢?
以下内容为 “附文:活性数据” 的设计思路:
附文:活性数据设计思路
活性数据包含五个数据项:统计周期,活跃天数,活性分,活性等级,活性等级占比。
- 统计周期:是指我们的观察周期。
- 活跃天数:是指观察周期内,用户使用的天数。
- 活性分:活性分是观察周期内不同日期对应的加权项。
- 活性等级:是根据用户活性分计算的等级。
- 活性等级占比:是指定活跃等级用户于当日登录用户的比值。
活性分是一个比较特殊的概念,我们通过一个案例来认识活性分。
若观察周期为6月1日至6月7日,总计7天的周期,这里有3位用户A,B,C,他们的活跃天数都为一天,即在观察周期内,都有1天的登录行为,但登录的日期不同,你认为谁的活性等级高一点呢?
- A用户 在6月1日 登录
- B用户 在6月3日 登录
- C用户 在6月7日 登录
事实上,即使是在一个观察周期内,不同的日期也会导致活性等级偏差,反向解读会更清晰一点。
- A用户已有6天未登录
- B用户已有4天未登录
- C用户已有1天未登录
如此,我们是否能判断出A,B,C三位用户的活性等级C>B>A呢?
针对具备相同活跃天数,但日期不同的情况下,我们需要引入活性分作为加权项目,距离开始时间越近,活性分越低,距离结束时间越近,活性分越高。
我们以0.1至0.7来设计活性分,A用户的活性分为0.1分,B用户的活性分为0.3分,C用户的活性分为0.7分。
若活跃天数>=2天,只需要将多日的活性分计算加法即可。
如D用户,在观察周期内,活跃天数为7天(每日都使用),活性分便是0.1+0.2+0.3+0.4+0.5+0.6+0.7=2.8分。
当我们计算出每个用户的活性分时,为了让我们更好的去对整体情况进行把控,需要对分值进行等级划分,我们知道最低分是0.1分,即第一天有登录行为,也知道最高分是所有日期的分数总和,就可以对总分数进行等级的划分,以此得到活性等级:
如我们设置三个活性等级分别为高(2分以上),中(1-2分),低(1分以下)
仅以高活性等级为例,只有符合以下条件之一的用户,才会被我们记录为高活性等级的用户。
(以A,B,C,D,E,F,G对应6月1日至6月7日的日期)
- *ABCDEF(2.1分)(6天)
- *ABCDEFG (2.1分) (7天)
- *BCDEFG(2.7分)(6天)
- *CDEFG(2.5分)(5)
- *DEFG(2.2分)(4)
(……组合有点多,不再赘述)
我们发现按照2分的标准来判定用户的高活性等级,需要最少最近4天的连续登录行为,若最后一天未登录,则需要7天内有6天的登录行为,才能判定为高活性等级的用户。
当然,案例中的分值划分,包括活性分的定义都是随意构造,我们可以让这些活性分变得更加贴近真实场景,只需要我们设计不同日期的活性分值,以及不同等级所覆盖的活性分范围即可。
这包括,我们可以使用非连续的数值作为活性分,比如 第一天0.1分 第二天0.2分 第三天0.5分,第四天0.7分,第五天0.9分,我们还可以使用相同的数值作为不同日期的活性分比如第一天和第二天都是0.1分。
这取决于我们如何定义观察周期里,不同日期多代表的价值,但务必遵守活性分定义的核心原则:距离开始日期越近,活性分越低,距离结束日期越近,活性分越高。
除非你有一些特殊的构思。
我们将不同活性等级的用户数与观察日期的总活跃用户数进行对比,就能得到活性等级占比,这个数据相比活跃率具备更高的参考价值。
也就是我们在正文当中多次提及的70%高活性等级用户。
尝试解读一下文中的数据案例:
6月1日 70%高活性等级 日活20000
6月2日 50%高活性等级 日活20000
6月3日 70%高活性等级 日活20000
作者:枯叶
来源:人人都是产品经理
相关文章:
相关推荐: