01 对比分析
比什么?
1.绝对值or比例值
2.环比or同比
环比 | 同比 |
---|---|
last period 与当前时间范围相邻的上一个时间范围对比 | same period last year/month/day 与当前时间范围上层时间范围的前一范围中同样位置数据对比 |
与「上一个」统计周期比较 , 周环比:2021年51周与50周相比 | 与历史「同时期]比较, 月同比:9月7号与8月7号。 |
对短期内具备连续性的数据进行分析,需要根据相邻时间范围的数字对当前范围的指标进行设定。 | 观察更为长期的数据集,观察的时间周期里有较多的干扰,希望某种程度上消除干扰。 |
3.和自己比or和行业比
和自己比 | 和行业比 |
---|---|
从时间维度 | 自身因素?行业趋势?是否比同行长得慢?是否比同行跌得快 |
从不同业务线 | |
从过往经验估计 |
02 多维度拆解
用不同的视角去拆分,观察同一个数据指标。
运作原理:指标/业务流程需要按照多维度拆分,来观察变动
适用场景:分析单一指标的构成、比例等/ 针对流程进行拆解分析/ 还原行为发生时的场景
案例说明 数据涨跌如何处理
如何处理数据的涨跌?并不是只有?才值得关注,不寻常的?同样值得关注。
涨:弄清原因,放大涨势
跌:弄清原因,采取行动,及时减缓趋势
一般处理流程:
- 发现异常
- 确定问题(对比分析,周同比,月同比,是否是周期性现象?以前是否出现过?问题是否真实存在?)
- 确定原因(多维度拆解,找到原因)根据实际分析,服务器?渠道商?存货?服务?价格?
- 针对性解决问题
- 执行
其中需要不断提出假设,并用数据去验证真实性。
一些常见假设:
活动影响:查对应活动页面及对应动作的数据波动。关注活动是否有地域属性。
版本:以版本号作为维度,区分查看。
渠道投放:查看渠道来源变化
策略调整:明确故障时间,按分钟或小时进行拆分
以某小型网站某段时间浏览量狂涨作为案例,进行分析:
- 按来源进行拆分:7.31~8.3这几天的浏览量激增
- 按访问城市进行划分:几乎都来自北京
- 按浏览器进行划分:几乎都是safari
- 查看浏览器版本号:版本号为空,可以确定是爬虫导致的高访问了量(经验累积)
03 漏斗观察
漏斗 = 一连串向后影响的用户行为
注意点:
- 漏斗一定是有时间窗口的
考虑极端情况:23:59分执行第一步,次日00:02分执行第二步。
或者,用户1月加入购物车,5月才购买。
漏斗的时间窗口是以天?24h?月?年?为单位
因此需要根据业务实际情况,选择对应的时间窗口
按天:对用户心智的影响只在短期内有效(如短期活动)
按周:业务本身负责,决策成本高,多日才能完成
按月:决策周期更长 - 漏斗一定是有严格顺序的
不可以用[ABCDE]的漏斗,看[ACE]的数据 - 漏斗的计数单位可以基于用户、也可以基于事件
仍然要基于具体业务进行确定。基于用户往往是关心整个业务流程的推动,基于事件关心某一步具体的转化率,无法获知事件流转的真实情况。 - 结果指标的数据不符合预期
自查:是否只有这一个漏斗能够达到最终目标?是否有其他路径?
运作原理
通过一连串向后影响的用户行为来观察目标
适用场景
适用:有明确的业务流程和业务目标
不太适用:没有明确的流程、跳转关系纷繁复杂的业务
案例
如何评估渠道质量 确定投放等级
常见的渠道划分方式
SEM: search engineer marketing 搜索引擎营销
渠道质量跟踪
- 选择关键事件 选取反映你产品目标人群会做的行为的数据
门槛不能太高(转化率低) 门槛不能太低(打开APP) - 查看产生关键事件的用户来源
04 分布情况
可以从事件在不同维度中的分布来观察事件的分布情况。
常见的群体划分
- 事件频率
- 一天内的时间分布
- 消费金额的区间
05 用户留存的分析方法
为什么看留存?日留存
了解一个渠道的质量
观察大盘的情况 周/月留存
一般的计算方式
将某一时间段的用户ID与另一时间段的用户ID做交叉去重
产品、运营、技术、市场每个环节都会对留存造成影响
因此,我们需要
- 精准留存
- 过滤进行过指定行为的用户,再计算
- 将用户分为不同的群体后,观察其之间留存的区别
其实就是发现影响用户留存的因素?是否有什么行为影响用户留存率。
案例
功能内容上线后,如何评估其短期效果/长期价值/未来潜力
某批漫画对付费会员转化的效果评估(漏斗分析、用户分群)
上线后的目标与价值清晰明确。
某漫画产品,有一VIP会员功能,看提前解锁付费漫画。最近,该产品上线了了一批新的付费漫画,想要验证这批漫画对会员付费功能的价值。
借助漏斗对比
借助用户分群对比
如果大多数付费会员都看过这部分VIP漫画,说明这些漫画对会员存在吸引力,增加了购买欲。
某一主播对产品价值的影响(精准留存对比)
某些功能不能带来直接的商业价值,但希望它能长期留住用户。需要观察精准留存。
对比大盘,观看过某主播的用户是否有更高的留存?是否回到这个主播?或者回到平台?
根据这两个问题,我们可以把主播分为四类。
上线以探索更长期的产品潜力
使用分布情况分析,对比是否优化了使用频次/场景的分布
某社交app上线了一个推荐好友的功能,如何评价其能力?
- 从对使用情况的促进作用来观察
本来每天只使用一次,好友推荐功能发布后,一天用2~3次。
某听书app以长篇听书为主要内容,使用场景多为长下班通勤时,现推出短小的情感内容,如何评价其能力?
- 从占据用户一日时间段的角度来观察
本来只在上下班通勤使用,深夜段使用用户数提升。
06 用户画像
左:profile,更多基于用户填写的信息产生
右:persona,来自用户访谈、用户研究等
用户画像通过对用户各类特征进行标识,给用户贴上各类标签,通过这些标签将用户分为不同的群体,以便对不同的群体分别进行产品/运营动作。
6.1 标签有哪些?
基础属性 | 社会关系 | 行为特征 | 业务相关 |
---|---|---|---|
年龄 | 婚姻 | 基本行为 | 高矮胖瘦 |
性别 | 有无小孩 | 注册时间 | 体脂率 |
生日 | 有无女孩 | 来源渠道 | 在练胸 |
教育 | 家有老人 | … | 日均8000步 |
收入 | 性取向 | 业务行为 | 收藏了100+健身计划 |
职业 | … | 买过特惠商品 | … |
… | … | 曾获优秀学员 |
6.2 标签从哪儿来?
- 直接填写 (用户警惕性增高,不愿意填写)
- 通过用户已有特征推得
做活动,简单的个性化运营,业务分析
举例:买过男士剃须泡沫
推出:性别男
举例:多次买过卫生巾 / 使用设备为美图手机
推出:性别女
举例:收货地址:北京市 / 常用IP在北京
推出:地址:北京
举例:买过进口品牌牙膏 / 使用的手机型号为新款
推出:消费能力:强
推断也有可能出错,但根据我们的业务需求,无需过于要求完全准确。 - 通过用户身边的人推断
距离相近:某些属性,学生附近一般都是学生
行为相似:通过协同过滤,找到行为相似的目标用户
6.3 案例
利用用户画像进行高质量拉新,精准化营销
高质量拉新
- 真正的用户:高留存;核心行为频次、完成率高
- 是谁?通过他们买卖书籍,倒退他们的年龄、受教育程度、地域、消费能力。(本科以上、18~30岁、一线城市)
- 从哪儿来?问卷调查,电话访问,发现很多来自朋友推荐。
- 按照这些特征,构建用户画像。高校、科研院所、只是密集型工作区域。消费倾向社科类书籍
- 按此特征,找到类似的用户
07 归因查找
对业务中明确的业务目标(购买、留资料、充值等)归因,便可…
- 将目标的达成拆分到各个模块,方便统计各模块的贡献
- 获悉当前指标达成的主要因素,获得如何提升业务指标的洞见
事件之间有很强的关联度,将贡献度归因到上一事件
将贡献度依次递减,或者平均。
只考虑第一步的流量。
末次归因
约7000人在送礼时发生充值行为,约4000人在私信主播后发生。
递减归因
首次归因
贷款app并不需要考虑后面的转化流程,因为他们认为只要下载app就有借款需求,只要有下载就会有后续的使用。
案例 精准运营
运营资源盘活
- 常规做法: 出台一套运营资源使用规则
一天最多只能推送3条;同一个类型的营销在一周(一月)内不得重复推送;
问题:整个公司的内部营销存在上限 - 推荐做法:精细化的用户分群运营
既能提升整个公司的可用资源,也能提升收到推送的用户自己的体验 - 理想:每个标签都去做不同的推送内容
运营力量有限, - 现实:在ROI上找到一个平衡点,先选择容易出成绩的
容易出成绩的标签:如 电商的性别标签
容易出成绩的运营位:如首页、每日推送
分成7.8个群体往往就能解决大部分的问题。
如何选择最初的七八个标签?
- 人口统计学意义上的标签,如性别、年龄或者地域
【电商】性别 影响商品偏好
【K12教育】地域 影响教育水平、教材的选择、考察的侧重点 - 业务相关的标签
【K12教育】年级 影响所学的内容、关注的信息
【健身】BMI 影响用户对功能和内容上的诉求
用自动化的方法推送与用户有关的内容
08 路径挖掘
适用场景:有明确的的起始场景,有明确的结果目标
运作原理:逐级展开某一事件的前一级(后一级)事件,观察其流向
09 行为序列的分析方法
路径挖掘的局限:反映的是一群人的行为,比较复杂。
案例 评估用户对产品的兴趣和依赖程度
该用户展现出了使用产品的倾向。
案例 辅助产品设计
一个人的思考很难跳出自己的经验。在产品设计中,我们必须思考用户的需求。
因此,我们需要更多的信息辅助产品设计决策。
- 谁? 通过用户画像,思考用户习惯,理解使用场景
- 在什么情况下?行为序列的属性
- 干什么&遇到什么问题?行为序列or屏幕录像
但数据不是唯一,不能死套数据。
10 案例 如何查出羊毛党
抓作弊的方法
找到某一个作弊的人;找出他的模式;发现行为相似的用户
案例:
- 某网站最近经常收到spam信息,目前得知某一个被用户举报的ID,如何解决这些信息
- 分析异常ID的行为,在9月2号注册后马上开始发信息,发了一天信息后不再登录。
- 分析异常ID的登录信息,中国电信/广东省/iphone端登录
- 通过地域分析发现,广东省的事件总次数从9月20日激增
- 基于广东的数据,通过设备分析发现,iphone5s的事件总次数从9月23日开始激增
- 再一次筛选电信用户,发现从9月23日开始激增
- 再分析网络类型,4G的数量激增
- 再分析操作系统版本号,未知版本号的数据激增
- 查看筛选出的用户,发现他们的行为与初始异常ID的行为相似,因此可以对这些用户进行封号处理。
找到1
- 异常高且无理由的流量
- 工作人员观察
- 人工举报
找到模式
明确目的
- 刷量(刷播放量等等)
- 薅羊毛
- spam
观察其特征
- 机刷
- 人肉刷
- 多:显著与普通用户相异的动作;如通过商家变现、发布特定内容等
- 少:留存低、非核心业务(如帮助界面)几乎不访问
找到N
- RD爬取并人工审核
一网打尽
- 封:封禁/屏蔽
- 提高关键成本:注册7日后方可发帖;减少存在bug的商品的库存;提高体现的审核力度/周期
- 不处理