淘宝人群报告总结分析 第1篇
1)删除重复值
查询结果显示数据集并无重复数据。
2)缺失值处理
查询结果显示数据集并缺失值。
3)异常值处理
异常值定义为超出分析时间的数据。因为给定的数据中,时间相关的字段是时间戳类型,而时间戳是指格林威治时间1970年01月01日00时00分00秒(北京时间1970年01月01日08时00分00秒)起至现在的总秒数,无法直接与日期进行比较,因此,需要对其进行格式化转换,才能继续分析。用函数 FROM_UNIXTIME(时间戳,时间格式) 将时间戳这一列(timestamp)转为不同格式的时间并存放到不同到新列中。
添加后的表格如下图:
删除超出时间范围的数据(异常值):
删除异常值44行。
淘宝人群报告总结分析 第2篇
RFM模型通过一个客户的近期购买行为(R)、购买的总体频率(F)以及花了多少钱(M)3项指标来描述该客户的价值状况,如图11所示。
由于数据集中没有订单金额信息,我们就只从R、F方面分析。
1)查看对应用户的消费间隔R值
#1.先找出每个用户最后一次购买时的日期,与最后一天的时间间隔
CREATE VIEW pay_B AS
SELECT uid,DATEDIFF('2017-12-03',MAX(ti_st)) AS B FROM sam_ub
WHEREbeh='buy'
GROUP BY uid;
#2.再根据时间间隔等级R值降序排序
SELECT uid,(CASE WHEN B BETWEEN 0 AND 2 THEN 3
WHEN B BETWEEN 3 AND 5 THEN 2
WHEN B BETWEEN 6 AND 8 THEN 1
ELSE 0 END) AS R
FROM pay_B
ORDER BY R DESC;
2)计算消费频次F
付费用户中消费次数从低到高为1-93次,将其分为6档1-10,11-20,21-30,31-40,41-50,50以上,对应F评分分别为1-6分,根据其活跃度将用户分为忠诚、活跃等类型。
#1.先计算出用户的消费次数
CREATE VIEWpay_times AS SELECT uid,COUNT(good_id) AS times FROM sam_ub WHEREbeh= _buy_
GROUP BY uidORDER BY COUNT(gid) DESC;
#2.再分级排序
SELECT uid,(CASE WHEN times BETWEEN 1 AND 10 THEN 1
WHEN times BETWEEN 11 AND 20 THEN 2
WHEN times BETWEEN 21 AND 30 THEN 3
WHEN times BETWEEN 31 AND 40 THEN 4
WHEN times BETWEEN 41 AND 50 THEN 5
WHEN times >= 51 THEN 6 ELSE 0 END) AS F
FROM pay_times
ORDER BY F DESC;
3)查看每个用户的R、F和R+F
SELECT id,R,F,R+F RF
FROM (SELECT uid, (CASE WHEN B BETWEEN 0 AND 2 THEN 3
WHEN B BETWEEN 3 AND 5 THEN 2
WHEN B BETWEEN 6 AND 8 THEN 1
ELSE 0 END) AS R
FROM pay_b
ORDER BY R DESC) r
JOIN (SELECT uid ,(CASE WHEN times BETWEEN 1 AND 10 THEN 0
WHEN times BETWEEN 11 AND 20 THEN 1
WHEN times BETWEEN 21 AND 30 THEN 2
WHEN times BETWEEN 31 AND 40 THEN 3
WHEN times BETWEEN 41 AND 50 THEN 4
WHEN times >= 51 THEN 5 ELSE NULL END) AS F
FROM pay_times
ORDER BY F DESC;
综合评分为8的用户是极度忠诚用户,需要维持好与用户的关系,积极推送用户心仪的商品;大于6的用户属于忠诚客户,可以积极推送营销信息;综合评分在为3-5范围内的用户,属于活跃用户,可以积极推送所关注店铺的上新活动和优惠信息;对于评分小于3的用户,属于一般用户,可以把他们当做发展用户,通过打折、优惠券、积分兑换等活动唤起用户注意力,提高产品黏性;而对于那些没有过购买行为的用户,属于新用户,可以通过新人特别优惠引起他们的购买欲望,让用户喜欢使用淘宝网购。
4)极度忠诚的用户行为分析
根据3)的查询结果,我们可以看出:有一位用户的R、F和R+F均为第一,说明他是淘宝的极度忠诚用户。
查看用户ID为9610的每天的行为:
SELECT ti_st,SUM(CASE
beha_type WHEN 'pv' THEN 1 ELSE 0 END) '浏览量',
SUM(CASE beh WHEN 'fav' THEN 1 ELSE 0END) '收藏量',
SUM(CASE beh WHEN 'cart' THEN 1 ELSE 0END) '加购量',
SUM(CASE behe WHEN 'buy' THEN 1 ELSE 0END) '消费量'
FROM sam_ub
WHERE uid='9610'
GROUP BY ti_st;
结果表明:该用户的浏览量和购买量很高,而收藏和加购量极低,代表这个极度忠诚的用户往往在浏览完之后直接购买,侧面支持了在统计浏览次数、收藏次数、和加入购物车次数在前20名的商品时的推断——倾向于浏览后直接购买的用户还是存在很多的。对于这类用户,往往就需要精准预测用户想要的商品以及对应的心理价位。
淘宝人群报告总结分析 第3篇
分析背景
1)政策:国家越来越重视电子商务的发展,相关监管工作也逐步展开和实施。这些新的变化有利于政府未来对电子商务的规范化引导和推进,更有利于电子商务市场的长远发展。
2)经济:2020年,国内经济总量突破了101万亿元,人均国内生产总值(GDP)超过万元,电商行业占国民经济比重越来越大。
3)社会:相关的物流以及支付等相关社会配套支持服务不断完善,使得网络购物越来越普及,网络购物的人数在不断增多。
4)技术:网络技术发展迅猛,特别是分类搜索引擎的普及,交互式社区平台技术的完善,都从技术上保障了网络购物市场向深层次不段发展。
分析目的
通过对淘宝用户行为数据的分析,找出转化率低的环节并分析原因,帮助商家提高产品销量,增加营业额,定位目标客户,精细化运营。
淘宝人群报告总结分析 第4篇
(1)分析这段时期内每天的用户行为(日访问总量,日收藏总量,日加购量,日购买量)
SELECT ti_st,
SUM(CASE beh WHEN 'pv' THEN 1 ELSE 0 END) '浏览量',
SUM(CASE beh WHEN 'fav' THEN 1 ELSE 0 END) '收藏量',
SUM(CASE beh WHEN 'cart' THEN 1 ELSE 0 END) '加购量',
SUM(CASE beh WHEN 'buy' THEN 1 ELSE 0 END) '付费量'
FROM sam_ub
GROUP BY ti_st
ORDER BY ti_st;
将查询结果用图5表示之后,发现周六和周日的浏览量、收藏量、加购量和购买量均高于工作日,说明用户偏好在非工作日网购,可以认为该人群的属性更偏向于职场人。因此,对于这些用户的营销活动可以选在周六和周日进行。
而且用户的加购量比收藏量要高很多,这说明用户更常使用购物车来选择自己想要购买的商品,因此我们可以刺激加购向购买的转化率,比如现在的跨店满减活动就是需要加购来获得优惠的。
(2)分析某一天内用户每小时的行为
以2017年11月28日(周二)为例:
SELECT hours,
SUM(CASE beh WHEN 'pv' THEN 1 ELSE 0 END) '浏览量',
SUM(CASE beh WHEN 'fav' THEN 1 ELSE 0 END) '收藏量',
SUM(CASE beh WHEN 'cart' THEN 1 ELSE 0 END) '加购量',
SUM(CASE beh WHEN 'buy' THEN 1 ELSE 0 END) '付费量'
FROM sam_ub
WHERE ti_st='2017-11-28'#以2017年11月28日(周二)为例
GROUP BY hours
ORDER BY hours;
为了验证工作日与非工作日的用户活跃特征是否一样,我们以2017年12月2日(周六)为例:
SELECT hours,
SUM(CASE beh WHEN 'pv' THEN 1 ELSE 0 END) '浏览量',
SUM(CASE beh WHEN 'fav' THEN 1 ELSE 0 END) '收藏量',
SUM(CASE beh WHEN 'cart' THEN 1 ELSE 0 END) '加购量',
SUM(CASE beh WHEN 'buy' THEN 1 ELSE 0 END) '付费量'
FROM sam_ub
WHERE ti_st='2017-12-02' #以2017年12月2日(周六)为例
GROUP BY hours
ORDER BY hours;
由图6和图7的趋势可以看出,工作日和非工作日中这四个指标的走势很相近,都是在晚上9点达到一个高峰,说明在9点,用户的活跃度相对更高。因此,在晚上九点左右,适合做营销活动(比如直播、前*名立减),拉新和刺激更多人消费。
注:本文部分文字与图片资源来自于网络,转载此文是出于传递更多信息之目的,若有来源标注错误或侵犯了您的合法权益,请立即后台留言通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意
发表评论