如何从0到1做电商用户画像建模?

用户画像,其实就是通过算法聚合成一类实现用户信息标签化。而本文就以电商用户为例,展示了如何从0到1做画像建模。

一、构建用户画像

① 用户画像信息:基本属性,购买能力,行为特征,兴趣爱好,心理特征,社交网络

② 行为建模:文本挖掘,自然语言处理,机器学习,预测算法,聚类算法

③ 数据收集:网络日志数据,用户行为数据,网站交易数据

作用:了解用户的行为习惯,个性化营销及精准广告

  • 静态数据来源:来源于用户填的个人信息,及算法模型预测的数据
  • 动态信息数据: 用户行为产生的数据:注册,浏览,点击,购买,签收,评价,退货等

—比较重要的行为:购买商品,浏览商品,放入购物车,关注商品等

根据行为可以得出标签: 潮妈族,纠结商品,最大消费,退货数量,败家指数,品牌偏好,用户活跃度等

确定标签与根据算法猜测的标签

  • 确定的标签:比如用户购买了或者收藏了某个商品等
  • 猜测的标签:比如用户的性别,是男性的概率0.8。

另外还有很多模型:孕妇模型,潜在汽车用户模型,用户价值模型

比如:用户活跃度(活跃,沉睡,流失,未购买) 用户分群:电脑达人,数码潮人,家庭用户,网购达人,奶爸奶妈,单身贵族,闪购用户,时尚男女等

二、用户画像建模

1. 客户消费订单表

根据用户消费的情况来提取的客户标签,用以了解用户的消费情况,消费习惯。

(1)客户消费订单表标签:

购买信息:

客户ID,第一次消费时间,最近一次消费时间,首单距今时间,尾单距今时间,近30/60/90天购买次数/购买金额(不含退拒),最大/最小消费金额,累计消费次数/金额(不含退拒) 累计使用代金券金额,客单价(含退拒),常用收货地区,常用支付方式,退货商品数量,退货商品金额,拒收商品金额/数量,最近一次退货时间,各地点下单总数/总额,上下午下单总数/总额。

购物车信息:

最近30天购物车商品件数/提交商品件数/购物车成功率/购物车放弃件数

(2)提取标签的作用

  • 确定用户什么时候来的,多久没来了:第一次消费时间,最近一次消费时间,首单距今时间,尾单距今时间。
  • 最近消费能力:近30天购买次数(不含退拒),近30购买金额(不含退拒),近30天购买次数(含退拒),近30天购买金额(含退拒)。
  • 总体的消费情况:最小/大消费金额(可做个性化商品推荐),累计消费次数(不含退拒,可以计算客单价),累计消费金额,累计使用代金券金额(代金券爱好。)
  • 消费属性:常用收货地区,常用支付方式。
  • 购物车习惯:最近30天购物车次数,最近30天购物车提交商品件数,最近30天购物车商品件数,最近30天购物车放弃件数,最近30天购物车成功率。
  • 退货和习惯特征:退货商品数量,拒收商品数量,退货商品金额,拒收商品金额,最近一次退货时间 用户购物时间及地点习惯:各下单地点总数,各时间段下单总数。

2. 客户购买类目表

—根据客户购买类目的情况提取的客户标签,用以了解类目的购买人群情况 。

客户购买表标签:

客户ID,一级/二级/三级分类ID/名称,近30天/90天/180天购买类目次数/金额,累计购买类目次数/金额,累计购买类目次数/金额,近30天/90天/180天购物车某类目次数/金额,累计购买类目次数/金额,累计购物车类目次数/金额,最后一次购买类目时间/距今天数

3. 客户购买商店表

根据客户购买商店的情况提取的客户标签,用以了解商店及品牌的购买人群(做品牌营销等) 客户。

购买商店表标签:

用户ID,商店ID/名称,品牌ID/名称,最近30天购物车次数/商品件数/提交商品件数/成功率/放弃件数,最后一次购物车时间,最近90天商品排除退拒商品件数/金额,最近90天货到付款订单数,最近90天退换件数/金额,最近90天拒收件数/金额.

4. 客户基本属性

根据客户所填的属性标签与推算出来的标签,用以了解用户的基本属性(可用以个性营销,生日营销,星座营销等)。

客户基本属性标签:

客户ID,客户登录名,性别,生日,年龄,星座,大区域,省份,城市,城市等级,邮箱,邮箱运营商,加密手机,手机运营商,注册时间,登录ip地址,登录来源,邀请人,会员积分,已使用积分,会员等级名称,婚姻状况,学历,月收入,职业,性别模型,是否孕妇,是否有小孩,孩子性别及年龄概率,是否有车,潜在汽车用户概率,使用手机品牌/档次,用户忠诚度,用户购物类型,身材,身高。

数据来源:

用户表,用户调查表,孕妇模型表,马甲模型表,用户价值模型表等 根据算法得出的标签。

其中模型:

性别模型:用以推算用户的购买用品的性别倾向(不一定是真实性别)

(1)性别模型

用户性别:1男,0女,-1未识别 | 1,商品性别得分,2,用户购买商品性别得分。

孩子性别:0仅有男孩,1仅有女孩,2,男女均匀,3,无法识别 |1,选择男童女童商品等

性别验证: 随机抽样调查 ,与用户填写性恶爆匹配。

(2)用户购物模型

两种归类:

用户购物类型:

  1. 购物冲动型
  2. 海淘犹豫型
  3. 理性比较型
  4. 目标明确型
  5. 未识别

构建:

  1. 计算用户在对三级品类购物前流量时间和浏览sku数量
  2. kmeans聚类

用户忠诚度模型:

用户忠诚度:

  1. 忠诚型用户
  2. 偶尔型用户
  3. 投资型用户
  4. 浏览型用户
  5. 未识别

构建:

  1. 只浏览不购买
  2. 购买天数大于一定天数
  3. 购买天数小于一定天数,大部分只有优惠彩购买 等

5. 客户营销信息表

将用户营销相关的常用标签放到一张表中,方便使用。

  • 客户营销信息表: 客户ID,营销手机号,第一个有效订单来源/地址/手机号,常用的手机号,常用的收货地址,不同收货地址的数量,客户分群,活跃状态,用户价值(重要,保持,流失等),纠结商品,纠结小时
  • 主要来源表: 用户表,订单表,活动表,购物车表。

其中模型:

(1)客户活跃状态模型

客户一般的活跃状态:

  1. 注册未购买(只注册未购买,多事第三方登录)
  2. 活跃(可以细分为高频,中频,低频)
  3. 沉睡(近90天无购买,近60天无购买)
  4. 流失 (近90天无购买,曾经购买)

(2)用户价值模型

体现用户对网站的价值对提供用户留存率非常有帮助

使用RFM实现用户价值模型参考指标:

  • 最近一次消费时间(Recency)
  • 消费频率(Frequency)
  • 消费金额(Monetary)

RFM 实现用户价值模型计算方法:

  • 使用指标:租金一次购买时间,近180天购买订单量,近180天购买金额,分N段进行RFM分数计算
  • 算出Recency_score,Frequency_score,Monetary_score,然后划分用户群

用户价值分类

6. 客户活动信息表

根据客户参与活动的情况提取的客户标签,用于了解用户对活动的参与情况,以进行活动的策划

客户活动信息表内容标签:

客户ID,用户促销明个度,满减促销敏感度,打折促销敏感度,换购促销敏感度,满赠促销敏感度,购买力分段,品牌偏好,品类偏好,颜色偏好,败家偏好,冲动偏好,累计积分,已用积分,可以积分,累计代金券数量/金额,已用代金券数量/金额,过期代金券数量/金额,可用代金券数量/金额

标签作用:

确定用户喜欢那种活动类型:用户促销敏感度,满减促销敏感度,满赠敏感度,打折促销敏感度,换购促销敏感度,团购促销敏感度等

促销敏感度模型:

根据用户购买的活动类型订单数与金额数已判断其属于哪类人群

用户有什么偏好:店铺偏好,品牌偏好,品类偏好,颜色偏好 用户指数:购买力分段,败家指数,冲动指数 用户购买力高中低模型:

—从购物车,客单价来判断 用户购买力高中低端模型:

  1. 从购物车来判断
  2. 从客单价来判断

指数模型:

败家指数:

  • 使用购买特征山炮数量来识别(刚出的苹果产品,奢侈品)
  • 结合用户的订单金额

冲动指数 :

  • 使用特征商品(同品类价格较高商品)平均购物车停留时间
  • 结合特征商品(同品类价格较高商品)的购买数量

7. 客户访问信息表

根据客户访问的情况提取的客户标签以了解访问习惯。

客户访问信息标签:

最近一次/第一次pc端访问日期/session/cookies/pv/使用浏览器/操作系统/,最近一次/ 第一次app端访问日期/操作系统,最近一次/第一次访问ip/访问城市/省份,近7天/15天/30天/60天/90天app端/pc端访问次数,近30天pc端/app端访问天数/访问并购买次数/访问pv/访问评价pv/ip数/,app及pc端各时间段访问的次数。

本文由 @Ethan 原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自Unsplash,基于CCO协议。

我来评几句
登录后评论

已发表评论数()

相关站点

热门文章