警告!这个用户买东西很可能退货,最好让他多出点运费
从中午的外卖到下午的奶茶,我们每天都在买买买。
有赖于我国电商的发达,买对于我们来说就是几分钟的事。打开某个电商 app 或小程序花个几十上百块,等两三天就马上能拿到自己心仪的东西。就算是「史上最严」垃圾分类的实行,估计也阻挡不了上海人网购的步伐。
买东西多了,退货也多,之前某用户节假日买 18 件衣服最后要求全部退货就是一个较为极端的例子。但层出不穷的「薅羊毛」式退货在各种「7 天无理由退换」规则中是一个商家没办法逃避的问题。
如果我早就知道他要退货呢?或者我知道这个尺码和买家差的有点多,退货概率大的不是一点点呢?如果能提前预知某一用户退货概率高于平均值,那商家也能先下手为强,通过一些差别化对待,降低因买家退货造成的损失或者直接就不给买家退货的机会。
Google 和印度电子商务公司 Myntra Designs 研究人员在 Arxiv.org 上发表的一篇新论文中提出了一种新型深度神经网络——可以在顾客下单前预测其退货可能性。
他们使用了一个机器学习模型,对购物者的偏好、体型、产品视图等数据集进行训练。采用了基于矩阵因子分解(MF)的 BPR 模型对购物车中相似的产品进行检测,以获得用户的品味和产品的潜在隐藏特征信息。
在零售中,大部分的退货问题都是由于尺寸不合身导致的。所以在模型中,研究人员使用了基于 skip-gram 的模型创建了用户的分级向量。再使用这些向量的工程特性提出了一种混合双模型的方法。首先在购物车里预测买家的退货概率,然后再针对单个产品预测其退货概率。
▲ 图片来自:LinkedIn
用于预测退货概率的模型早前都接受了一组数据的训练,这些数据至少包含了产品、购物车和用户三个类别的样本,产品数据包括品牌、产品年龄等具体信息,购物车包括了购物车大小(商品多少)、订单日期和时间等信息,用户的具体信息则包括送货城市、订单数量、付款模式和购买频率等。
那么这个模型的表现如何呢?在评价之前,我们需要略微了解一下用于二分类模型的评价的 AUC 值,它是衡量学习器优劣的一种性能指标。
最初模型为仅使用基本用户和产品可观察的特性创建的基线梯度增强分类器,AUC 值为 71.6%。在研究人员引入广泛的特征工程改进了这一基线模型后,模型 AUC 值再度提高了8%。而通过使用业务流程重组学习的产品嵌入,AUC 值又增加了1.8%,达到了 81.4%。
为进一步提高精度,使用 skip-gram word2vec 模型学习的个性化的尺寸矢量也在此阶段加入,AUC 值再度提高了 2% 左右的精度。最终,该模型的 AUC值 优于以往的所有模型,精度分别提高到了 83.2% 和 74%。
▲ 各模型 ROC 曲线比较,深度神经网络达到曲线下面积最大。
整个模型的预测是实时发生的,这也意味着零售商随时可以因用户过高的退货概率而先发制人。这其中包括:
- 给用户「个性化」的运费。
- 通过给用户额外的优惠券使产品不可退货。
- 如发生退货退款,款项直接进入钱包,且款项只能在同一平台再次购物。
- 限制付款方式,比如货到付款。
- 预警逆向物流。
- 手动操作,显示产品缺货 & 阻止用户下单。
能够提前预测用户退货的概率会影响零售行业的许多领域,如客户体验、供应链管理、呼叫中心需求、库存和客户服务等。
有调查显示,有三分之一的电子商务要面对退换货的问题。
退货已经吞噬了电子零售商的大部分利润。而现在,行业正试图解决这个问题。