基于分析师工作台的客户资产流失挽回及其精准营销模型

来源:BanTech智库

作者:中国银行软件中心(合肥) 徐梓丞


一、模型背景介绍

1.背景介绍

近年来,随着移动互联网的迅速普及,特别是受新冠肺炎疫情的影响,客户行为习惯加速向线上迁移;同时,金融科技、人工智能、大数据应用技术的快速发展,为个人客户智能化服务提供了可能。对于银行业来说,AUM作为银行金融竞争力的核心指标之一,如何使其提升非常关键,而将资产已流失的客户进行挽回的成本远低于获取新客户,那么如何去定位能够被挽回的客户并对该类客户做相应的精准营销是非常重要的一个业务目标。但传统的基于业务规则的方式通常都会出现定位不准确的问题,因此需要使用人工智能技术建立更准确的客户资产流失挽回及其精准营销模型。

客户资产流失挽回及其精准营销模型的目标客户群体均为A地区的客户,一共分为两类:第一类客户是在资产流失点前的第三个月的月日均金融资产在3万元(以下简称“w”)以上,之后,连续三个月的月日均金融资产在1w以下;第二类客户是在资产流失点前的第三个月的月日均金融资产在3w以上,之后,连续三个月的月日均金融资产是资产流失点前的第三个月的50%。目标客户群体取两类的并集。旨在通过模型甄别哪些客户存在较高的资产挽回可能,并对这些客户给出相应的精准营销方案。

2.模型定义

本次模型中资产得到挽回的定义一共分为三种:

一是观测点的月日均金融资产在1w以下的客户在表现期(未来连续三个月)的月日均金融资产均在3w以上。

二是观测点的月日均金融资产在1w~3w的客户在表现期(未来连续三个月)的月日均金融资产均是观测点的3倍。

三是观测点的月日均金融资产在3w以上的客户在表现期(未来连续三个月)的月日均金融资产均是观测点的2倍。

举例说明:假如客户A在2021年6月的月日均金融资产为0.5w,若在7、8、9三个月的月日均金融资产都在3w以上,则判定该客户实现了资产的挽回。


二、模型的使用效果

该模型挖掘出潜在的资产流失挽回客户的名单最终通过A分行的业务人员进行电话营销并反馈出营销效果。在2022年8月份,A分行在模型输出的1796名预测资产能够挽回的流失客户进行精准营销,最终有278名客户有资产挽回的意向,有82名客户最终实现了资产挽回。整体转化率为6.06%,挽回的资产金额为699万元,人均资产提升额为8.52万元。从以上都可以看出,该模型在分行的投入使用极大地促进了分行资产的提升,从而有效地实现了模型赋能于业务。相比较于传统的利用业务规则筛选待营销的客户去进行营销,不仅营销的群体更加准确,而且模型给出了精准营销的方式,更好地方便业务人员营销时进行话术的组织。从而,最大程度地促进了营销效果的提升。


三、原始数据获取

根据目标客户群体的定义,我们以2021年6月资产流失了的客户作为训练数据,选取了他们的个人客户标签数据以及过去6个月的对私交易数据、金融资产数据和代发薪、代缴费、贷款数据。

在客户数据的分布(如图1所示)上,训练数据总计客户48294条,其中资产得到挽回的客户(标签为1)1349条,资产不能得到挽回客户(标签为0)46945条,挽回客户占比2.79%左右。

图1 客户数据分布


四、模型训练(数据探索+数据建模)

1.数据的预处理

在该需求中,数据预处理均是在数据探索中进行。

通过sql编程语言,将申请好的数据以客户号为维度,先针对金融资产数据,计算得到目标客群,并取出观察点的各个产品是否有开通的情况和月日均余额,计算出各个产品在过去三个月和六个月的平均月日均余额;然后针对对私交易数据,先通过交易对手名称,将每条交易数据打上是否跨行转出、是否为理财交易、是否对公转出、是否同名转出的四列标签,然后再分别统计这些指标在观察月的交易笔数和钱数,以及过去三个月和六个月的交易总笔数和钱数;再针对客户划拨明细数据和贷款信息数据计算出每个客户在观察月、过去三个月和六个月代发薪、代缴费、贷款数据;最后取出观察月的个人客户标签数据。并通过资产挽回的定义做出模型的标签列(即将训练数据进行是否被挽回的打标工作)。最终,将生成的所有表进行连接,得到可供训练的训练集,将其导入到数据建模中。

在一系列特征处理之后,最终特征列(除去客户号)共计199列。

2.模型训练

在数据建模中,将训练数据加载到训练工坊中,去除掉全为0的列后,待训练数据的特征列(除去客户号)共计149列。在这里,训练采用了lightGBM算法(梯度提升决策树的一种),经过验证,AUC值为79.24 %。采用5折交叉训练(把数据分为5份,每次训练使用4份作为训练集,剩余一份作为验证集)后,最终AUC值为77.56 %。

3.模型调参及优化

经过参数的调优,最终模型AUC值为81.20 %。模型调整后参数:

params = {

'num_leaves': 63,

'objective': 'binary',

'max_depth': 20,

'learning_rate': 0.005,

'min_sum_hessian_in_leaf': 10.0,

'boosting': 'gbdt',

'boost_from_average': 'false',

'bagging_freq': 10,

'bagging_fraction': 0.5,

'tree_learner': 'serial',

'verbosity': -1,

'nthread': -1,

'metric': 'auc',

'seed': 159,

"early_stopping_rounds":500

}

五轮五折后AUC值:78.15%

4.模型阈值的选取

在这里,我们取验证集的数据进行分析,验证集中总计客户4830条,其中资产得到挽回的客户(标签为1)135条,资产不能得到挽回客户(标签为0)4695条。通过做出混淆矩阵得出当模型的阈值取不同值时模型的评价指标。

(1)如果在预测时选择模型的最优点作为阈值(如图2所示)

图2 在预测时选择模型的最优点作为阈值


此时,将模型预测概率前24.9%(1201条)的数据标记为可被挽回客户。模型的召回率为74.8%[1],模型的精确率为8.4%[2]

(2)如果在预测时选择预测概率前10%的数据为可被挽回客户(如图3所示)

图3 在预测时选择预测概率前10%的数据为可被挽回客户


此时,预测为可被挽回客户的数据为484条。模型的召回率为47.4%,模型的精确率为13.2%。

(3)如果在预测时选择预测概率前1%的数据为可被挽回客户(如图4所示)

图4 在预测时选择预测概率前1%的数据为可被挽回客户


此时,预测为可被挽回客户的数据为49条。模型的精确率为40.8%,模型的召回率为14.8%。


五、模型验证

将2021年9月份数据作为观察月数据,做训练集同样的数据预处理。实现跨时域的验证,测试集总计客户57305条,其中资产得到挽回的客户(标签为1)1510条,资产不能得到挽回客户(标签为0)55795条,挽回客户占比为2.64%。与训练集基本一致。

经过测试,最终测试集的AUC为80.18%,该模型得到了跨时域的验证。


六、精准营销模型

为了实现精准营销,我们进一步对资产得到挽回的客户(标签为1)的客户进行细分,由于数据量少的原因,只对客户进行三分类,分别是存款产品营销、第三方存管产品营销和理财、基金产品营销这三种类型。模型的特征依旧不变,依旧使用lightGBM算法进行训练,最终,三分类模型分类准确度达到了90.37%。至此,就可以通过模型所输出的结果,对预测资产能够挽回的客户进行相应产品的精准营销。


七、后续优化思路

一是在数据的特征的选择上,可由科技人员和业务人员进行进一步的讨论,选取一些可能会影响该模型效果的特征融入到模型中,实现模型效果的提升。

二是在精准营销模型的使用和营销过程,可记录下营销效果,将营销效果的数据反馈回模型,从而实现精准营销模型的更新与迭代,从而提升模型的准确率。


注释:

[1] 召回率表示模型找到了74.8%的实际流失挽回的客户(=101/(101+34))

[2] 精确率表示所有预测为流失挽回的客户中实际有8.4%为流失挽回客户(=101/(101+1100))

-END-

这是科技创新最好的时代,这是属于我们每个人最好的时代,关注“BanTech智库”,专注银行科技发展,探索无界金融生态!

展开阅读全文

页面更新:2024-05-10

标签:精准   模型   资产   客户   阈值   日均   工作台   金融资产   效果   标签   数据

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top