2340
我国商业银行客户潜在价值模型构建与应用
吕巍 陈洁 吕彦儒
(上海交通大学安泰管理学院,上海 200052)
摘要 国外研究客户终身价值的模型很多,但是,具体构建客户潜在价值的模型不是很多。客户潜在价值,
即客户本身具有的,暂时还没有在现有业务中充分展现出来的实际价值。本文应用数据挖掘技术建立了我
国商业银行客户潜在价值模型。模型研究发现商业银行可利用本行一定时期(例如以一个月作为一期)的
交易行为数据来预测哪些客户具有较高潜在价值,发现其中蕴含的模式,然后利用这一模式对全体客户评
分,从而能大大提高发现高价值客户的可能性,提高银行营销工作的效率。本文以某商业银行客户流水数
据对该模型进行了验证,结果表明模型具有较高的应用价值。
关键词 客户潜在价值模型 商业银行 数据挖掘
0 引言
近十几年来“关系型银行”在国外商业银行的营销模式中已逐渐占居上风。美国花旗银
行在其稳健和安全经营的基础上,精心制定其客户发展战略,成效显著:首先依据 CLV,对
客户群进行细分,接着在零售业务方面,花旗银行根据客户收入,消费习惯的不同,采取客
户服务差别战略,提供各种不同的服务组合。与国外商业银行相比,我国的商业银行重视现
有客户,忽视潜在客户及客户成长性。对目前与本行经常发生业务往来的客户能够保持一定
的联系,除此以外对其他潜在的客户资源较少给予重视,有部分客户经理对经营区域内未在
本行开户的客户情况知之甚少。这种情况造成客户储备的匮乏,影响了客户结构的调整和可
持续发展。
国外研究客户终身价值的模型很多,如反映销售和成本波动的 CLV 估算模型(Blattberg
和 Deighton,1996;Berger 和 Nasr,1998;Jain和 Singh,2002)、三维 CLV估算模型(Hyunseok
Hwang,Taesoo Jung,EuihoSuh POSMIS Lab,South Korea)、基于生命周期的 CLV 估算
模型1等。客户终身价值计算中也使用其他的一些
方法
快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载
,如使用在直接营销中应用较多的 RFM
(Recency, Frequency and Monetary)技术,并将 RFM 和 AHP 结合起来计算客户终身价值
(Ya-Yueh Shih、Chung-Yuan Liu,2003);从两个不同角度的的结合——通过两个模型“保
留模型”及“迁移模型”(retention & migration model)计算出客户的终身价值(Mihai
Calciu、 Francis Salerno,2002);而 Saharon Rosset、Einat Neumann、Uri Eick、Nurit
Vatnik、Yizhak Idan,2002 提出了如何计算终身价值中“终身”时间段的方法以供参考。
但是,具体构建客户潜在价值的模型不是很多,客户潜在价值,即客户本身具有的,暂时还
作者简介:吕巍,男,上海交通大学安泰管理学院副院长、教授、博导,研究方向是战略管理、市场营销、
数据挖掘在市场营销中的应用,E-MAIL:Wlu@sjut.edu.cn; 陈洁,女,上海交通大学安泰管理学院副教
授,硕导,研究方向是市场营销;吕彦儒,男,上海交通大学博士研究生,研究方向是市场营销。
优秀论文参
评与交流稿
2341
没有在现有业务中充分展现出来的实际价值。而潜在价值模型就是从客户现有的交易行为中
发现客户是否具有的较高潜在价值。
1 建立客户潜在价值模型的基本步骤和关键变量筛选
1.1 模型具体建立过程可
总结
初级经济法重点总结下载党员个人总结TXt高中句型全总结.doc高中句型全总结.doc理论力学知识点总结pdf
为两步:
第一步,定义什么样的客户具有较高潜在价值。商业银行通常对客户价值的判断通常以
业务量大小作为指标,按综合业务量把客户划分一定的等级。
第二步,利用交易行为数据来预测哪些特征的客户比较容易具有内在高价值。
1.2 关键变量选择的原则
技术考虑:选预测能力强、预测稳定性好的变量;业务考虑:变量应容易理解,并且选
取的业务对银行重要性较高。建模的目的主要为了发现具有较大潜在价值和很强购买能力的
用户群体,因此只要客户表现出一次很强的购买力,就认为具有较高的潜在价值,所以用的
关键变量比较全面,包含了基金、保险、国债等变化较大的业务品种;数据可用性。
1.3 关键变量筛选
从技术上考虑,要选取预测能力强,预测稳定性好的变量;业务上,这些变量应该容易
理解,并且选取的业务对银行重要性较高。建模的目的主要为了发现具有较大潜在价值和很
强购买能力的用户群体,因此只要客户表现出一次很强的购买力,就认为具有较高的潜在价
值,所以用的关键变量比较全面,包含了基金,保险,国债等变化较大的业务品种;数据可
用性也是变量选择的
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
之一。
2 客户潜在价值模型的基本假设
在宏观社会经济平稳发展、金融体系保持稳定的条件下,客户潜在价值模型的基本假设
是:
假设 1:客户的购买倾向可以通过客户的交易行为来体现,同时过去的行为模式在未来
类似情况下具有较大的重演可能性。也就是说,客户的行为模式具有稳定性,因此,我们可
以通过研究过去和当前的客户价值来判断其具有的尚未显现出来的潜在价值。
假设 2:客户的价值是按层次上升的,从一个级别向更高的级别递进,发生突变的可能
性很小。
2342
3 建模的主要方法和过程
3.1 数据的抽取和清洗
数据抽取和清洗是采集数据的关键部分,该部分的准确性直接影响模型构建的完整性和
准确性。商业银行零售业务客户的数据分散在众多的业务系统的数据库中,如:零售业务数
据库、个贷系统数据库、贷记卡系统数据库、基金数据库……,为了获得建模所需的数据,
我们需要通过数据抽取和清洗将分散的数据源集中到统一的数据库或数据仓库中,再从集中
后的数据仓库中获得建模所需的源数据变量或中间变量。
3.2 使用因子分析进行初步的变量选择
对候选的百余个变量进行分析,发现其内在的因子结构,期望通过因子分析能以尽量少
的有代表性的变量体现大部分的信息,同时结合着业务部门的经验和需求从中选择了初步的
关键变量。
3.3 预测变量选择
在进行因子分析之后,选择另一种方法来进行降维的工作,在预测性模型中需要能以尽
量简单的模型来稳定的预测未来的事件。因此,建模前的变量选择比较重要。在模型开发过
程中运用了 SAS EM 平台(数据挖掘工具)中的 Variable Selection 节点来进行变量选择。
按照以上通用方法,我们对某银行的数据进行了分析。该银行是中国的商业银行之一,在我
国金融领域引入竞争机制,建立新型银企关系,借鉴国外商业银行先进的管理机制和经验等
方面都是领先者。该银行对于零售业务领域的关注度也随着经济发展而不断提高,并提出了
“以理财业务带动零售业务发展”的战略目标。通过进行因子分析以及降维工作以后,得出的
主要业务变量如下表所示:
表 1 通过筛选后最终用来建模的主要变量
变量代码 变量名称 变量代码 变量名称
c1001_1 住房贷款-日均余额 C3006_1 代扣公用事业费-交易金额
c1003_1 个人商铺贷款-日均余额 C3007_1 代扣其它费用-交易金额
c1004_1 存单质押贷款-日均余额 C3012_1 银证转账-交易金额
c2101_1 外汇宝-交易金额 C3017_1 卡储业务-交易金额
c3001_1 消费业务-交易金额 C3022_1 转账-交易金额
c3003_1 全国通-交易金额 C5102_1 外币整存整取-日均余额
c3005_1 代发业务-交易金额 C5110_1 外币卡储蓄-日均余额
2343
3.4 通过决策树算法建立最终的模型规则
即在选出了主要的用于建模的变量之后,使用数据挖掘的决策树算法来得出客户潜在价
值模型的相关计算规则。
下面几个图属于使用 SAS 系统决策树的基本过程:
图 1 决策树工作界面 1
图 2是决策树节点的数据部分,这是经过选择的变量列表(变量包括住房贷款、个人商
铺贷款、存单质押贷款、外汇宝、消费业务等),有的变量被前面的变量选择节点拒绝,保
存下来的变量将进入模型参与建模。模型的目标是有潜力成为高价值客户的群体。
图 2 决策树工作界面 2
2344
图 3所列的是决策树的参数设置,在本模型开发过程中,需要通过不同的分裂标准进行
搜索,以发现具有较高准确性和稳定性的模型。这是一个启发式的学习过程。需要反复进行,
并充分结合业务经验。
图 3 决策树工作界面 3
图 4 是另外的参数设置:
图 4 决策树工作界面 4
分裂标准
显著指数
最大分裂深度
替代规则
每个节点最
大分支数
模型评估方式
子数选择方式
最多搜索尝试次数
2345
图 5 决策树建模结果展示
通过此模型得出的结果如图 5所示,商业银行可利用本行一定时期(例如以一个月作为
一期)的交易行为数据来预测哪些客户具有较高潜在价值,发现其中蕴含的模式,然后利用
这一模式对全体客户评分,从而能大大提高发现高价值客户的可能性,提高银行营销工作的
效率。
3.5 客户潜在价值模型的结果
建立客户潜在价值模型的主要数据采用该银行 2003 年一年的交易流水数据,通过上述
2346
通用的方法,对该商业银行的数据进行分析,最后得出的具体模型结果如下:
表 2 客户潜在价值模型
变量代码 变量名称 规则
c1001_1 住房贷款-日均余额 > 1400000RMB 或
c1003_1 个人商铺贷款-日均余额 > 1400000 RMB 或
c1004_1 存单质押贷款-日均余额 > 600000 RMB 或
c2101_1 外汇宝-交易金额 > 4000000 RMB 或
c3001_1 消费业务-交易金额 > 37000 RMB 或
c3003_1 全国通-交易金额 > 450000 RMB 或
c3005_1 代发业务-交易金额 > 20000 RMB 或
c3006_1 代扣公用事业费-交易金额 > 600 RMB 或
c3007_1 代扣其它费用-交易金额 > 30000 RMB 或
c3012_1 银证转账-交易金额 > 250000 RMB 或
c3017_1 卡储业务-交易金额 > 600000 RMB 或
c3022_1 转账-交易金额 > 400000 RMB 或
c5102_1 外币整存整取-日均余额 > 800000 RMB 或
c5110_1 外币卡储蓄-日均余额 > 20000 RMB 或
注:这些统计是当前月的指标,也就是在当前月末计算,用来预测以后月份的表现
也就是如果客户账户月末指标满足上述任意一条规则,就认为该客户属于潜在高价值客
户,具有较高的潜在价值。客户潜在价值模型就是为商业银行准确寻找潜在高价值客户提供
辅助。比如一个客户他的银证转账的交易金额超过了 25 万人民币,那么我们认为该客户属
于潜在高价值客户,具有较高的潜在价值,是商业银行需要提高关注度的对象,通过使用这
些规则,商业银行可以很好的发现潜在的高价值客户。当然我们也可以通过关键指标的组合
(参照显性价值计算中对各项指标综合判断的方法)来衡量客户的潜在价值,比如一个客户
在各个关键变量的取值虽然都没达到标准,但是通过变量组合还是可以满足条件的,他们也
可以认为是潜在高价值客户。但在这里,为了简化问题,未作进一步的展开。商业银行可以
先通过这 14 条规则寻找到相应的潜在高价值客户,并对这些客户采取针对性的营销和服务
措施,待时机成熟以后再去考虑那部分指标综合分值较高的客户群。
4 客户潜在价值模型的验证
在建立了模型之后,我们还需要对此模型进行验证,来确定其是否能够真正有效地发现
目前潜在价值较高的客户。具体验证结果如下表 3 所示:
2347
表 3 模型验证结果
注:我们把用于模型验证的数据分为两类,一类数据应用于模型,称为模型组;另一类应用于没有模
型,称为无模型组。无模型组涉及的目标客户数是 2209974 人,即 2004 年 1月份银行存量客户中的非高价
值客户。模型组涉及的目标客户数是 15503 人,即 2004 年 1月份银行存量客户中通过模型筛选所产生的潜
在高价值客户。模型组使用的数据是无模型组使用的数据的子集。
通过验证结果,我们可以看到整体 2209974 名客户中,6个月中成为高价值客户的人数
为 1980 人,占整体的 0.09%;而在通过模型筛选出来的 15503 名潜在高价值客户中,在 6
个月内有 354 名成为真正的高价值客户,占目标客户群的 2.3%;模型将寻找目标高价值客
户的准确率提高了 25 倍。因此,可以通过模型建立的 14 指标规则判断客户是否具有较高潜
在价值,有针对性地服务,使其价值显现。
参考文献:
[1] 匡奕球,《基于生命周期的客户终身价值分析》,西南交通大学经济管理学院
[2] 王珊 等编著,数据仓库技术与联机分析处理,科学出版社,1998
[3] Alex Berson etc., data warehouse, olap & data mining, McGraw-Hill,1999
[4] Dan Vesset,Trends in the Market for Business Intelligence Software, DM Review,August 2001
[5] JiaweiHan,Data Minning_Concepts and Techniques,高等教育出版社,2002
200406
200405
200404
200403
200402
200401
0.09% 1980 2.3% 354
0.09% 1888 2.3% 355
0.07% 1478 2.0% 309
0.03% 703 1.2% 182
0.01% 243 0.5% 79
0% 0 0% 0
占目标客户(普通)百分比 成长为高价值客户人数占目标客户(潜在)百分比 成长为高价值客户人数
无模型 有模型