CRM系统:数据挖掘在银行C R M 管理中的应用研究
[摘 要] 人类科学技术水平的提高,引起了世界的两大主要变化,首先是信息、物资的流动速度加快,无论是消费者还是
生产者、经营者都能更快地得到有效信息,适时调整自己的习惯和行为。再次是计算机等高科技技术的发展使生产能力极大提
高,超越了人们的基本需求水平,市场逐渐由卖方市场转变为买方市场,市场竞争也日益激烈。因此,随着金融市场竞争的加
剧和消费者的需求日趋个性化,如何在快速多变的市场中保持老客户与争取新客户成为关乎各类银行成长和发展的关键,以客
户为中心的客户关系管理(CRM)思想就在这样的一个环境和变化中逐渐为银行所重视与推崇,在日常管理中逐渐成为注目的焦点。
然而如何从大量庞杂的客户信息中提取出隐藏在其中有价值的信息则需要有先进的技术和工具的支持,数据挖掘技术的出现为
银行CRM的实施提供了良好的支持。本文主要阐述了银行客户关系管理中数据挖掘技术的应用问题。
[关键词] 数据挖掘 客户关系管理 (CRM)
客户关系管理(CRM)最早由Gartner Group提出,所谓的CRM
就是为企业提供全方位的管理视角,赋予企业更完善的客户交流
能力,最大化客户的收益率。
在人类社会从“产品”导向时代发展为“客户”导向时代的
今天,客户的选择决定着一个企业的命运。CRM 的核心管理思想
就是“客户”是企业最重要的资源之一,企业必须由过去的 “产
品”导向向“客户”导向转变,对企业与客户之间发生的各种关
系进行全面的管理。银行与客户之间发生的关系,不仅包括单纯
的各类金融产品销售过程所发生的业务关系,如合同签订、定单
处理、发货、收款等,而且包括在金融营销及售后服务过程中发
生的各种关系,如在金融产品市场活动、市场推广过程中与潜在
客户发生的关系:在与目标客户接触过程中,内部销售人员的行
为、各项活动及其与客户接触全过程所发生的关系;还包括售后
服务过程中,客户服务人员对客户提供关怀活动、各种服务活动、
服务内容、服务效果的记录等,这也是银行与客户的售后服务关
系。对银行与客户间可能发生的各种关系进行全面管理,将会显
著提升银行营销能力,降低营销成本,控制营销过程中可能导致客
户抱怨的各种行为,不断改进对客户的服务水平,提高客户的忠
诚度,从而为银行带来更多利润。
然而许多银行用了很大力气去积累有关客户的信息,但是并
不能有效地进行客户关系管理,因为信息只是一些原材料,经过组
织、分析并理解后,才可以用来构建成有关客户的知识。这些知
识运用在银行的市场、销售、客户服务等各个领域,并让这些知
识发挥出杠杆作用,以提升银行客户的满意度和忠诚度,从而降低
生产和销售成本,缩短销售周期,扩大市场份额,提高银行的效率
和效益。客户知识管理是通过一组解决方案的集合寻找和识别与
问题有关的关键性信息,并将这些信息进行提取,形成对某一问题
的专门知识,用知识指导决策并付诸行动,再将该行动转化为利
润。因此,客户知识管理是客户关系管理的本质。然而,银行如
何管理和分析大量、庞杂的客户信息,从中找出对自身管理决策
有价值的信息和知识则需要有先进的技术和工具的支持,数据挖
掘等新兴技术的出现,为银行CRM 的实现提供了良好的支持。
数据挖掘(Data mining,DM),又称数据库中的知识发现(
Knowledge discovery in database,KDD),是指从存放在数据库、数
据仓库或其他信息库中的大量的、不完全的、有噪声的、模糊的、
随机的实际应用数据中自动地发现相关模式、提取有潜在价值的
数据挖掘在银行C R M 管理中的应用研究
田小丹 广东金融学院工商管理系
[摘 要] 人类科学技术水平的提高,引起了世界的两大主要变化,首先是信息、物资的流动速度加快,无论是消费者还是
生产者、经营者都能更快地得到有效信息,适时调整自己的习惯和行为。再次是计算机等高科技技术的发展使生产能力极大提
高,超越了人们的基本需求水平,市场逐渐由卖方市场转变为买方市场,市场竞争也日益激烈。因此,随着金融市场竞争的加
剧和消费者的需求日趋个性化,如何在快速多变的市场中保持老客户与争取新客户成为关乎各类银行成长和发展的关键,以客
户为中心的客户关系管理(CRM)思想就在这样的一个环境和变化中逐渐为银行所重视与推崇,在日常管理中逐渐成为注目的焦点。
然而如何从大量庞杂的客户信息中提取出隐藏在其中有价值的信息则需要有先进的技术和工具的支持,数据挖掘技术的出现为
银行CRM的实施提供了良好的支持。本文主要阐述了银行客户关系管理中数据挖掘技术的应用问题。
[关键词] 数据挖掘 客户关系管理 (CRM)
信息、挖掘知识的过程。从CRM 的角度, 数据挖掘应用就是从
大量数据中挖掘出隐含的、先前未知的、对决策有潜在价值的知
识和规则, 并能够根据已有的信息对未来发生行为做出结果预测,
为企业经营决策、市场策划提供依据。在CRM 中应用的数据挖
掘模式主要有以下五种: 关联分析、分类、聚类分析、序列分析、
孤立点分析。主要使用的技术有: 统计、聚类、决策树、神经网
络和关联规则。对于要挖掘的数据, 可以是来自传统的关系数据
库, 也可以建立面向主题的、采用多维数据立方体组织数据的数
据仓库。
数据挖掘在金融领域应用广泛,包括:金融市场分析和预测、
账户分类、银行担保和信用评估等。这些金融业务都需要收集和
处理大量数据,很难通过人工或使用一两个小型软件进行分析预
测。而数据挖掘可以通过对已有数据的处理,找到数据对象的特
征和对象之间的关系,并可观察到金融市场的变化趋势。然后利
用学习到的模式进行合理的分析预测,进而发现某个客户、消费
群体或组织的金融和商业兴趣等。
为了使数据挖掘技术很好地在银行中发挥作用,首先需要建
立一个能够全面组织和管理来自银行内部和外部数据的平台。通
过建立数据仓库, 将来自BOSS 系统、网管系统、OA 系统和财务
管理信息系统的数据进行整合。可以根据不同的分析需求建立相
应的主题( 如客户流失情况主题、市场竞争分析主题等),并根据
主题建立相应的多维数据集, 从而可以在多维数据集中采用联机
事务处理(OLTP)、联机分析处理(OLAP)和数据挖掘为相应的主题
提供分析模型。
一、利用聚类分析法进行客户细分,提高服务成功率
客户细分是银行有效运营、营销、服务的基础,是把大量的
客户分成不同类型,每个类型里的客户拥有相似的属性。银行通
过客户细分,针对每类的客户使用不同的营销方式或提供不同的
服务,可使银行以最小的投入获得最大的回报。
聚类分析技术是通过无指导学习,按类相似性最大化原则,
自动对数据分类。对于客户关系管理系统中存在的大量数据,管
理人员常常希望得到有意义的提示以做出正确的客户分类判断,
此时使用聚类分析结果,可为管理者先给出多个不同的相对较大
的类划分,再进行精确划分。例如,管理人员要根据客户的价值
细分客户,由于客户的价值对每个银行来说衡量的标准不同,因
此可先对银行现有的客户进行聚类,利用聚类结果给客户赋予类
标记,类标记有四种,即高价值客户、最具成长性客户、普通客
户以及负加值客户,并描述出每类客户特征。通过聚类分析,银
行往往可以发现客户的群体行为,了解客户的共性,从而提供针
对性的客户服务,提高银行服务成功率。
二、利用关联分析法进行交叉营销,提高客户价值
关联分析就是给定一组或一个记录集合,通过分析记录集合,
推导出其相关性,目的是为了挖掘出隐含在数据间的相互关系,
常用的关联分析有简单关联﹑因果关联和时序关联。交叉营销则
是指银行向原有客户销售新的理财产品或服务的过程,它以“双
赢”为原则,即对客户来说,因得到更多、更好满足需求的服务
而受益;对银行来说,因营业额的增长而获益。银行利用数据挖
掘技术中的关联分析法可以从客户过去发生的交易数据中寻找影
响客户交易行为的因素,并建立预测模型对客户将来可能发生的
交易行为进行预测,分析哪些客户最有可能对银行的服务感兴
趣,会对哪些金融产品感兴趣,哪些理财产品或服务通常会一起
发生在同一次交易里,按什么样的先后顺序发生,从而实施有效
的交叉营销,提高银行的客户价值。
三、利用分类法可有效识别银行优质客户,提高客户忠诚度
数据分类是通过在训练集上针对某一属性进行类划分,建立
描述并区分数据类或概念的模型,再使用该模型对数据类集进行
划分。对于银行来说,分类是最常见的操作。银行以客户为核心
并非是指所有的客户都同等重要,根据二八原则,一个公司80%
盈利是由20%的客户产生的,因此识别银行的价值客户是实现银
行CRM的关键。但是,目前大多数银行仍然按自己的经验来识别
优质客户,很少有银行能够确定一个较为完整准确的优质客户标
准。利用数据挖掘技术中的分类算法,这一问题就可得到有效解
决。我们首先假设类标号属性是“是否为优质客户”,然后采用
分类法,通过在一定数量的客户群上进行归纳,最后确定出优质
客户的评估准则。在获得了评估准则后,银行就可以比较轻松﹑
客观地识别出其绝大多数优质客户。
利用分类法还有利于银行培养忠诚客户,使之与银行保持长
期关系。客户忠诚是基于对银行的信任度、往来频率、服务效果、
满意程度以及继续接受同一银行服务的可能性的综合评估值。银
行为了留住老客户,防止客户流失,就必须了解客户的需求。首
先假设类标号属性是“顾客是否流失”,再利用数据挖掘工具对
大量的客户资料进行分析,建立数据模型,确定客户的交易习惯、
交易额度和交易频率,分析客户对某个产品的忠诚程度、持久性
等,并为他们提供个性化定制服务,以提高客户忠诚度。
四、利用孤立点分析法可发现客户异常行为,防止客户流失
孤立点是数据集中与一般数据模型不相符合的那些数据。一
般情况下,在数据被导入数据仓库前,应该经过数据清理,以消
除不一致的情况。但是在实际应用中,往往会发现一些客观存在
的、非操作人员的人为因素而导致的异常数据。对于这些异常数
据,我们无法按照