CRM系统:基于数据挖掘技术的CRM 系统中客户行为
基于数据挖掘技术的CRM 系统中客户行为
葛淑杰
(黑龙江科技学院 计算机与信息工程系,黑龙江 哈尔滨 150027)
摘 要:为了解决在企业中实施客户关系管理(CRM), CRM 系统中客户行为的定量研究问题, 利用决策树的数据挖掘相关技术和方法,
提出了UPTree 数据挖掘算法,并采用UPTree 算法对隐藏在大量客户行为中的信息进行挖掘,从而获取了CRM 系统中潜在的客户行为
规则,并给出这些行为规则的IF-THEN 的描述形式,为企业的科学决策提供依据。
关键词:CRM; 数据挖掘;客户行为
中图分类号:TP 391 文献标识码:A
Behavior of customers in CRM system based on data mining technology
GE Shu-jie
(Department of Computer and Information Engineering, Heilongjiang Institute of Science and
Technology, Harbin 150027, China)
Abstract:To study the customer behavior by carrying out Customer Relationship Management (CRM) in
enterprises, we use some relative technology and method of decision tree of data mining to propose a kind of
UPTree algorithm of data Mining, which is used to mine a great deal of information hidden in customer behavior.
So we can gain series of potential customer behavior rules , introducing IF-THEN description form of those
behavior rules to provide beneficial basis for scientific decision of enterprises.
Key words: CRM;data mining;behavior of customers
0 引 言
随着信息技术与网络化经济快速发展,商业
模式发生了根本性变化。很多行业所提供的产品和
服务日益商品化,企业产品同质化倾向越来越强,
市场竞争越来越激烈,同时客户对产品和服务的质
量、个性化和价值的要求越来越高。在这种环境下,
建立和维持良好的客户关系成为企业取得竞争优
势的最重要基础。这就需要企业完整掌握客户信
息,准确把握客户要求,快速响应个性化需求,提
供便捷购买渠道和良好服务,提高客户满意度和忠
诚度。在这样的前提下,客户关系管理(CRM)应
运而生。这也是企业管理理念从传统以产品、销售
中心的客户关系向以客户满意为中心的客户关系
转变的必然结果,建立以客户为中心的管理体系是
关系到企业生存与发展的战略决策。
1 客户关系管理整体架构
CRM 是通过收集、加工和处理涉及客户行为
的大量信息,确定特定消费群体或个体的兴趣、消
费习惯、消费倾向和消费需求,进而推断出相应消
费群体或个体下一步的消费行为,然后以此为基
础,对所识别出来的消费群体进行特定内容的定向
营销,提高了营销效果,为企业带来更多的利润。
客户关系管理架构从整体上来说,包括三个层
面的应用,分别是客户接入、业务流程管理以及决
策支持。其中客户接入是利用电子商务、呼叫中心
等与客户互动及快速响应;业务流程管理是实现市
场、销售、服务等部门的全程量化管理及工作自动
化;决策支持是利用数据仓库/数据挖掘技术提供支
持[1]。
2 数据挖掘
2.1 数据挖掘概念
数据挖掘就是从大量的、不完全的、随机的数
据中,提取隐含在其中的、人们事先不知道的、但
又潜在有用的信息和知识的过程,数据挖掘过程一
般由3 个阶段组成:数据准备、数据挖掘以及解释
评估。数据挖掘是整个知识发现过程的一个步骤,
是由一些特定的数据挖掘算法组成,其功能和目的
是:在可以接受的计算效率的限制条件下,生成一
个事实(F)的模式表达(E)的计算或列举。数据
挖掘主要通过分类、回归、聚类以及关联等方法来
实现,本文所用的数据挖掘技术为分类挖掘[2]。
分类的直观含义是基于训练集形成一个模型,
训练集中的类标签是已知的,使用该模型对新的数
据进行预测,确定给定数据属于哪一类标签。分类
的目的是发现一个模型去预测目标函数的值,该模
型的结果可能的形式包括代数表达式、决策树、神
经网络、一个复杂的算法、或者上述方法的联合。
2.2 客户关系管理系统中数据挖掘过程
随着数据库技术的迅速发展以及数据库管理
系统的广泛应用,人们积累的数据越来越多。但是
在CRM 系统中真正具有更深层次的数据处理的系
统还不多,如目前的数据库系统只能完成数据的录
入、查询、统计等功能,但无法发现数据中存在的
关系和规则,无法根据现有的数据预测未来的发展
趋势。所以,企业决策者希望CRM 系统在提供有
效管理大量客户信息的同时,能够对其进行更高层
次的分析,进一步发现隐藏于客户信息表中的、潜
在有用的信息和知识,最大限度地反映企业客户的
某种规律性,找出有价值的信息,从而指导商业行
为,这个过程即CRM 系统中的数据挖掘.
3 数据选择与预处理
本文的数据取自惠通电脑销售实业总公司近
几年的销售记录。该公司数据仓库中保存了数万条
的数据信息。但是,用户感兴趣的常常只是数据仓
库的一个子集。因此不加区分地挖掘整个数据仓库
是不现实的。另外,现实世界的数据一般是含噪声
的、不完全的和不一致的。采用数据预处理可以改
进数据质量,从而有助于提高挖掘过程的精度和性
能。在关系数据库中,选择相关的数据集并进行数
据预处理不仅使得挖掘更有效,而且能够产生更有
意义的规则。
3.1 属性相关性分析
在对数据仓库进行数据挖掘时,其中大部分属
性与挖掘任务不相关,是冗余的,遗漏相关属性或
留下不相关属性都是有害的,不相关或冗余的属性
增加了数据量,可能会减慢挖掘进程,降低系统性
能。然而,对于用户来说,确定哪些维/属性应当包
含在类特征分析中则不是一件简单的事情,所以应
当引进相应的方法进行属性相关性分析,以过滤掉
统计上不相关或弱相关的属性。
3.2 属性相关性分析方法
为了保证输入量与输出量之间有一定的相关
度,可以用信息增益来考察属性间的相关性。1948
年,香农(C. E. Shannon)提出了信息论,并对信
息量(Information)和熵(Entropy)进行了定义[3]。
熵实际上是系统信息量的加权平均,也就是系
统的平均信息量,信息增益指标的原理就取自信息
论。
设指向N 的训练集为S,其中包含m 个不同的
类,他们区分了不同的类Ci (for i=1, … , m)。设si
是S 中属于类Ci 的记录的个数。那么分裂之前,系
统的总熵:
I (s1, s2, … , sm) = -Σ (i=1 to m) pi log2(pi)
容易看出,总熵是属于各个类的记录的信息量
强力推荐:
天柏客户关系管理系统
天柏客户关系管理系统(CRM)是一款集专业性、实用性、易用性为一体的纯B/S架构的CRM系统,它基于以客户为中心的协同管理思想和营销理念,围绕客户生命周期的整个过程,针对不同价值的客户实施以客户满意为目标的营销策略,通过企业级协同,有效的“发现、保持和留住客户”,从而达到留住客户、提高销售,实现企业利润最大化的目的。通过对客户进行7P的深入分析,即客户概况分析(Profiling)、客户忠诚度分析(Persistency)、客户利润分析(Profitability)、客户性能分析(Performance)、客户未来分析(Prospecting)、客户产品分析(Product)、客户促销分析(Promotion)以及改善与管理企业销售、营销、客户服务和支持等与客户关系有关的业务流程并提高各个环节的自动化程度,从而帮助企业达到缩短销售周期、降低销售成本、扩大销售量、增加收入与盈利、抢占更多市场份额、寻求新的市场机会和销售渠道,最终从根本上提升企业的核心竞争力,使得企业在当前激烈的竞争环境中立于不败之地。
关键词:CRM,CRM系统,CRM软件,客户关系管理,客户管理软件,客户管理系统,客户关系管理软件,客户关系管理系统