banner

10个案例玩转数据挖掘

作者: 大数据观察来源: 大数据观察时间:2017-08-07 14:33:100

数据挖掘简介:

数据挖掘(Data Mining)运用分类(Classification)、预测(Prediction)、聚类(Clustering)、关联规则 (Association Rule)、序列型样(Sequential Pattern)、时间序列(Time Series)及统计方法(Statistical Method)从庞大且纷杂的数据中,找出隐藏、未知且对企业经营有帮助的信息,是精准营销的核心,近年来受到相当广泛的关注,并应用于各种领域的实务中。银行业(Banking)藉由数据挖掘发掘潜在有资金需求的中小企业户(Small-Medium Enterprise),进行信贷营销(Credit Marketing),以及侦测客户的信用风险(Credit Risk)。医疗业(Health Care)藉由数据挖掘侦测病患罹患心脏病(Heart Disease)的机率及罹患糖尿病(Diabetes)的可能性。零售业(Retail)则藉由数据挖掘预测促销活动(Promotion)的成效以及每日的销售量,并评估客户对产品的喜好。电信业(Telecommunication)藉由数据挖掘预测客户流失(Customer Churn)的机率以及何种措施最能将客户挽留(Customer Retention)。保险业(Insurance)则藉由数据挖掘评估车贷(Car Loan)客户会来理赔的可能性,以做为其保费高低的依据。有鉴于此,本培训的目的就是要针对数据挖掘模型的建构方法,以13个实务案例进行实际操作,并做广泛且深入的探讨,有效建构企业营运获利的新模式,使企业利润最大化。主要的对象为企业主管、营销经理人、数据库管理者、高校及科研机构师生。

案例1:

评估新车设计(汽车业):某汽车制造商开发两种新车(汽车及卡车)的原型。在将新车型引入至产品系列之前,制造商想知道竞争对手已经上市的车辆中,哪些与这两款产品的原型最为相似,以确定这两种新车将与哪些车型展开竞争。此案例将采用K最近邻居(K Nearest Neighbor; KNN)来建模。

案例2:

电信客户流失(电信业):某电信服务提供商非常关注客户流失到竞争对手的数量。假如服务使用的数据可以用来预测哪些客户有可能被转移到另一个供货商,则此供货商可提供客制化的优惠,以尽可能留住客户。此案例将采用二元罗吉斯回归(Binomial Logistic Regression)来预测客户的流失。

案例3:

药物治疗(医疗业):某医学研究中心收集许多患有某疾病的病患数据,并记录哪一种药物对病患是有疗效的(总共有五种针对此疾病的药物)。此案例将采用决策树 C5.0(Decision Tree C5.0)找出,哪种药物适用于哪一种类型的病人。

案例4:

预测贷款逾期者(银行业):某银行希望根据客户过去的贷款数据,利用贝式网络(Bayesian Network)来建模,以便用模型来预测新的贷款者,核贷后会逾期的机率,以做为银行是否核贷的依据,或提供给客户其他类型的贷款产品。

案例5:

电信客户分类(电信业):某电信服务提供商透过客户使用服务的方式,将客户分为四类人。此案例的目的是想根据人口统计数据,利用多元罗吉斯回归(Multinomial Logistic Regression)来找出这四类人的特征,并发掘这四类人的潜在新客户。

案例6:

细胞样本分类(医疗业):某医学研究中心收集癌症病患的细胞样本特征数据,以便进行研究。原始的数据中显示良性样本与恶性样本间的许多特征有显著的差异。此案例的目的是想利用支持向量机(Support Vector Machine)来建模,以便用模型来提早发现某样本是良性还是恶性的样本。

案例7:

零售业销售促销(零售业):此案例的目的是想根据零售产品过去的促销记录,利用神经网络及回归树(Neural Network & Regression Tree)来预测未来的销售成效。

案例8:

预测带宽使用率(通讯业):某全国宽带网络供货商的分析师需进行客户使用网络流量的预估,以便预测带宽的使用。全国网络的使用是全国各局域网络使用的加总,因此分析师需逐一对每个区域市场进行带宽使用的预测。此案例的目的是想利用简单的时间序列模型(Simple Time Series Model)来预测每个区域市场下三个月的带宽使用量。

案例9:

预测型录商品的销售(零售业):某型录公司希望根据过去10年的销售记录,来预测男装生产线每月的销售。此案例的目的是想利用两个时间序列模型-指数平滑(Exponential Smoothing)和ARIMA来解决这个问题。

案例10:

购物篮分析(零售业):此案例的目的是想根据会员卡所记录的客户的个人信息及每次购买商品的数据,利用关联模型(Apriori)和决策树C5.0(Decision Tree C5.0)来发掘购买类似商品的客群,以及客群的特征(例如,年龄、收入、等)。

banner
看过还想看
可能还想看
热点推荐

永洪科技
致力于打造全球领先的数据技术厂商

申请试用
Copyright © 2012-2024开发者:北京永洪商智科技有限公司版本:V10.2
京ICP备12050607号-1京公网安备110110802011451号 隐私政策应用权限