banner

决策树是大数据时代有效的预测工具

作者: 大数据观察来源: 大数据观察时间:2017-03-03 10:17:280

2020年的一天,在你驱车前往公司的路上,导航系统将通过预测交通流量自动帮你选择一条最适合的交通路线,车内推荐系统将根据你的饮食习惯给你推荐沿途的早餐店,你的电子社交助理将为你自动选择你可能感兴趣的社交网信息……

这并不是科幻大片,而是Preddiction impact董事长、预测分析专家埃里克·西格尔在其新著《大数据预测》中所描述的一个未来场景。实际上,这些场景有些在今天已经变成了现实。

结合预测分析的应用实例,埃里克·西格尔在《大数据预测》一书中对大数据预测进行了深入、细致且全面的解读,并希望通过量化的方法来预测人类的行为。

他说:“大数据时代,核心就是预测,预测分析已在商业和社会中得到广泛应用,随着越来越多的数据被记录和整理,未来预测分析必定会成为所有领域的关键技术。”

预测就是力量:

我就知道你会这么做

在大数据时代,预测已经变得更加具有可能性,也变得几乎无处不在,时刻影响着我们的生活。现在,预测技术正在不知不觉中影响着人类的体验,无论是开车、购物、学习、就医、沟通、看电视,还是赚钱、借钱甚至偷盗。

那么预测是如何与大数据结合的呢?预测又能给企业带来什么好处呢?

“预测除了让你我这样的消费者获益之外,也可让企业脱胎换骨形成全新的竞争力。因此,很多企业都在不余遗力地提升预测力。”

在《大数据预测》一书中,埃里克·西格尔介绍了预测应用在企业领域的一个最为知名的案例:20世纪90年代中期,一位名叫丹·斯坦伯格的商业科 学家走进了大通银行,他要帮助这家金融机构预测数百万份按揭的风险。大通银行采纳了斯坦伯格的预测技术,并借助斯坦伯格研发的系统来评估、处理大量的银行 按揭。

在这个案例中,斯坦伯格帮助美国大通银行精确预测了按揭申请人的未来还款行为,由此极大降低了放贷风险并增加了盈利。

“预测就是力量,如果某大型商业机构能够预测个体资产的风险变化和价值,那么,它将形成不可撼动的市场竞争优势。”

当然,即使在大数据出现之后,预测技术也并不是完美的,它需要不断完善。

“做出精确的预测是件很难的事,每项预测都有若干先决条件,即首先要掌握每个病人、每个购房者以及每封邮件的不同特征信息。”

那么在每项预测中,我们该如何将这些分散的信息综合起来呢?埃里克·西格尔给出的应对策略是:用系统化和科学化的方法来开发并持续改善预测技术,即要让计算机系统自动“学习”如何预测。

“这就是机器学习,也就是让电脑自动获取新知识和新能力,持续不断地输入现代社会最有价值和最重要的非自然资源:数据。”

在埃里克·西格尔看来,数据里面所凝结的内涵,能够给预测带来更高的准确率。数据里面的每一次医疗诊断、借款申请、发帖、影视推荐、垃圾邮件以及结果好坏的购买行为、成功或失败的推销等等,都是机器学习的原始材料。

“机器学习会从这些发现中尝试建立预测能力,通过对数字的挖掘和试错,运用统计学方法和计算机科学方法实现这种预测。”

而埃里克·西格尔在本书中所要讲述的,正是计算机预测技术中最具有影响力和最有价值的成就,以及其背后的两大因素——技术背后的人和推动技术发 展的神奇的科学,他指出:“计算机自动学习系统的研发使得数据资源的能量开始爆发,在获取这些新知识之后,科学预测就成为了可能。”

两条腿走路:

预测,并根据预测结果采取行动

研究数据只是做出准确预测的第一步,事实上,要想将预测模型应用于实践,并从中获益,并不是一件简单的工作。

“运用预测分析意味着要根据预测结果去行动,要在实践中应用从预测中学到的东西并尊重数据所揭示的规律。”

当然,随着技术的进步,成功运用预测分析的案例正不断增加,而这些案例都具备如下特征:海量数据的积累、组织文化的变迁以及预测分析相关软件的不断完善。

在书中,埃里克·西格尔提出,要想拥有属于自己的运用预测分析的创新方法,你需要做到以下两步:预测内容及采取行动。

“所谓的预测内容,包括个人、股票以及其他任何事物的变现形式;而采取行动,则是指做出决策,针对预测结果所作出的组织行为。”

埃里克·西格尔把这种预测系统的构建过程与航天飞机发射的过程相对比,在他看来,这两者具有很大程度上的相似性。

“正如航天飞机一样,从理论上看,预测分析程序看上去很完美,你要先设计并构建好系统,然后将其放在发射塔上等待发射信号,但当真正要开始执行时,发射过程却可能出现波折。”

而在启动程序之后,预测分析系统就进入了奇特而安静的等待期,正如航天飞机进入轨道之后出现的静止状态一般。计算机能在不知不觉中完成海量的程序变更,而人是无法直接看到或感知到这些变更的。

但是,预测分析系统进入等待期并不意味着人就无事可做,人不仅要时刻观察这个系统,还要做出决策。

“如果不根据预测结果采取行动,那么预测实际上没有任何意义,它们只是信息而不是创意,虽然这些珍宝那么闪耀,但如果你只是把这些成果当作装饰品挂在墙上,那么除了展示你的良好自我感觉之外,它们别无用处。”

在埃里克·西格尔看来,预测分析的目的绝不是要产生对在办公桌上等着落满灰层的报告,它要跳出实验室,在现实中发挥作用。

当然,由于预测分析具有开放性,其应用领域几乎无所不包,案例也层出不穷,埃里克·西格尔并不指望仅仅是这两个简单的介绍就能让读者了解到大数据预测的精髓所在。因此,在书中,他列举了147个案例,以便读者浏览并对此拥有大致了解。

“这些案例设计包括精确营销、员工流失、股票价格、风险、事故、销售、捐赠、点击率、取消率、健康问题、医院入诊等等。”

埃里克·西格尔希望,他所观察到的那些预测案例能给陷入麻烦或者有远见的企业及个人带去一些哪怕是最微小的用处。

大通银行的范例:

决策树是有效的预测工具

在预测界,丹·斯坦伯格算得上是一个传奇,他和大通银行之间的故事,也成为了预测界的一个经典案例。在书中,埃里克·西格尔详细解读了这次合作的过程,这或许能给读者带来更多启发。

最开始,大通银行在按揭贷款评估中出现了一个不可协调的问题——它们总是会出现很高的失误率。

丹·斯坦伯格答应帮助大通银行来预测按揭贷款风险,他组建了一个小规模的专家团队,将分类——回归决策树方法用于分析大通银行的按揭数据。

“但大通银行希望这个预测模型能够跟普通企业的不一样。大部分企业会预测客户是否会流失,由此确定如何挽留客户,让流失风险较高的客户留下来。”

而大通银行对客户流失预测则有新的要求,他们希望用预测值来判断个人按揭贷款的未来价值,由此来确定是否将这些贷款转让给其他银行。

“银行之间会交易信贷资产,大通银行可以根据预测的提前偿付概率来判断按揭贷款的价值,如果想要更加充分利用预测所能实现的价值,大通银行可以判断究竟是持有这笔贷款好还是将其转让好,而预测就能帮助我们做出这些决策。”

在这个按揭贷款预测评估程序当中,丹·斯坦伯格所要预测的对象是在未来90天内将提前还款的按揭贷款人;而所要采取的行动则是评估按揭贷款的价值,决定是否将这笔贷款转让给其他银行。

大通银行从预测项目中受益匪浅,2000年,大通银行决定购买JP摩根并组建摩根大通集团,目前按资产总额测算,摩根大通是美国市场上最大的金融机构。

“决策树被证明是有效的预测工具,决策树的规则通俗易懂,这对于许多机构而言都是好消息。”

当然,大通银行的决策树方案,只是适用于大通银行本身的一种预测程序。在书中,埃里克·西格尔还列举了诸多的案例,这些案例或许能给企业带来一些启发。

可以预测的 人类七大生存现状 

消费行为:例如好莱坞影视公司会预测,如果某剧本被制作成影片,它是否会受欢迎。

恋爱、工作、生育和离婚:职场社交网站LinkedIn会预测你的未来职业选项。

人的思考和决策:例如奥巴马在选举中利用预测左右了数百万的摇摆选民。

人的放弃:例如惠普公司对其全球33万名员工都进行了“离职风险”评估,预测每位员工的离职可能性,这样管理层就可以提前介入或及早采取应对措施。

事故:例如,保险公司会预测谁开车更容易出交通事故,或者谁在滑雪时更容易受伤。

疾病和死亡:研究人员会根据病患的各项指标以及身体状况,来判断其在手术中猝死的风险,并将信息用于制定诊疗方案。

撒谎、欺诈、盗窃和谋杀:大部分大中型银行都采取了预测技术来防范单证造假、信用卡盗刷以及其他行为。

banner
看过还想看
可能还想看
热点推荐

永洪科技
致力于打造全球领先的数据技术厂商

申请试用
Copyright © 2012-2024开发者:北京永洪商智科技有限公司版本:V10.2
京ICP备12050607号-1京公网安备110110802011451号 隐私政策应用权限