免费试用

CEO的水晶球,数据改变商业

2016.08.06 / View:

导读:数字化战略包括创新,包括我们对客户的理解,同时我们要有快速的业务驱动能力,当然我们要配合敏捷的组织结构,最底层是我们的双数的IT架构以及数据分析。对于科技服务行业来说,数字化技术未来将成为每个企业核心的竞争力我们不仅要发现数据现有的情况,更要发现数据背后的价值,这是InsightsPrediction

 

     很高兴来永洪大数据峰会跟大家做一个分享。前面大家讲了很多的BI数据仓库,我本人做过很多年的数据仓库,我今天跟大家开一个脑洞,ThoughtWorks是以技术创新为核心能力的公司,会具体的讲机器学习、深度学习。我没有提人工智能,可能稍微还有一些差异。这里面跟大家举一个简单而又典型的机器学习的案例,而且大家肯定身有体会。今天的空调这么冷,这是一个事实,而且这不需要大数据分析。但是我们知道这样一个结论,我们怎样变成一个行动?这实际上就是我将在后面讲的具体案例里面,如果把我们机器学习技术应用到这样的场景,这个问题就可以解决掉。数据可视化也好、数据分析也好,最终的目的是什么?最终不是让我们看表格,而是对你的商业行动产生价值。

我是ThoughtWorks的史凯,我本人做过很多年的咨询,现在我在国内负责咨询和大数据这两个业务条线。我今天演讲的话题分为三大部分:第一是超越迷雾,数字化时代的挑战和机遇。我会更偏向论述当一个企业在现在的数字化时代面临特别多新的竞争格局的时候,如何去做选择?和原来传统的数据仓库说提高内部效率有一定的差异,所以相对来讲是比较靠前端一些。第二部分,在这样的挑战当中为什么说机器学习这样的技术会像CEO的水晶球一样。第三个,用我们实际的案例看一下机器学习在各个行业的实践。超越迷雾、拨云见日、决胜千里,三个章节。

一是超越迷雾,数字化时代的挑战和机遇

    永远不知道你的竞争对手在哪里。我做战略咨询的,现在很多客户问我们的问题不仅仅停留在怎么提高我的财务效率上,很多客户问我问题是说,我如果想投资两百个亿做医疗行业的医联网,应该怎么做,我应该投资在哪里、我的客户在哪里,怎样快速筛选出我的最新产品模式。这是一个跨界竞争的时代,这也是数字化时代的特点。所有消费者的行为都被各种各样的APP采集上去了,这种情况下,数字的传播效率是光速地,并且大数据把各行业的边界打破了。

    这个图大家熟吗?这是facebook前面推出的基站,他们是做社交网络的公司,但现在做运营商的基站,完全是跨行业的竞争。再比如说linkedln刚刚被微软收购了。现在接触的企业,很多高管、企业的领导们最头疼的是下面该干什么,很迷茫,竞争对手在哪里也不知道。原来给客户做传统咨询的时候会给他们做对标,中国移动对标沃达丰,做行业竞争分析,现在这个工作基本上没有用了,完全没有用了,这是在数字化时代很大的挑战,永远不知道你的竞争对手在哪里。

   对于科技服务行业来说,数字化技术未来将成为每个企业核心的竞争力前两天跟我们一个大的科技服务集团做了沟通,他们跟我们分享了一个话题是什么呢?在科技时代、数字化时代,我们这样的科技服务公司怎么办,完全是跨行业的。因为每个企业都说自己是科技公司,从原来人力密集型企业、资产密集型的企业,到现在全球趋势是科技密集型企业。在这样一个情况下面,我们现在的客户、我们的企业数字化的技术是不是你的核心竞争力?不要把技术和业务分得那么开,现在的趋势是业务就是技术、技术就是业务。因为所有的经验、所有的数据、用户信息都在系统里面。我有一个客户,在跨很多行业的采购部门,原来做内部IT的,现在做什么呢?因为他给很多的板块做服务,就积累了采购这样一个跨行业的经验,现在把这样一个采购平台推出去做SaaS。所以IT已经变成运营的价值,数字化技术未来将成为每个企业核心的竞争力。

    我们看一下数字化时代我们的机遇,由于数字化时代资源整合非常快,原来我们打造一个手机品牌需要很多年,现在我们打造一个手机品牌,整合数字化供应链,了解客户的信息非常快。在这个情况下既是竞争、挑战,也是机遇。商业已经没有边界了,原来说我们比我们竞争对手快一步我就赢了,而现在,不知道竞争对手在哪里,要飞快的奔跑。这个情况下面,商业模式的创新至关重要,所以我今天重点讲的是创新。

这跟数据有什么关系?前面那几个图都是有故事的,每一个图是现在的一个案例。这是我们在全球澳洲最大的房地产公司做的一个案例,发现数据背后的规律,来做业务创新。这里面讲一个很好玩的故事,我们跟他们有数据分析的部门会一起分析数据的趋势,然后发现一个很有意思的现象,有一堆高频用户访问网站频率非常高,但是从来没有交易,很奇怪,天天来、天天看,就不买东西。我们去学习、去发现,他比一般的用户在图片停留的时间要长。我们想一下,他在干什么?我相信在别的场合问这个问题,很多女同志很快回答出来,是来看装修图片的。但如果我们用传统经验分析,那可能不一定能想到这个点。

 这一切存在很大的基础,就是说我们要有数据,我们数据要有业务价值的。所以这一点上面我很高兴的,我原来做数据仓库,做数据咨询给客户做数据整个的规划以及创新的时候,很多场合都需要数据仓库、BI这样的产品。今天我来这里非常高兴的看到,国产品牌有一个非常不错,而且完整性上面、深度上面、易用性上面非常好的品牌,我多了一个合作伙伴的选择,这个非常开心。

    在这样的情况下,BI如何应用机器学习,用这样新的技术来穿越数字化时代的创新迷雾?如何提高交叉销售额?用户在哪里?风险在哪里?什么样的产品组合是最好的?我们来看一下,准确的讲,我们认为在数字化时代我们需要成为数字化的企业,不仅仅说我们对数字技术的掌握,更是指需要有数字化战略,这个数字化战略包括创新,包括我们对客户的理解,同时我们要有快速的业务驱动能力,当然我们要配合敏捷的组织结构,最底层是我们的双数的IT架构以及数据分析。当一个企业走到数字化企业,建立数字化能力模型的时候,我们这个企业就具备了三条高速创新通道的引擎,就像一个火箭装上了三个推动引擎一样。

    第一个可以进行模式创新,我们通过数据,通过了解客户背后的需求,完全可以跨界进入一个新的领域,完全可以产生一种新的商业模式。同时,我们也可以通过数据的分析提高效率,这是流程创新。当然流程和模式很难创新的时候,这是动静非常大的时候,用数字化技术,提高我们的用户体验,就是体验创新。不管哪一种,这些创新都是我们数字化企业核心的竞争优势。

我们看到数字化时代我们面临很多的挑战,我们需要穿越这样的迷雾。因为现在信息量特别大,所有的数据都在这里,如果我全部采集回来做分析,似乎从成本上面、从核心业务战略上面不一定一致,所以我们要拨开数字化迷雾,看到未来的价值。

为什么说机器学习这样的技术会像CEO的水晶球一样

    下面我们看一下传统的大数据应用方式,现在是创新类的业务,前面提到的场景,用户告诉我说,我现在要进军某一个行业、某一个领域。比如说有一个客户是商业地产,想在一个新的城市开一个店,位置已经选好了,但是他不知道如果这个店招商应该招哪些品牌,商业餐饮应该配多少,零售还有生活服务应该配多少。当然我们可以基于BI数据仓库分析以前的总结来看过去的经验,但这个对于新的场景还是有一些不适合,因为这个没有发生过。这个情况下面特别强调预测的能力。

    我们看一下传统数据仓库解决的方式,我们在做一个数据仓库报表的时候,首先我们设定一个业务目标、业务理解,一般是业务人员提出一个需求我们进行数据勘察、主题域的设计、数据预处理,Cube、可视化设计、用户使用。上午我们聊天的时候发现永洪BI已经超越了这个过程,已经不建Cube了。这样我们会看见,最终我们的目标是要解决问题,把这个问题发现了,解决出来。但我们把这个过程,传统的数据仓库八步,开始是业务人员理解,中间是建模,后面是可视化。每一层都跟你的经验和公司管理水平相关,这种情况下不可避免的会发生一些失真,这样就会有很大的差异。而且基于原来经验的分析,建维度指标的时候,你用过去的业务经验挑出来建设的,不是预测,而只是辅助决策。

回到刚才讲的场景,今天空调开的很冷,OK,但是没有办法。我们可以看一下,如一我们用水晶球的方式,把这个水晶球就像每一个企业CEO办公室里面有一级像魔法一样的水晶球,问它会场的同志们感觉怎么样,告诉你很冷,这是一个结论。但如果同时把温度调高一点,是不是更好。这就是说我们不仅要发现数据现有的情况,更要发现数据背后的价值,这是Insights和Prediction。

    比如说现在这个场景,这个会场里面有摄像头,这个摄像头有图象识别的能力,背后有算法,识别每个人的表情、动作,一旦发现,立刻就会有模型,有算法,来计算出一个人很冷。如果很多人都是这个状态的时候,机器会自动的把这个服务触发到空调控制器那边,这是一个典型的大数据变成行动的场景。所以我们每一个企业都需要这样一个魔力水晶球,超越传统的业务经验,将数据分析变成业务的行动。

    机器学习是大数据的应用趋势,这是前面年数据仓库、机器学习的趋势的百度指数,我们把数据分析的结果变成一个服务,让它实时的影响你的系统,产生行动。在未来的场景不需要看那么多报表,每个数据进入系统的时候,已经进入数据的模型,这个模型通过算法已经产生了行动,影响了其他的系统。所以这是机器学习创新的业务价值。

    机器学习最核心的价值是基于洞见和预测的。现在的机器学习还做不到完全自己去发现,什么数据丢进去都可以做,肯定不是这样的,我们还是需要定义,首先定义一个业务目标,然后我们把相关的数据放进去去学习,通过训练数据,去验证。最后把模型建好以后,也不是建模型,当你丢新的数据,就可以预测,帮你产生新的业务价值。所以机器学习是这样的循环,将你业务的价值,去训练,验证、发现,是一个循环,数据量越大,准确度越高,这和传统的数据仓库有三大差异:第一个传统的数据仓库是已有规则的统计分析,机器学习是发现新的业务规则。传统的数据仓库以模型为核心,新的机器学习是以数据为核心。传统的是静态的模型,机器学习是持续学习、迁移学习。

    机器学习适合的场景,语音识别、图象识别就不讲了。典型的业务场景,比如说精准营销,等一下会讲一个典型的案例。异常检测,哪些环节有问题。根因分析、业务预测。

    大家会听到深度学习这个词,深度学习是深度神经网络在机器学习里面的应用,同时现在还有一种新的,叫做迁移学习。迁移学习,原来学的模型,源数据是一致的,结构是一致的,结构发生变化的,原来需要重新学习,但是迁移学习可以继承原来学习的经验。好比人类的基因一样,可以继承你的学习能力。

    我们现在在深度学习这一块也在做一些探索,比如说做CEO的水晶球,丢数据进去,自己找到里面的特征,然后进行预测。这个里面会有很多的技术,哪些技术适用于这些场景,这一块可以参考一些,像我们的技术雷达有这样一些技术的战略。

最后我们来看一个实际的应用场景

    这是我们主要的服务,把数据模型变成决策服务,在这一点上面我们和传统的BI、数据库厂商有很多合作的点。介绍一个典型的应用场景,这个场景是这样的,这个客户每天会有20多万潜在分期用户,但是呼叫中心做营销的能力只有20%,意味着营销能力只能有20%。原来的做法是找一些关键值排序,产生顺序,按照这个顺序拨打电话。后来我们用机器学习帮它找后面数据的规律,调整算法,我们可以看一下,这是原来拨打的真实频率,蓝色是拨打电话数,绿色是成功率,我们发现下面绿色的成功率始终是平滑的,而且成功率很低。这就意味着从20万里面筛选出前20%的高概率的用户是不准确的。

    正常来讲,比较好的模型是怎样的?应该是一个曲线,越靠前越接近1,经过排序以后,越靠前的这部分用户,营销的成功率越高。越靠后,20万用户排名以后,越往后成功率越低,这样只用打前面20%就OK了,因为我们营销成本不是无限的,一定要挑选最有可能的用户做。这个情况下面,这是用机器学习的算法,开始用了7天的数据学习,第一次迭代的结果是这样的,然后多次迭代。这是精准营销的案例,现在机器学习有很大的局限,还是需要你把特征值提取出来才能做到。所以这样的话,现在很重要的一个方向是深度学习,不需要提取特征值,让机器自己找规律。

    其他的这些,比如说预测性检修、异常检测,都有一些其他行业的案例。比如说医疗,做分诊,把自己的问题提上去,自动的分诊,这些是机器学习在行业里面的应用。

    我今天主要跟大家开脑洞分享一下这方面的案例、经验。

    我今天的话题就到这里。谢谢!

 

 

Yonghong的价值观:以卓越的数据技术为客户创造价值,实现客户成功。
免费试用