banner

天云融创CEO雷涛:大数据如何改变互联网金融产品的设计思路

作者: 大数据观察来源: 大数据观察时间:2017-05-26 18:58:460

互联网金融的浪潮中,每一位新生军都希望把科技创新和金融业务完美融合。而作为一把利剑,数据可以改造金融的流程,定义一个新的零消费市场。

但驾驭这把利器的前提是,你需要懂得行为数据如何发挥比资产数据更大的价值,以及内部结构化数据如何在数据科学下重新资产化。这也是天云融创数据科技有限公司CEO雷涛,一直在思考的问题。

下面是雷涛在第一财经年会·互联网金融产品峰会上的演讲。

雷涛:大家下午好,很高兴有这样一个机会跟大家交流。今天我们产业互联网军跨界来到这里,希望把科技的创新和金融的业务内容融合在一起。数据怎么改造金融的流程,定义一个新的零消费市场。

我今天跟大家汇报两个内容。第一,行为数据如何发挥比资产数据更大的价值;第二,内部结构化数据如何在数据科学下重新资产化。

互联网带给我们便捷的方式和手段,使我们的交易成本变得更低,对现有的金融业务实现了更优化的配置,以更低成本的提交,发挥了互联网去媒介化的作用。这里面会形成网银、电子支付、P2P撮合交易等,其中互联网扮演了工具的角色。

我们可以看到今天的市场发生了根本的变化。

传统的金融核心的生产资料还是货币以及资产,把它作为产品化的封装。但今天我们看到数据作为新的生产资料的出现。基于消费者的行为,如在淘宝店的行为痕迹作为获取数据的基础,顾客和生产者不再对立,而这个价值就是数据。

数据搜集了以后,利用大数据技术,可以低成本汇集起来形成生产力。由流程经验驱动,逐步转向数据驱动。金融的属性更多转向风险和定价,从卖方市场向买方市场转型的,这是一个数据金融产品代替抵押物的过程。

以前的数据量很少,因为它是在已经建立了成熟系统的大型的机构里面才能够沉淀的数据。此外支撑某些业务的时的应用系统,通过交易流量产生的数据作为数据副产品。这些副产品作为数据来源的信息被加工出来。

这一块的数据含金量很高,包括支付的数据,支付的数据体量也很大。这些以前只是被作为审计的需求,现在它有新的价值的发挥,一会儿我们看一个案例。

互联网打开的第二个很大的市场空间,是在行为数据上,facebook、谷歌能够赚取较大的利润,靠的是提炼海量数据的稀释价值数据。

这两天我们召开了大规模的产业互联网,产业互联网和互联网区别是碎片化了入口,不再基于流量平台这一目前主导互联网的核心指标。

这些入口是什么呢?刚才太平洋保险讲了我们怎么计算你的生命周期表、怎么算你的寿命。我们现在跟大型的保险机构探索个性生命周期表。蕴含生命体征的行为数据,在可穿戴设备中出现。

来之前我看了一些金融里面提到的行为数据。这两天大盘反馈了一些比较好的信息,对此百度做了一个量化的算法方式,把互联网的行为、搜索框的行为引入,跟广发合作成立了一个量化指数基金。这是怎么实现的,我来剖析一下。

这是一个交易所,我们首先实现的是让海量的信息机器可读。现在已经变成机器产生数据的时代。以前可能是专业的编辑生产数据,媒体的编辑在生产数据(PGC),后来是用户在产生数据(UGC),现在进入了更海量的时代。

右边的这个部分是机器写的,像小学生一样写中心思想,把你这一段的内容抽出来,形成一个缩略。左边一个是数值,做量化,从下面期货的价格你可以看到他们之间的相关性,这些都是对数亿的碎片的信息实现量化。

量化的另一个应用是情绪判断,以前我们给大型的公司做过品牌价值。我们可以看到字的大小表示它的权重。养老是它最核心的主题,左边这个又区分出正向、负向的情绪。这些内容是做了,传统数据库在金融上无法完成的事情,就可以把品牌价值实现有效的量化。这个量化对板块而言,对投资而言,可以做很多的内容。

对于个体数据而言也是同样的,他们把我社交言论的数据也放上去了。基本上能够反馈出我们的内容,左边的数据比较多,每天都是谈工作的内容。右上角用的是hadoop模型,他刻划的这个蜘蛛图用6万5千个形容词变量五六十个性格特征描述这个人。让机器在二秒内阅读一个人的品行等。

这个话题就牵扯到大数据怎么进入到个体端。我们看到现在的FICO,金融属性本身对个体的模型,只覆盖了3亿人。我们怎么去对这个资本进行刻划呢?我们引入了一些KLOUT的描述。你的成功不取决与你拥有什么,而取决于你认识谁。这里强调的是社会。

我怎么提炼加工社会关系呢?资本描述一个人的真实的社会资本。可以通过通话的记录,提炼出行为变量。学习互联网,应该看最核心的内容。脸谱的核心竞争力就是评价信息,谷歌的最核心是网页的质量评估体系。我们如何用这样的方式描绘人与人?我们用这样的算法,把一个省的一千四百万的用户,做了一个大排序。无需预先标识出主要人物,由算法模型来实现迭代,评估每一个人个体与群体中的社会资本。

第一个是筛选出来的,是垃圾电话制造者低跟人工标注的完全一样的,说明算法保证了非常精准的提交过程。在数据魔方里面,我们做了很多的内容。

我们看到行为数据,开始取代资产的数据,我们以前关注太多的数据,是关注含金量比较高的交易账户数据,而现在借助大数据可以处理大量的碎片化的行为。

因为我们本身的商业模式是2B的,我们在为大企业服务过程中看到内部的数据更有价值。很多人关注获取外部的数据,比如用社交数据、论坛的数据,我们发现了内部数据是启动大数据最有效的捷径。

比如说电子帐单的数据,我们以前拿到一个帐单,判断一个人是VIP还是核心的用户,看消费的金额,而现在可以基于语义分类他的消费明细,做更细化的刻画。

这是我们团队的一个博士,他自己的描述,我们把他豆瓣阅读抓下来。

在内部的数据里面,在大数据上时代上,有一个很大的变化,就是在全局和个性化两个方向的拓展。以前在小数据的时代,牛顿把苹果扔下来一定要落下来砸到他,这是经典的力学定律驱动的。近一百年都是在非常微观和宏观的世界里面,我们在突破了传统参照系的世界里做探索。大数据把我们的金融视野开阔,我们开始关注到个体,关注到全局。整个企业的资金的流转性,我们有一个全局的企业金融图谱。

我们对中小微企业放贷,也看资产负债表、利润表、现金流量表这三个表的结构,过去只能用个体历史数据与现在的比较,无法在全局的行业横切面上看。中国四千多万的中小型企业,这个过程使我们失去了全局化的度量标准,我们要拥有这种全局的视图。

个体与群众的关系,群体的智慧怎么形成?生物学家通过观察蜜蜂的行为,蜂巢的形状决定蜜巢的智慧。行为本身成为我们描绘整体事物的本身。这个行为是什么呢?我们在全局的评估里面就用复杂网络去做。我们把所有的经济往来和行为,就像蜜蜂的八字舞一样连起来。

把原来点对点的数据,做成大的网格化。这是一些截图,它事实上获得了更大的企业图谱。以前我们看供应链的金融,是在一次的偶发事件,我拿一个定单做评估替代的抵押物。现在是拿6个月的数据,描述整个的企业图谱。每个企业都量化了,这个企业跟上下游的关系链条。它是基于数据发现的。我知道上下游企业是谁。现在我们是用资金链条,发现很多小规模的链条的企业。

每一个节点与节点的关系全部量化了,做了一个大排序。这些数值计算出来做结算成本的指导依据。这个给的是绝对的坐标值,它提供的是什么?我们给餐饮行业放贷,我了解到的企业,通过供应的链条发现流通数值很高的节点,这个节点我不知道它是什么,它是每天批发胡椒、辣椒佐料给上百个火锅店。他的资金利用率是最高的。这个过程怎么量化?传统意义上是靠经验的评估结果。现在有数据的手段,通过数据本身回答,从中也发现很多的风险的问题,这四个企业实现了闭环的操作,从数据中识别出来有关联交易的可能。

数据本身是有价值的,把视野从金融的流程封装,转向金融数据产品封装,在选用数据的过程当中,不仅要考虑那些密度很高的资产性的数据,也投入视野去看行为数据,它能够客观的反映每一个C端个体客户的价值。

当我们看外部大量数据的时候,历史上自己积累的数据本身含金量很高。以前我们关注的是技术本身,信息在今天有了数据科学的改变,在二维数据结构里面,我们可以用多维去做。这样因为云计算的强计算能力以及数据科学,在结构化的数据上产生新的价值。

就给大家汇报这么多,谢谢。

banner
看过还想看
可能还想看
热点推荐

永洪科技
致力于打造全球领先的数据技术厂商

申请试用
Copyright © 2012-2024开发者:北京永洪商智科技有限公司版本:V10.2
京ICP备12050607号-1京公网安备110110802011451号 隐私政策应用权限