banner

许成钢:用大数据、人工智能去建立计划经济行不通

作者: 大数据观察来源: 大数据观察时间:2017-03-22 13:22:400

许成钢:凤凰财经研究院学术委员,长江商学院经济学教授

编者按:9月23日,“第二届野三坡中国经济论坛”在野三坡成功举行,著名经济学家吴敬琏、普雷斯科特(诺贝尔经济学奖得主)、雅诺什·科尔奈、陈清泰、蔡昉、刘世锦、宋晓梧、陆大道、津上俊哉(日本著名经济学家)等26位国内外重量级嘉宾发表演讲,来自全国各地的听众超过1200人,网络直播观众超过一百万人。我们将逐一推送各位嘉宾的演讲,欢迎读者朋友们关注。

许成钢:用大数据、人工智能去建立计划经济行不通

谢谢给了我这次机会和大家共享一下我对重要问题的看法,我今天讨论的是大数据、人工智能以及计划经济与市场经济的争论。

前不久国务院印发新一代人工智能发展规划的通知,把在中国发展新一代人工智能抬到了最高的战略点。和这个同时普京也发表了重要的讨论,我这里直接引用了普京的话。为什么是这个样子?我们今天讨论的事情和这什么关系?

这里面一个重要的问题是人工智能的产生。我们试图要发展这个技术,但是怎么发展?是从计划来吗?还是从别的地方来?这是第一个问题。第二个问题,人工智能发展了之后,会把我们带到哪儿去?人工智能会把我们带到计划经济去吗?这个就是今天我们讨论的主题。

为了讨论这个主题,我想从最基本的技术的层面开始讨论,因为我们需要理解人工智能是什么意思。人工智能到底能做什么不能做什么,大数据跟它是什么关系。

人工智能与大数据

首先大数据它其实自己没有那么大重要性,它是人工智能的基础,它的重要性在这儿。那么下面我们来看一下,如今之所以不但中国、俄国,世界上所有的发达国家都高度的关注人工智能的发展,原因就是,现在已经很清楚这是一次正在兴起的产业革命,这是刚刚在开始阶段,这个产业革命会引起来重大后果。立即能看到的就是大量的无人工厂会产生,许多行业会变成无人的,包括服务业。会有非常高的效率,人类历史上从来没有见过的高效率会产生,会导致大量失业。

那么由于人工智能这样的发展,借助的基础是大数据,因此大数据变成了和人类历史上过去经历过的原材料、能源等等一样,变成了一个基础的资源,但是这个资源不一样的地方就是它不是原来就在世界上存在的,而是我们人工去收集的。

下面的问题就是当这种生产模式发生基本变化的时候,这种全新的自动化,全面的自动化,当这个生产的基本模式发生变化的时候,它会不会从基本地方改变制度?我这里面想非常简要的概括一下,我们需要吸取过去已经发生过的,产业革命的教训。如果我们不吸取过去的教训,那我们会重蹈覆辙。

过去的产业革命带来了巨大的教训。产业革命是好事为什么会有教训呢?之所以带来教训,就是当这些产业革命产生的时候,人们过高的估计了这个产业革命可能到什么地方,在过高估计人自己力量的时候,人会滥用这些新的科学和技术。

我这里面就历史上的事举两个例子。第一个例子是,在第二次产生革命时期,在那个技术革命性发展的背景下,产生出以国制为基础的中央计划经济这样一类的想法;以后在人类三分之一的国家建立了这样的制度。这个想法的基础就是过高估计了人的计划能力,过高估计了的人的统治能力。

另一个例子就是对环境的破坏,比如说巨大的水利过程,比如说碳排放造成的全球变暖等等。50年代的中国虽然很落后,但曾经从那个时期的外面的思想界学来一种口号,叫“人必胜天”。人怎么能胜天呢?这是过高的估计了人的能力,所以人以为人可以制造世界上最大的人工湖,人可以控制水流,以为人可以按照人的意志来改变环境。

但是早在二十多年前,国际间已经有了普遍的共识,就是造人工湖对环境的伤害经常是我们没有预计到,它的伤害往往超过,或者远远超过它带来的好处。因此在国际间同行里,普遍的不鼓励再制造巨大的人工湖了,比如说造水坝,最大的水坝。

另一面就是化石原料,整个的化石原料大规模的消费,是伴随着第一次和第二次产业革命来的,今天造成了全球的碳排放的高过,全球变暖,带来一系列污染,现在人们已经意识到了。现在到了时间需要扭转,这都是过去带来的教训。

今天当大数据和人工智能结合在一起的时候,它可能带来的危险我们很多还不知道,比如说政府或者带有垄断性质的大公司,利用手中的数据试图来控制社会,用这个方式进行大规模的战争,用这个方式用于犯罪等等。

人工智能的科学技术基础

下面我们从最基础的地方来认识一下人工智能和大数据,我们只有知道了它的技术基础,才能更确切地知道,它能做什么不能做什么。我们说一下人工智能科学技术基础是怎么一回事。今天人工智能的大发展,实际上是过去半个多世纪的发展积累出来的。首先人工智能第一个重要的部分是算法,而这个算法是早在1950年代就开始提出,设计,就开始探索了。关于人工智能的提法,关于这些算法和想法,一些指导性的意见,是很少几个创始人在1956年的时候他们在一次会上把这个名字确定下来。其中重要的奠基人之一是我们的同行经济学家西蒙教授。西蒙是经济诺贝尔奖的获得奖。在卡内基梅隆大学,他同时是经济学教授、计算机教授和心理学教授,这三个行统一在一起,才有了人工智能的方向性的想法。

人工智能里边的算法部分中,如今发展的最好的是所谓的神经元模型,神经元模型使得机器可以在人的指导下进行学习,所谓的深度学习就是今天通常人们讲人工智能的时候所提到的东西。人工智能的另外一个普遍使用的和探索的方法是统计算法,但是无论使用的是人工训练学习的办法,还是使用的统计办法,都必须有大量的数据,这就是为什么大数据是基础。

人工智能的第二个基础是计算能力,在过去的半个世纪里面计算的速度和计算的能力和存储能力基本上是每两年提高一倍,如此的发展持续了半个世纪以后,现在超强的计算和存储能力,使得无论使用任何一种计算方法的人工智能,在一些领域里,机器大大超过人。这里边一部分是因为算法,一部分原因是因为计算能力,当然所有的这些基础是大数据。

下面我们就需要理解一下,大数据本身的技术基础是怎么回事,因为我们从这儿开始明白人工智能可以做什么不可以做什么。首先大数据产生的最基本的基础,或者叫做原始的大数据基础是传感器、移动设备,是它俩先检测到一些具体的数据,然后是通过互联网和物联网把它们传送,然后才能集中起来。所谓的大数据,里边的核心就在于收集、传输、储存和处理。所有传感器和移动设备可以度量的数据,可以度量是关键所在,决定了人工智能可以做什么。这个东西是不是可以度量的,没有数据,人工智能就无法做。

当然另一层面的大数据,是利用历史上积累的大量文献,其中包括各个学科积累的,比如说图书馆,图书馆里的有文字的,有图的,有音乐,有舞蹈的,这些都是记录,这些东西全部我给你转化成大数据供机器去学习分析。

深度学习的人工智能

所谓的深度学习的人工智能,今天讲人工智的时候,多半讲的是这个。所谓深度学习的人工智能,它的技术基础是用大数据来训练机器,来产生识别的能力、推理能力、规划的能力等等。人工智能里包括规划。这里我强调一点,在英语里规划和计划是同一个词。因此,技术上,人工智能里边的确,从一开始发展,里面就包括规划的内容。但工程技术,管理技术讨论的规划,和经济学中的计划,是完全不同的概念。

下面我简单讲几句算法。所谓的深度学习其实是一种算法。这个东西从一开始产生,我刚才讲了奠基人之一是经济学家,从它刚一产生就同经济学里的决策理论密切相关。换句话说,至少在诞生阶段,作为基础,它是决策理论的一部分。首先看看设置它的算法的起点。作为人工智能的设备,我们可以把人工智能理解为机器人。作为机器人的设计者,你要为你的机器人分配一个目的,就是你造的这个机器活在市场上干什么,它的目的是什么?如果我们讨论的是专用机器人,问题简单。下棋的机器人,目的是赢。翻译的机器人,也简单,目的是翻译准确。但如果我们讨论的是通用的机器人,就产生了基本问题。在形式上,它的目的和我们经济学家讨论的人是一回事,它要寻求它自己效用的最大化,或者寻求自己利益的最大化,那就是它的目的。问题是,什么是它的效用函数?

经济学家虽然抽象的可以写出人的效用函数,但是没有任何一个经济学家真的知道世界上人的真实目的是什么,什么东西影响其行为等等。抽象的说,人的目标是为了幸福,是为了愉快等等,但是什么东西影响了人的幸福,什么东西影响了人的愉快,没有一个经济学家真的知道。这就是为什么市场基本重要的,是靠着市场,在市场人的行动才揭示出他们的行为。今年诺贝尔经济奖得主的理论中的人会更依赖市场。因为,这些人自己都不完全清楚自己是怎么回事。

人的智能与机器智能

下面的问题是如果有了大数据,有了超级聪明的人工智能,有没有可能通过大数据把它算出来?有没有可能通过收集巨大量的,从来没见过那么多的数据把它推算出来,把它给模拟出来,有没有可能?

那么我们下面就要往人的智能和人造的智能分别看一下。首先人的智能从哪里来?人的智能是产能于人的生理的和心理的感知,以及人自己收集的信息。西蒙教授1978年获得诺贝尔奖(1975年获得计算机科学的图灵奖)非常重要的一个原因是关于识别(也翻译成辨识)的概念,这个识别的概念是今天人工智能的核心基础概念。西蒙教授早在1950年代讨论人工智能的时候,当时就已经有过辩论,关于所谓的冷识别和热识别的区别。什么是冷识别和热识别呢?冷识别可以理解成是机器能够识别的。什么是热识别呢?热识别是人带着感情的识别。人带着感情的识别机器是学不来的。再一点就是今天讨论人工智能也好,讨论经济和管理中的激励机制问题也好,有一个非常重要基本概念,就是硬数据和软数据。什么是硬数据呢?硬数据就是前面我提到过的,所有可以度量可以传递的数据。但是永远和硬数据对立的一部分是软数据。什么是软数据呢?就是这些数据是没有办法用传感器度量的,无论传感器也好、移动设备也好,没有办法度量。如果不能够度量就无法传递,所以当我们讨论人工智能是基于大数据训练出来的时候,这种热识别的问题软数据的问题,从技术上决定,它面对基本困难。它连基础都没有,上哪儿去学?这就是为什么机器不是人。

再有一点,人的智能里边有一个基本部分就是直觉,什么是直觉?直觉是基于人对于硬数据和软数据、冷识别和热识别综合在一起产生出来的人的一种高度的抽象的跳跃性的反映,这种直觉不但他依赖的数据是不可度量,不可传递,而且产生的直觉的机制本身,也是人无法描述的。这就是为什么师父带徒弟不一定带得出来。在学术领域,好的教授之所以好,因为好的教授有更多好的直觉。但是如何产生好的直觉,这几乎是无法教授的,是传递不过去的。甚至,已经想出来的直觉传递过去都有困难。学生能不能产生直觉,是老师没有办法的,是不能训练的。

所有这些我想讲的就是人的智能和机器的智能中间有一个鸿沟。人工智能它的基础,我再重复一遍,就是可以度量,可以描述,可以传递的数据,你得满足这几个条件,有这个数据,才能训练。

但是如果我们去看一看,什么东西是可以度量可以传递?哪些东西可以,哪些东西不可以,首先在生物科学上,我们知道有一系列的人的生理的感知,由生物科学已经决定了告诉你,这些东西是无法度量的。我这里只举几个例子,嗅觉、味觉、性欲,这些东西都是无法度量的,没有度量的东西就意味着无论你造出来机器人计算能力有多强,它的算法有多么优秀,它这个感知是没有的。所以你永远造不出来一个机器人来代替品酒师来品酒,因为它没有嗅觉,生物科学告诉你这东西没办法测,测不出来,所以你不能说在网上传嗅觉过去,你不能在网上传味觉过去。性欲也不能度量,而且比这还复杂。

再一点,人的心理感知也是无法度量的,心理的感知就包括人的喜悦、厌烦、痛苦、思念、怀旧、贪婪、野心等等,这些生理的心理的内容是怎么产生,怎么演变的,为什么每个人是不一样的等等,这些东西都是机器不可能从传感器的原始数据中能学到,或者能模仿的,因为不存在这样的数据。

那好,那我们现在看一下,现在实际对机器人的训练,就是实际对人工智能的社会训练是怎么做出来的。当不存在这些原始数据的时候,它实际使用的是刻画某一些方面的软数据的间接方法,比如说文字描述的行为,文字记录对某个行为的观察,比说录像,比如这个人在什么情况下都干什么都录下来,然后用机器识别录出来的你各种各样的行为,用这个来学习。用这个方法,今天我们看到机器人达到了了不起的水平,指的都是这个状态。

但是这里面有什么问题?这里边第一个问题就是片面的,第二个问题就是静态的,静态指的是你看到的是过去,你不知道将来。当没有汽车的时候你说买汽车你怎么知道它是汽车,你不可能知道。没有手机的时候,你说我要发明一个手机,它不可能知道如何反应,因为没有见过,没有训练。

因此,深度学习这种人工智能,它最终不涉及学习人的智能的原始基础要素,因为它缺少大量人的基本感知,当它没有这个基本感知的时候,这个机器没有可能通过学习来产生和人相似的智能。我刚才前面讲到的,任何的一个人工智能的机器设备或者机器人,在设计它的时候,第一重要的,最终重要的是,人造它的目的是什么,要他“活着”干什么。人和动物,是依赖自己原始的感知,慢慢学来的。但人工智能是你没有可能像人和狗一样,自己找到最基本目的的。学不来的原因是缺少原始基础要素。因此只能是由设定它的人分配它。

但是人分配给它,我刚才讲了,人的效用函数是什么,这是经济学家从来不知道,一直争论的问题。因此人可以分配给机器的效用函数,没有可能是人的普遍函数,它只能是在一个狭窄范围里定义的和静态的。

这里静态的意思是可以预见的时间,不一定是完全静止的。从广义上讲,我这里有个简单的结论,就是任何的人工智能设备或者机器人,由它的目标函数的性质决定,它不是也不可能代替真的人的自身目标。

当年西蒙获得诺贝尔经济学奖的时候,有一个非常重要的基本概念一直影响到今天经济学的发展,而且是今天经济学发展的最前瞻的东西,他把这个东西叫做有限的理性。有限的理性是当初讨论计划的时候认识到的问题,我们永远是片面的,今天我们讨论机器人的时候,你分配的机器人,你给它一个效应函数它一定不会比你更好。

结论性的意见就是,生命科学和人工智能的基本原理决定,人没有办法训练没有一些基本感知的算法,通过训练产生或算出真人的心理偏好,和他们的动态的目标行为。今天我们见到的深度学习的人工智能,实际上它只限于训练模仿人在已知环境里的已经有的行为,因为这靠的是已知的环境收集的数据。例子包括市场中的消费者行为等等。环境决定人的行为,因此决定数据,因此决定训练出来的机器人。比如说面对一个知音者,面对一群知音者,音乐家的表演行为,与面对厌烦音乐的听众时的表演行为不同。在自由环境里参加讨论的人的社会行为与在受限制的环境的人的讨论的社会行为,是不同的。还有,如果你收集的数据是在文件里面,那你收集到的行为就是在文字环境里人的行为是什么样的。所以,实际上是已经有限的,已经限制在已有的制度里的人的行为。拿这些数据来训练机器人,机器人可以模仿在相似状态下的行为。一旦脱离了训练它的环境,这个没有原始感知能力的人工智能,要么没有办法应对,要么其反应与人的反应没有多少关系。

人工智能能干什么

到底人工智能能干什么呢?能干的事非常非常多。刚才我们讲的是它不能干什么,它能干的事就是它可以在为达到规定的目标,进行规划,执行。但是它能够规划和能够执行的事儿必须是清晰目标的。在这个背景下,我们看到的人工智能的革命,它会在什么地方产生出来?它产生在所有人能想象的,能准确规定目标任务的这些领域。

比如说下棋,下棋目标很清楚,就是赢对方,这个目标很简单,计算起来很复杂但是目标很简单,但是人类碰到大量的的事不是那么很简单。开车,开车目的地清楚,规则清楚。开飞机、开船等等。甚至根据设计来制造产品,他甚至可以设计产品,你只要把目标搞清楚。

只要目标清楚,人工智能甚至可以规划、设计、制造、执行成体系的产品和服务。它可以根据规定的目标,来设计产品的设计图,包括产品和服务合在一起的综合体系。在全面自动化的情况下,由于全面自动化产业没有人了,在无人的情况下,工厂里人的激励机制问题会自动消失。

另一方面,当跟人有关的时候,它可以是非常好的助理,它可以是非常好的助教、助理研究员、金融分析助理、医生助理、律师助理、军事参谋助理等等各种助理,为什么这些都是助理?因为在目标不能确定的情况下,它没有办法完全代替人。实际上作为助教,最近在美国已经做了大规模实验,就是在美国一所很好的大学里,IBM把他们的机器人送进去做经济学助教。一个学期之后,学生分不出来哪个是真人哪个是机器,当然他们规矩是真人和机器人助教都不面见学生,助教们只用计算机跟学生谈话,助教会开玩笑,会解题等等,但是它必须只能是助教不能是教授。为什么?因为有大量的重要的信息缺失,无从训练人或机器人助教。实际上这些助教们一直是在教授的指导下工作。

从技术上看,在最乐观的情况下,总体来说如果有明确规定的,狭窄的目标,最终人工智能机器人应该都会做,包括战争。当然这是一个严重争议的问题。在最乐观的情况下,人工智能最终是可以规划和执行企业和军事的任务,这里就回到今天最大的主题上了。我想强调一下,第一,军事任务和经济任务本质不同,为什么?因为军事任务的目的简单,打胜仗。而经济任务的目标无法确切规定。经济的目的是人民的福利,国民福利,而不是GDP增长。但是什么叫国民福利?国民福利指的是全体国民的感觉,幸福感。这连我们人也搞不清,无论是数据还是算法都搞不清。所以没有可能用机器做。另外一个就是企业治理和国民经济是有本质的不同,因为企业追求利润。而国民经济是国民福利的问题。

消灭市场与人工智能存在的基础相悖

最后,到底有没有可能人工智能大发展以后,计划经济就能代替市场经济呢?这个结论非常简单,我刚才已经讨论了人工智能的基础,我们知道数据从哪里来,数据从市场上来。人工智能对于人的行为的了解是人在市场上的行为。如果把市场消灭了,人在市场上的行为的数据就没有了。如果有人说,我现在收集了无数的数据,原来人类历史上没见过这么多数据,有了这以后我对所有人的行为就全掌握了,就不用市场,可以计划了,那就完全搞错了。因为把市场搞掉以后,人工智能了解的人的行为的基础就没有了。人在市场上的行为和在配给制中的行为基本不同。

还有最重要的一点,当把市场搞掉了之后,如果试图用人工智能的方式去解决资源配置也一定搞错了。为什么搞错了呢?尤其是在跟创新相关的资源配置问题上,原因就是因为跟创新相关的资源配置问题,我们通常在市场上叫金融问题,大量问题是由风险投资做的,为什么是他们做的呢?因为他们掌握大量的软数据,他有大量的直觉,他可以凭着他们的直接进行判断,而人工智能只能处理硬数据,它没有这个直觉,所以它没有可能产生这个判断。

最后我们看一下,今天实际上人工智能的人才在哪里?截至今年的第一季度,全球人工智能领域人才一共190万,其中中国5万,而这5万人里面已经干这行干了十年的,达到十年的不到40%。全世界有85万人在美国,而美国的85万人,能达到十年以上的占其中的71.5%,这原因很简单,是在市场和环境下才有这么多有创新能力的人口出来,你把市场的环境搞掉,创新是很难发展的。

最后我总结一下,大数据和人工智能它跟制度之间有非常深刻的关系。首先制度会深刻影响大数据和人工智能的发展,原因是因为大数据的收集和处理会受到制度的制约,比如说哪些是合法的,哪些是非法的,是不是得到支持,或者社会上是没有反弹。比如说一些例子,包括隐私权,跟隐私权相关的就是掌握技术的有垄断权的大公司,或者是政府对相关问题的控制,以及当政府来控制数据的时候,政府与公民、企业、社会之间的关系等等。或者是企业试图控制的时候产生的这些关系问题。

另一面,人工智能的发展本身也受到制度的制约。比如说在发达的经济里边,当你的人工智能要发展的时候,有一系列已经存在的行业要被淘汰,当你要淘汰这些行业的时候,你这个制度是如何面临这个问题,会有冲突,制度是如何面临这个问题。

再一个,一个不平等的社会,它对平等和不平等都会对人工智的发展有造巨大的影响。原因是因为人工智能的方法会造成巨大的人员失业,一个更平等的社会会更有能力解决这个问题,而一个不平等的社会会引起非常尖锐的社会矛盾,这个社会矛盾本身会阻碍人工智能的发展。

最后给大家强调一下,中国面临最大的问题是制度问题,当把力量都集中到产业升级的时候,实际上是没有真的解决中国面临的普遍性问题。

我就讲这么多,谢谢!

(本文是作者9月23日在“第二届野三坡中国经济论坛”上的演讲,已经本人审订,转发务必注明出处。标题为编辑所拟。)

banner
看过还想看
可能还想看
热点推荐

永洪科技
致力于打造全球领先的数据技术厂商

申请试用
Copyright © 2012-2024开发者:北京永洪商智科技有限公司版本:V10.2
京ICP备12050607号-1京公网安备110110802011451号 隐私政策应用权限