banner

深度学习:模仿人脑还是完善大数据的分类和预测应用

作者: 大数据观察来源: 大数据观察时间:2017-06-25 14:50:330

近期,机器学习领域专家们关于深度学习的一些言论引起了极大的轰动。同时,关于深度学习的开创性和整体架构也在学术界引发了相当的讨论。伴随着人工智能开始进入进一步开发应用阶段,人们意识到它的成功与否完全取决于其实用性。

星期二,我和IBM沃森研究中心的副总裁John Gordon先生有过一次半个小时的专访。在专访中,Gordon先生从始至终都不认可人们对人工智能系统“沃森”的预期和它实际能做什么之间存在相当的差距。虽然在我和Gordon先生之间存在必然的误解,但很明确的一点是:Gordon先生相当看重下面一点的积极作用——学习和使用“沃森”系统的软件和云接口是一件相当容易和愉快的事。它对开发和完善新的应用有着巨大的帮助。

Gordon先生的观点最初让我很不解,但是,当我深入思考之后,我开始接受他的观点。正如Gordon先生所述,在不久之前,“沃森”系统还只是给少数IBM内部博士级科研工作者们的工具,但现在,任何人都可以用它来测试自己的应用软件和数据。人们并不需要斤斤计较这个系统能否提供人工智能,人们愿意使用云服务的关键在于这个系统到底能不能帮人们实现他们需要的工作。

第一批“沃森”系统上的应用程序开发接口。Thefirst set of Watson cloud APIs on IBM Bluemix.

这一情形正发生在当前人工智能最火的领域——深度学习。深度学习是一个有着深远意义的领域,而不仅仅是一些夸张的说法。IEEE spectrum(杂志——电气电子工程协会综览)最近采访了机器学习领域的专家——加州伯克利大学的教授Michael Jordan先生。在这次访谈中,Jordan先生专门针对这个领域的一些误解予以了澄清。

Jordan先生的言论可归结为如下:深度学习并不是那么具有革命性的新技术。它只是对某些应用能提供帮助,而不是来模仿人脑工作。那只是一种不太准确的比喻。(后来Jordan先生在另一天对大数据也阐述了他的看法,其后还在博客上对一些对他观点的误读作了进一步澄清。在更早的九月份,Jordan先生在Reddit网站的一个栏目“Ask MeAnythin”也发表了他对深度学习的看法。)

Jordan先生可能在很大程度上是正确的,对我们大多数非科研工作者来说,明白这些模型具体怎么工作或是了解是否这些研究人员在夸大其结果的意义都没有什么实质的作用。YannLeCun先生(一名纽约大学的研究人员,Facebook人工智能项目的经理)在Facebook上针对Jordan先生的言论评述道:

“深度学习本身和那些被证明有效的模型并没有任何问题。虽然那些模型背后的理念在80年代就已经被提出。这并不意味着在这些理念基础上建立的模型就没用了。”

近来,深度学习由于其在模式识别方面的巨大作用激起了人们的广泛兴趣。只要它还在语音识别,图像搜索,文本短信和用户推荐等方面进一步发挥作用,人们的热情就将继续下去。从某种程度上来说,它的意义在于它的实用性,就像我以前说过的“深度学习更像复合木地板一样,因其简单实用,而得到广泛认可。从这个角度来看,它并不像人类大脑里的神经元。”

200多名听众聆听了百度首席科学家Andrew Ng 在“人工智能的未来”上关于深度学习的讲座。Biz Carson/Gigaom

About200 people showed up at our Future of AI event to watch Andrew Ng of Baidu, andothers, talk about deep learning. Credit: Biz Carson / Gigaom

深度学习更让人感兴趣的在于它的各种模型在如此短的时间里从科研试验室进入到普通人手中,并被开发成各种各样的新的应用程序。现在已经涌现出基于深度学习的各种开源工具(包括word2vec,deeplearning4j, H20和Caffe),商业软件(来自于各大公司如GraphLab,Nvidia,Ersatz Labs和微软)和大量为应用开发者准备的针对特定任务的应用程序接口(来自于如AlchemyAPI和Clarifai一类的公司)。

同时,Gordon先生进一步表示语音识别和计算机视觉也会逐步进入“沃森”系统的开发范围。

由于大量开源应用的出现,深度学习在上述应用(语音识别,计算机视觉,甚至可穿戴技术和机器人)中得到了更为广泛的应用。商业界和学术界都同时在深度学习的基础上对这些领域开展了更广泛的研究。而在以前,商业界和学术界通常是专注于不同的方面的。

深度学习并不是能解决一切问题的革命性人工智能技术。若真是如此,人们何必还要继续在量子计算机和人脑系统上花费时间和精力呢。为此,Oren Etzioni(阿伦研究院人工智能项目CEO)(编者注:阿伦研究院是由——微软创始人保罗-阿伦捐助的专注于人脑领域的研究机构)在9月Gigaom’s的“人工智能的未来”研讨会上,就利用深度学习完善分类算法和那些能回答更深程次问题的智能算法之间的区别作了一个专题讲座。

所有的技术,当它们从试验室出来进入到开发应用阶段后,它们唯一的评判标准就是有用与否,“沃森”系统和深度学习也不例外。

OrenEtzioni (Allen Institute for AI) on building intelligent machine

https://www.youtube.com/watch?v=E_6AZ8slivc

“深度学习通过对大数据的分析来实现对研究对象的分类和预测,从而完成对问题的“是”或“不是”的回答。但是,大量的问题是不能简化为“是”或“不是”。同时,大量问题也不能简化为简单的若干个变量分析(比如电影推荐,自主发tweet)。很多问题需要建立更为复杂的能‘自我构造’的理论——这个理论应该是多层次的,能自主题曲学习知识,然后萃取出新的理论,做出合理推论导出新的结论。这一类问题包括“算术学习,国际象棋,理解语言”。尤其在理解语言方面,机器需要了解相当大量的相关知识才可能真正懂得语言所要表达的意思。当前相关知识的机器学习方面还很缺乏。同时,人工智能在自我提取,学习相关知识方面也还很欠缺。综上所述,当前的深度学习主要完成的是对大数据的分类和预测。要进一步发展基于大数据的人工智能,需要更为复杂的模型。这些模型要能完成从大数据中提取相关知识,学习了解相关知识,萃取出新的理论,做出合理推论,进一步完成对新问题的回答。”

很多专业人士花费了大量时间来定义云计算或大数据,更多的非专业人士(非分布式系统专家)却在忙着开发各种基于上述的应用。这些人并不是这方面的资深人士,他们只是由于热情和兴趣并在合适的时候进入了些个领域。这些人开发出来的应用可能有各种各样的问题,但很多时候并不妨碍它给人们以帮助。很多系统(如AmazonWebServices和Hadoop)在才出现时都有很多缺陷,但他们都得到了广大用户的支持,仅仅因为他们能帮助人们做一些事情。有些技术(如Docker和Kafka)现在已经从主流技术新闻上消失,但他们还是在不断吸引新的用户。

当前,普通用户们起着关键作用,用户来通过他们的实际使用来决定谁是赢家。深度学习不是一个高深莫扯的“天网系统”或全新的“神经科学”领域,所以,虽然学术界还是在决定科研的方向,但对广大开发者和用户来说这已经不重要了。

归根结底,一项技术如果有用,人们会努力去完善它,如果它没用,或者有更好的技术出现,这项技术就必然会萎缩直至消亡。将来,深度学习可能也会被人们遗忘,但肯定不是它没有得到应有的炒作,而是因为它在那个时候已经不能满足人们的需要。

banner
看过还想看
可能还想看
热点推荐

永洪科技
致力于打造全球领先的数据技术厂商

申请试用
Copyright © 2012-2024开发者:北京永洪商智科技有限公司版本:V10.2
京ICP备12050607号-1京公网安备110110802011451号 隐私政策应用权限