banner

解密微软小冰:大数据为人工智能而生

作者: 大数据观察来源: 大数据观察时间:2017-02-15 16:23:260

7月2日,微软(亚洲)互联网工程院宣布,第二代智能聊天机器人“微软小冰”正式上线,用户可以登录微软小冰官网进行“领养”操作。

那么,微软小冰是个什么样的产品呢?首先,微软小冰是一款智能聊天机器人。除了智能聊天之外,还兼具提醒、天气、星座、交通指南、餐饮点评等实用功能。其次,微软小冰集成了微软在大数据、自然语义分析、机器学习和深度神经网络方面的技术积累,具有非常强大的机器学习能力。所以,微软小冰还是一款人工智能机器人。

【人工智能需要有大数据的支撑】

人工智能主要有三个分支:第一,基于规则的人工智能;第二,无规则,计算机读取大量数据,通过数据统计、概率分析等方法进行智能处理的人工智能;第三,基于神经元网络的一种深度学习。

基于规则的人工智能,即在计算机内根据规定的语法结构录入规则,并用这些规则进行智能处理,缺乏灵活性,不实用。因此,人工智能实际上的主流分支是后两者。而后两者都是通过计算机读取大量数据,以提升人工智能本身的精准度。如今,大量数据产生之后,有低成本的存储器将其存储,有高速的CPU对其进行处理,所以才有了人工智能后两个分支的理论与实践。由此,人工智能就能做出接近人类的处理或者判断,提升精准度。同时,采用人工智能的服务作为高附加值服务,成为吸引更多用户的主要因素;而不断增加的用户将产生更多的数据,使得人工智能进一步优化。

大数据分为“结构化数据”与“非结构化数据”。“结构化数据”专指可作为数据库进行管理的数据,例如,企业的客户信息、经营数据、销售数据、库存数据等存储于普通的数据库之中。相反,“非结构化数据”是指未存储于数据库之中的数据,包括电子邮件、文本文件、图像、视频等数据。目前,非结构化数据激增,企业数据的80%左右都是非结构化数据。随着社交媒体的兴起,非结构化数据更是迎来了爆发式增长。复杂的、海量的数据通常被称为大数据。

但是,这些大数据的分析并不简单。文本挖掘需要“自然语言处理”技术,图像与视频解析需要“图像解析技术”。如今,“语音识别技术”也不可或缺。这些都是传统意义上人工智能领域所研究的技术。

微软小冰也完全是因为有大数据的支撑才实现了人工智能。据网上媒体报道,微软小冰集合了中国近7亿网民多年来积累的全部公开聊天记录,并从中精炼出1500万条语料库,基于数据挖掘与智能搜索,通过理解对话的语境和语义而实现人机问答的自然交互,甚至相当于16岁少女的智商。

【大数据和人工智能结合,将释放出更大的能量】

除了微软之外,Google和Apple也致力于研发将大数据与人工智能结合应用的各类产品。Google提供优化的搜索引擎服务,后台的人工智能随着用户的使用而不断进化,使用的用户越多,搜索引擎将越优化,优化之后,用户自然也就更多。除了搜索引擎,Google还通过Gmail、Google Docs等获取大量的“非结构化数据”。这样一来,Google的“大脑”就变得更加聪明了。此外,Google还研发了“语义搜索”的进化系统。Apple的语音识别技术Siri也是基于最新人工智能理论(深度学习)构建的。反过来看,现代的人工智能进化,不仅需要理论研究,还需要大量的数据作为支撑。

2014年年初,Google联合奥迪、通用、本田、现代以及Nvidia成立了一个新的合作团体——开放汽车联盟(Open Automotive Alliance);而Apple在2013年6月就开始涉足汽车领域的人工智能,推出了“iOS in the Car”技术,通过Siri语音操作可以实现导航、通话、音乐播放等服务。最近,Google又宣布将于2017年向市场投入自动驾驶汽车,截止到2013年8月,已经完成了48万公里的试驾。48万公里试驾的大数据成为行驶经验数据,为人工智能的自动驾驶提供了决策分析依据。

未来,所有产业领域,都将通过人工智能以及基于人工智能的机器人,实现智能化。人工智能将成为创造高附加值的重要来源,发挥巨大的作用,很有可能超过已经对全世界造成巨变的“互联网革命”,其影响将是巨大的,也将遍及社会各层面。Google和Apple已经给汽车等传统行业带来了深深的危机感。而他们的颠覆式创新,其实是来自大数据与人工智能的结合。或许这一点非常值得我们思考。同样的现象、同样的颠覆会不会发生在更多的传统产业中呢?

6月12日下午,笔者曾经在政协第二会场实况观摩了全国政协第13次双周协商座谈会。当时,九三学社中央副主席赖明主题发言提出建议“尽快实施大数据发展战略”。笔者希望人工智能能够成为大数据发展战略的落脚点之一。

banner
看过还想看
可能还想看
热点推荐

永洪科技
致力于打造全球领先的数据技术厂商

申请试用
Copyright © 2012-2024开发者:北京永洪商智科技有限公司版本:V10.2
京ICP备12050607号-1京公网安备110110802011451号 隐私政策应用权限