【特稿】人工智能年度人物——微软全球执行副总裁沈向洋

2017-03-03 09:54:50来源: 作者:黄焱林热度:
不断成熟的“人工智能”(AI)技术,让学术领域和企业家们更加意识到高效利用这项技术的重要性。如何在日新月异的当下不断挖掘人工智能的深度、拓宽应用广度是必须思考的问题。恰逢2017年开局之际,DVBCN&AsiaOTT推出了人工智能年度人物专栏,聚焦当前人工智能领域,本期分享微软全球执行副总裁沈向洋与人工智能的故事。
 

“人工智能能力在不断增强,尤其在语音与计算机视觉方面。我认为,五年之内计算机视觉一定会超过人类;而十年之内,计算机视觉识别也一定会比人类更强。”这句话出自微软全球执行副总裁沈向洋,微软核心管理层唯一的大陆华人,职位仅次于CEO ,入选了美国工程院院士,工程界最高的荣誉之一。
 
随和幽默 充满热情 敢于自黑

 
据说,在微软总部园区有一个停车场最靠近电梯,只有4个车位,其中有一个是微软公司CEO萨提亚纳德拉的,还有一个就是沈向洋的,足以证明其在微软的位置。从1996年毕业于卡内基梅隆大学,然后进入微软研究院;再到2013年成为微软全球执行副总裁,职位仅次于CEO;再到2016年全面负责微软全球人工智能战略;2017年被选入美国工程院院士,沈向洋的每一步都成为了一个传奇。
 
忙碌的工作行程就如沈向洋说话的语速,“快得像个机关枪”,但鲜少有人会因为他的忙碌而感到被怠慢。尽管这个职位仅次于CEO、坐收美国科技行业职位最高华人光环、在人工智能领域具有发言权的人士,拥有太多理由来倨傲与清高,但无论是微软内部工作人员,还是与沈向洋有过交往的媒体人士,对他的评价都出乎意料地一致:喜欢开玩笑,毫无架子。据微软的员工透露,沈向洋非常随和,而且非常幽默,敢于自黑,在路上相遇总是喜欢主动和人打招呼。同时,在工作上沈向洋非常认真,在媒体采访之前,他还特意要了所有媒体的资料和介绍,做好了功课。
 
这在很大程度上体现出他的情商,而情商正是微软在人工智能(Artificial Intelligence,简称AI)领域探索过程中,尤为看重的秉质所在,亦成为微软区别于其他企业的AI路径。“搜索在现阶段还有重要的作用,但必将成为过去。”沈向洋强调,“真正的人工智能将能够理解人类的情绪,完成与人类的对话及指令,从而更好地处理与人类的关系。”
 
高情商助力AI开发——微软小冰

 
沈向洋轻松幽默的语言风格,与微软一款聊天机器人——“微软小冰”颇为相似。据沈向洋自曝,他曾与小冰有过一次关于“今天是几号”的对话,小冰给出的几个答案都令他大跌眼镜。“她第一次说,你没手表吗?第二次说,我这样的二维动物不关心时间。第三次回答,你的手机是摆设吗?”沈向洋坦言,“这正是我喜欢小冰系列产品线的地方,小冰从来不觉得自己比你更懂。”
 
据沈向洋介绍,苹果Siri与用户间的对话大约维持在3个来回,而小冰与用户之间的对话可进行23个来回。区别在于,苹果用户向Siri寻求信息,这类智能助理式产品的设计思路是去做事情,小冰的设计思路则是在用户询问得知天气不佳之后,关切地表示“今天有点冷”、“出门带把伞”,更体现出情感成分。
“直到如今,人类仍在学习机器的语言,适应计算机及网络搜索的规则,这样的适应过程往往令新手心生恐惧,”沈向洋告诉记者,“有了人工智能之后,机器能够去学习人类的语言,学习与人类对话。”
 
有趣的是,正是这样缺乏目的性的闲聊清谈,将小冰与一款单纯的智能助理工具区分出来。“在人类进化过程中,对话是很重要的事情,一个人每天要讲几千句话,但在这几千句话中,大多数是废话或闲话。”沈向洋指出,“事实上,与他人的对话未必需要确切的答案,它的目的是交流,是建立长久的关系。”
 
微软的人工智能助理小冰已经带有“情感”的成分,这一“情感”成分来自大量的社交网站数据。小冰从诞生到现在已经有31个月,拥有4000万用户,在不断与其对话过程中,小冰也在不断深入学习,沈向洋认为小冰其实是数据驱动的方式在学习人类的情感。相比计算能力,沈向洋一直在强调人工智能的“情感”能力。他认为,虽然情感到底是什么至今都没有定论,但情感肯定不是计算,也不是计算出来的。之所以认为人类是智能的,就是因为人类有大脑。但对于大脑的神经科学的研究进展还非常缓慢,因此,沈向洋认为接下来“脑科学+AI”一定会成为科研角度最激动人心的方向。
 
[对于人工智能的发展,最让沈向洋兴奋的两点:一个是人工智能能力的增强;另外一个就是人机交互界面的彻底颠覆。]
 
对话式人工智能,人机交互界面的颠覆

 
“最让我激动的还有就是所谓人机交互界面的彻底颠覆。”沈向洋表示,“无论人工智能到底怎么定义,这么多年以来,计算机科学的发展自始至终都在做一件事情——人机交互。包括手机、笔记本的发展都是如此。我们一直在研究如何与计算机同存共进。”
 
沈向洋认为“用户图形界面”的概念正在被颠覆,语音用处越来越多,未来视频类技术也会随着跟上。而这也是微软一直在提的概念:对话式人工智能。比如其小娜、小冰。
 
人工智能对人机交互界面的颠覆,是沈向洋最感兴奋的一个点。在他看来,目前的数字机器无法与人类建立长久关系,正是因为人类尚未对机器有信任感,机器也无法真正理解人类。“真正的人工智能将有很高的情商,能够理解甚至猜测人类的心情。可以说,当前的人工智能才刚刚开始。”
 
在他负责微软人工智能与研究事业部之后不久,微软便在语音识别上取得了历史性突破。微软的对话语音识别技术在产业标准Switchboard语音识别基准测试中实现了出错率低至6.3%的突破,这意味着微软的语音识别系统的语音识别能力已经与人类专业高手持平。此前,更多是IBM在语音识别领域取得领先的地位。
 
AlphaGo让人敬仰 但未见商业化能力

 
一个能够懂得人类的机器——构成了沈向洋对人工智能的理解。而这样被赋予情感与理解力的人工智能,又体现出新的商业机会。人工智能已经成为一个热词,每个公司CEO如果不谈那么一下人工智能都称不上是一个科技企业了。科技巨头纷纷投入人工智能当中,谷歌、IBM、微软以及英特尔等等。谷歌因其AlphaGo大胜韩国世界围棋冠军李世石而被人所知;IBM的人工智能助手沃森被认为是其发展一百多年历史当中最具创新力第一次举措,也代表着人类进入人与机器相互融合阶段;微软则单独成立了人工智能与研究院……
 
“人工智能能力在不断增强,尤其在语音与计算机视觉方面。我认为,五年之内计算机视觉一定会超过人类;而十年之内,计算机视觉识别也一定会比人类更强。”沈向洋认为。微软语音识别技术出错率低已至6.3%,已经与人类专业高手持平。
 
相比谷歌的AlphaGo在围棋方面大战人类,沈向洋更看重人工智能在商业领域的突破。“我对AlphaGo除了敬仰还是敬仰,真的非常了不起,的的确确打破了很多人对人工智能的想象。”沈向洋坦言,“但是AlphaGo虽然很了不起,我们却看不到它能真正应用到商业领域的地方。我个人认为,近三到五年,人工智能的突破还是在商业领域的应用。”
 
具体来说是人工智能在传统商业领域,比如销售市场、客户支持、人力资源等领域的应用。沈向洋以市场销售为例。过去销售一件商品可能需要打很多拜访电话,有一个非常长的潜在客户名单。在面对这么多客户名字、公司的时候,需要判断在有限的时间里应该先联系谁,后联系谁。但是有了越来越多的数据可以参考和分析之后,可以利用人工智能技术让效率提升五倍、十倍。
 
人才与想法——人工智能行业的未来支柱

 
沈向洋指出,人工智能行业最终拼的是人才与想法。不可否认的是,微软在人工智能领域的人才也正在向其他企业流动。尽管囊括微软技术研究及人工智能部门在内,沈向洋麾下顶级人工智能人才已达到约7000人,但他坦言自己仍在“拼命招人”。或许,目前愈演愈烈的人才争夺战,意味着人工智能战斗的号角才刚刚吹响。“如果我的学生说他想念博士的话,我会鼓励他们往这个方向去思考,这一定是接下来三十年最有意义的方向。”沈向洋提到。
 
在人工智能方面,微软一直强调“人工智能普及化”。这一概念是萨提亚在2016年Ignite大会上提出来的,并且描述了人工智能普及化的蓝图。微软这一概念更多的是针对开发者。微软上线了基于微软智能云的微软认知服务,在这个服务上微软开放了25个API,对于开发者来说可以介入语音、视觉、自然语言或者搜索等各种功能。据沈向洋透露,上线后很短时间内,微软已经累计了接近一百万个开发者。
 
“我们相信,只有让这些开发者真正利用上最新的人工智能技术,才能通过他们让人工智能普及起来。”沈向洋表示。微软希望能够让更多人用到人工智能,享受到人工智能带来的技术、商业和用户体验上的提升。
 

责任编辑:黄焱林

为您推荐

数字电视“苹果梦”距离我们还有多远?

事实上,在“苹果模式”之前,国内的数字电视公司就已经开始尝试“微软模式”。所谓数字电视“微软模式”,指的就是用中间件的概念替代“微软视窗”的平台,第三方可以在其上开发各种应用,主要是互动应用。而在今年的ICTC上,“苹果模式”也漂洋过海,成为了天柏的榜样,这两种模式成功的前提是数字电视必须实现数字电视网络化。作为第一批“吃螃蟹”的企业,要想实现“微软梦”、“苹果梦”,未来将要面对的问题还有很多。在IT技术人士看来,微软和苹果之所以成为IT界