将门年度创新峰会:人工智能如何改变世界?

电子说

1.2w人已加入

描述

他们既是学术界备受推崇的科学家,也是产业界的思想领袖和践行者。他们既代表了世界及大公司的创新,也代表了崛起的创新企业的创新。AI正在重新定义世界,此次高峰论坛,几位科学家和行业大佬从当下产业、人才、研究、技术等各个维度出发,畅谈了人工智能的未来发展及落地前景,论坛迸发出了许多新火花、新观点。

2018年3月24日,首届将门年度创新峰会在北京举行。峰会以“一场连接小与大的效能创变”为主题,集结联想、英特尔、IBM、强生、博世等行业巨头,以及码隆科技、杉数科技、禾赛科技等优秀的创业企业,同现场700多位伙伴一起,探讨分享2018年技术趋势及创新机会,以及创新技术驱动下的医疗、交通、新零售、生活等四个领域的AI产业落地和商业价值。见证“大”行业“大”企业升级迭代背后,“小”场景“小”创新带来的创变力量。

在当天举行的技术高峰论坛上,将门CEO高欣欣与联想集团高级副总裁兼CTO芮勇,IBM全球副总裁、IBM大中华区首席技术官、IBM中国研究院院长沈晓卫,英特尔中国研究院院长宋继强,旷视科技首席科学家、旷视研究院院长孙剑,以及将门CTO沈强,就2018年的AI发展趋势及产业落地等话题进行了深入探讨。 

「将门年度创新峰会」席卷整个科技创新圈的效能创变

将门CEO高欣欣:发现“小”价值,一场连接“小”与“大”的效能创变 | 将门年度创新峰会

点击视频观看峰会实录

以下内容根据大会实录整理:

一、人工智能如何改变世界?

高欣欣:第一个问题,我想请问IBM的沈晓卫院长,您说过技术的影响力可能远远超过我们的想象,人工智能正在重新定义着我们身处的世界,这句话我觉得是今天特别好的开场,您可不可以跟我们分享一下,您眼中的未来是什么样的?在人工智能的世界下,技术创新会在哪几个方面呢?

IBM全球副总裁、IBM大中华区首席技术官、IBM中国研究院院长沈晓卫

沈晓卫:说到人工智能重新定义我们的世界,我可能更多的是从两个维度:时间和空间。

从时间的维度来看,我们今天处在一个指数级成长的时代,我们看IT行业本身的发展,在过去几十年,很大程度上,我们的进展是来自于所谓的摩尔定律,我们的成长所带来的性能的提升。在之后的互联网时代,我们也看到了,连接到互联网的终端数也有一个成长。

所以大家相信,一个网络的效能可能和连到网络上的终端数的平方成正比。今天处在一个大数据的时代,我们看到,一个是数据本身在指数型的成长,一个是我们也相信人工智能或者包括人工智能在内的信息技术的发展,使得我们从大数据中得到的知识,及由知识所产生的效率或者洞察力,也在指数型的成长,这是一个时间的概念。

从空间的概念来说,我们也看到人工智能今天开始影响到每一个行业,重新定义每一个职业,影响到每一个人,无所不在的人工智能。

从这两个维度来看,当一个技术做这样一个广泛的应用,在一个指数型成长的平台上,它带给我们的改变是非常非常巨大的,可能远远超过我们对它的想象。

说到人工智能,在这个时代,技术的发展,大概有这样几个方向,一个是人工智能本身的核心技术发展,包括我们谈到的人工智能的算法,包括今天谈到很多机器学习的算法,还有像自然语言理解其他一些方面的算法。因为人工智能今天的技术还不能满足我们对它所有的期待。

另外一点,人工智能与行业的结合,人工智能改变世界,最终还是从改变每一个行业开始。我们谈到了计算力,我们也看到无论是今天谈到的一些类脑计算,还有我们谈到的量子计算,都在为未来人工智能的应用带来一些计算上的保证或者颠覆性的影响。

最后,我特别谈到人工智能和其他一些相关的技术,特别是区块链技术的结合。从这四个维度来看,就是我今天人工智能时代技术创新的一个理解,谢谢。

高欣欣:晓卫院长提到了计算力,这个问题必须要问宋院长了。基于计算架构和计算力,以及基于不同的通用性和专用性,现在出现了不同的平衡,出现了不同的创新和特别多的创业公司。我特别好奇,在一个5年的时间节点上,您觉得在这个领域,引领的公司会更集中,还是更多元呢?

英特尔中国研究院院长宋继强

宋继强:这是一个预测,预测通常都很难做的很准。我可以给大家分享一个趋势,目前来看,特别是从芯片的角度,做人工智能这个领域的芯片,AI芯片有两种,一种是为了加速,不管是通过传统的CPU多核的处理器,GPU、DSP这么多种都是利用传统的一些架构在加速。

我们已经知道了哪些算法对于处理这些数据非常好用,但是我们在训练它的时候,在服务器端,我们想得到最好的效能比,比如说同一块钱,同一瓦电,我训练出最好的模型,这个时候就会根据需要来选择,我到底是GPU,还是用多核处理器,我们看到不同的公司选择了不同的策略,比如说微软选择了FPGA,Intel和Google自己设计了ASIC芯片,也有很多公司用了GPU,都是出于它自己的业务,有时候需要强调实时性,有时候需要强调性价比。

我们可以看到这里面,采用传统一些技术的芯片,各司其职,如果考虑到前端的设备,假如说路上的摄像头,如果从现在的只是能拍摄照片传到后面,到能够在前面自己检查有哪些人、哪些事儿、哪些车是需要密切关注的,前端一定要有很强的能力,前端就不太适合用那种比较贵、功耗又比较高的处理器,这个时候就是ASIC芯片。

我想现在很多公司,包括我们的创业公司也都在走这条路,在前端用ASIC芯片的方式来加速AI,这些都是AI的加速芯片。但在未来的探索里面,刚才您提到了通用这一点,我们知道现在很多人工智能算法,在处理具体应用的时候,它是用一些已经有的行业数据来训练,训练好的模型只能干这么一个事儿,做人脸识别就不能做语音识别,也没办法去听一个歌,给出一个情感分析,都不行。

那么通用芯片,我们是希望它能够做多种事儿,或者说同时能做多种事儿,这个就需要架构上的改变,这种架构上的改变,希望有新的尝试,像IBM出的一个芯片的探索,目前来讲是世界上最大的单片,能够融载上亿神经元芯片。Intel最近也出了一个芯片,也是一个新的尝试,这个尝试的特点是,我们可以允许它在片上同时进行训练和工作,它就允许你像一个真的大脑一样,我就在里面持续学习、自学习,这些都是架构上的探索。

我觉得两个方面各司其职吧,对于这种架构上的探索,可能只有大公司才能搞,因为要花很多钱,而且我们还不缺,什么时候能真的找到这种通用的方法,因为上面还有软件算法的需要。但是对于具体的领域,我觉得小公司有很多的机会,只要你深挖某一个具体的领域,比如说医疗,不同的病其实有不同的做法,零售、交通、智能家居各个领域都有很多细分的地方可以挖,你可以采用自己的方案,用各种芯片方案,只要很好的解决问题就行了,我觉得大家是携手共进的。

高欣欣:接下来,我请问一下联想的芮总,其实我们从PC时代到现在的手机时代,其实设备一直是人和机器智能能力交互的途径和方式,现在主流的还是智能手机,您觉得我们人机交互的方式未来会发生什么样的改变吗?

联想集团高级副总裁兼CTO芮勇

芮勇:回答这个问题之前,我先要谢谢将门,因为上面坐的这几位我们都很熟,也都在北京,但有一年都没见了,大家都很忙,在将门这我们才能见到,所以要谢谢将门。

设备确实是连接人和机器的一个很重要的方面,也谢谢你给我一个机会能插播一个广告,联想每年从PC到手机,全球每年都会销售1.3亿台设备,所以设备是非常重要的。你刚才问的,今后的设备会有一些什么样的前景。

我觉得一个很有意思的前景就是,设备会回归自然,回归自然是什么意思呢?可能你的穿戴设备,你身上穿的衣服,你戴的眼镜,手上的腕表,这些都会变得非常智能,你不用再去想,这到底是一个我本来就要戴的表还是一个智能设备,我本来就要穿的衣服还是智能设备,它就是随你而行,所以会回归自然。

还有一些设备也一样,除了可穿戴设备以外,还有一些可融于环境的设备,在你的家里面,桌子、椅子、镜子一样,你可以想到,如果你每天早上起来刷牙的时候,镜子告诉你今天的天气怎么样,你今天还有什么会,再给欣欣推荐一下你今天下午有这个活动,你穿这个衣服可能会更好看,它是一个隐于环境的功能。

从人和机器交互呢,可能也有几个大的趋势,趋势可能就是从唯物变为唯心,唯物的话,我们之前跟机器做交互,键盘、鼠标,我们要敲着键盘,拿着鼠标,慢慢的其实我们脱离了这种具体的物体,可能用我们的语音、手势、触摸等等。

从唯物到唯心,我们还没有说到心呢,在讲心的话,人的一个脑电加上人的意识,其实这个方面已经在做很多研究了,今后你想的事情可能还没有动作呢,你的设备已经知道了,他就会帮你做。所以设备是回归自然,从人机交互来说是从唯物到唯心。

高欣欣:既然要唯物和唯心了,说明设备也要为人所用了。接下来,我问一下孙剑,我们现在看到的人工智能技术,不管是从已知的安防,到大家都相信的未来智能驾驶,现代技术并不仅仅是对于行业的提升,其实它改变了游戏规则,产生了全新的价值。在您看来,我们今天的这些人工智能技术,在哪些行业、场景在相对近的时间,还会对整个行业产生这样的一个变化呢?

旷视科技首席科学家、旷视研究院院长孙剑

孙剑:因为今天我是代表了创业公司,在座三位院长都是代表大公司,其实在选择创业的场景上会不一样,大公司有非常多的优势,有资源、平台、核心数据。创业公司要做可能真的要选好这些垂直的行业来做。

我们自己看人工智能落地的行业,有一个很自然的逻辑,哪个行业的数字化程度越高,我们就会去先做哪个行业,最高的就是互联网,互联网的话我们在2013年、2014年就做了Face++人工智能开放平台,把我们核心的CV技术,当时也不知道什么商业模式,把这个技术放到网上,让开发者来调。

我记得当时在微软的时候,我们微软的CEO还专门写了一封信,你们看有一家公司叫Face++,他们把这个东西放到云上了,我们微软的云为什么不能有这样的AI技术呢,这是第一步我们做了平台。

当然在看行业的话,还有一个行业是非常数字化的,就是金融,金融是几乎完全数字化的,所以我们Face++的第二个产品是一个Face ID的产品,在线身份认证,这个目前是全国乃至全世界最大的在线身份认证的平台,这也是数字化非常彻底的行业。

还有一个,我们做CV界的都说安防非常重要,为什么呢?安防经过过去20、30年的积累,基础建设,几乎很大程度上的视频都连在网里面了,数字化存储,这个行业非常适合AI技术来做,所以安防是CV界的一个非常大的市场。

刚才宋院长也讲了AI芯片,其实AI芯片包括一些创业公司大公司,包括我们公司去年也做了智能摄像头。其实是说,虽然像安防的摄像头已经连网了,但传输速度不够,像线下新零售这些可能传不上来,它其实要把计算放在端上,这样直接就在端上数字化做了,这也是我们非常关注的方向。另外,我们目前也是手机行业人脸解锁最大的技术提供商。

这些都是我们按照基本的数字化逻辑来选择行业的。还有一些其他的行业,比如说智能工业,包括机器人。在这些行业,很多需要做设备,不是那么快数字化的。要么不做,要么就是早投入,慢慢做,慢慢建立壁垒,这样也有一定优势的。

以上这些就是我们对一家创业公司怎么选择AI落地行业的基本逻辑。

高欣欣:接下来,我问一下强哥,我们每天在一起都争论着哪一些是可以真正落地的方式。从你的角度来说,你觉得2018年最值得期待的一些真正的技术落地应用是什么?

将门CTO沈强

沈强:我对2018年有两个方向的AI应用发展是有所期待的,倒不是说2018就会有广泛应用,而是说是重要的方向,希望看到更多的发展。

第一个是生成式的AI应用(Generative AI),怎么解释生成式的AI应用呢?今天我们的AI应用在很多地方,比如说安防,我们做人脸识别,判断这是谁,或者说他的形貌具有什么样的特征,这是我们人头脑之内一秒钟想的事儿,是快速的判断决策。

然而,我相信人工智能会有更大的价值发挥空间。在我们现实的世界里面,本质性的创造价值往往伴随着我们能创造出一些新的东西,比如说们会建设新的建筑,我们会制造新的机器,我们会编写写新的代码。而人工智能能不能超越我们头脑一秒钟思考的边界,帮助我们来创造一些更加复杂的新成果,能够在生产力的层面上起到一些推动作用?

生产工具决定生产力,所以生产力的根本推进是要从生产工具开始的,AI能不能作为生产工具,开始进入到我们的行业里面,今儿发挥对各行各业更大的推动作用这是我的一点期许。

与其说期许落地,更不如说是期许这个过程的开始,我希望看到它的启动,事实上生成式的AI应用已经有一些苗头了。比如说,空中客车设计飞机隔板的结构,包括机翼的结构,他们有几十年很丰富的经验,也有很成熟的参考设计,但他们去年做了一个大胆的尝试,他们在考虑过去的经验是不是束缚了可能的想法,是不是存在更好的方法呢?于是他们让人工智能自动地做一些探索,类似于AlphaGo在一个无穷大的空间里面把约束给到他,结果的确找到了新的结构设计形式。而令人惊奇的是,这个新的结构设计很类似于我们来自于仿生学、生物界的一些动物的骨骼结构,这是一个利用AI进行生成式设计案例。

在我们今天的现实世界里面有很多需要创造的地方,都可以用生成式AI来进行探索。比如:我们想创建一个很漂亮的建筑空间,我们需要考虑人流效率、空气流通、光照条件、经济价值等等多方面的综合权衡,今天我们有很优秀的建筑设计师在以他们的聪明才智和丰富经验在创造。但是有没有更好的空间布局?有没有更好的空间布局?有没有更高效的人流动线设计?能不能利用人工智能帮助我们突破个人认知的界限,帮助我们创造出更加经济、绿色、具有艺术感的建筑呢?再扩展开,我们的装备制造业能不能发展出更加新型的装备,我们的程序编写是不是有可能能够自动开始有一些自动化的工作生成,包括药物设计探索,以及其他一个一个的行业,都有生成式AI的无穷潜力。

如果人工智能能够作为生产工具,我们的各个行业将会迎来巨大的变化,我希望2018年能够出现一些苗头,让我们看到改变各个行业未来的期望。

第二个期待是可信的AI,今天无论是智能驾驶,还是金融领域应用广泛使用深度学习技术,我们还面临着一些关键挑战,比如说可解释性问题,或者说黑盒子的问题:人工智能的深度学习对内部的机制,我们现在还缺乏理解和控制力,在一些特别关键的应用场景,我们还不能完全信赖它。我们能不能把人的生命托付给一台自动驾驶的汽车?车厂能不能对由一个不知道其内部机理的深度学习算法控制的机器承担责任?什么时候该刹车、转方向盘,这些关键决策,我们需要有人工智能,也有很多过去的经验,基于规则的应用,是具有很明确可解释性,可信任的决策机制。

如果我们能够突破这一点,当人工智能变成可解释的,那么它就具有可信赖的基础,而可信赖就意味着它能够被引用到更多的关键业务场合,帮助我们做重大的决断,电网的调度,手术的操作等等很多的领域,这是我最大的两个期待。

二、人工智能如何赋能各个行业?

嘉宾们在分享了各自对于人工智能发展趋势的观点后,又分别就人工智能在行业应用前景提出了自己独到的讲解与看法。

高欣欣:今天既然是一个特别偏技术和行业结合的会,我还想继续追问行业的问题,我再请问芮总一个问题,其实芮总曾经说过人工智能叫ABCD,但有别于别人说的算法、算力和数学,您加了个B,Business,也就是行业,而联想其实也深入到了很多的行业。刚才孙剑老师从创业的角度谈了,那您又是如何看待技术激活的全新行业呢?

芮勇:过去一年在不同的场合我都跟大家说,要做好一个成功的人工智能系统,真的需要ABCD,A就是算法(algorithm),C就是计算力(computing),D就是数据(data),但特别强调要有一个B,B就是和垂直行业相结合,和我们的business要相结合。

如果我们看2016年、2017年是一个人工智能要飞上天的过程,随便路上找一个人就知道,这是人工智能,AlphaGo又赢了。2018年开始,我觉得可能是一个人工智能要落地的过程,这个落地不是说他不行了,是说要落地,要和具体的垂直行业相结合。

那么,这一次我觉得整个信息技术的发展,可能跟前几次的变革不是很一样,不是跟这个行业容易结合,我只是觉得是一个全行业的。人工智能要加上所有的行业,其实可以助力所有的行业进行转型和升级,粗略算一下有200多个。

有几个行业特别我觉得挺有意思,一个是医疗方面,互联网+的时候,其实可能让我们上网预约变得容易了,但医生就那么几个,有人工智能助力的话,比如说它帮你看一下X光,读一下片子,有的时候比人读的还准,因为人到下午的时候比较困,人工智能来帮你做肿瘤分析、X光等等。医疗行业是非常好的。

另外,智能制造,我提的智能制造可能是更广义的,不是生产线上的机器,那是其中的一个部分,更有意思的是说,怎么精准的定义一个产品,这是第一步。

第二步,有供应链的管理,我从微软到了联想之后才知道,从软件到硬件巨大的不同就是,软件里面没有供应链的管理,硬件有供应链的管理,一台设备可能有上千个零部件,你买多了就砸自己手里了,买少了没有办法用户的需求,供应链的管理里面很多人工智能的东西可以做。

第三步,整个的生产过程。

第四步,售后服务。我觉得是一个很广义的智能制造,这里面有人工智能做的事儿太多了,从供应链的管理,我刚才已经提到了,有很多能够用机器学习的算法,加上一些运筹学的东西,如果能把预测的准确度上升1%,那就是几个亿的利润。

生产线的智能化,包括用AR的眼镜检测有问题的产品。做售后服务的时候,其实今天我们都知道,可能人员流失率最高的地方就是售后服务呼叫中心,因为它一年365天,大家打电话来就是那么几个问题,问来问去还是那么几个问题,会很烦,因为人不愿意干这样的工作。这个事情让AI来做太好了,就这么几个问题,都解了不就完了嘛,对售后服务的呼叫中心,我觉得人工智能也可以做的非常好。

说到挑战,我觉得可能有两个,一个是从人工智能本身的算法上,进入一个新的行业,可能它的数据量刚开始的时候没有那么多,或者没有标注,有没有在小数据和弱标注的情况下开发一个好的算法。

第二个,可能比算法更重要、技术更重要的是说对行业的理解,我前一段时间刚好去访问了一个做智能交通的公司,他们有一个技术专家,还有一个行业专家,第一次前面的时候,技术专家就跟行业专家说,我有深度学习,我有这个那个,行业专家说你先把500页的中国交通法拿回去看一看,要不然你做东西一点用都没有。他说的其实非常非常对。到最后应该是行业引领技术,技术才能真正落地。

高欣欣:既然是技术赋能各个行业,我追问一下晓卫院长,在我们的技术界有一个争论,当人工智能可以进入到每一个行业,在一个行业有没有可能有一个通用的解决方案,或者说人工智能能变成一个通用计算呢,这个是不是IBM指的广义人工智能的概念?

沈晓卫:今天的人工智能或者说在可预见的接下来的几年,我们可以看到很多企业级人工智能的发生。在这样一个情况下,我们看到人工智能会从一个比较狭窄的AI,变成一个比较宽泛的AI,这是一个什么样的概念呢?你看到今天很多人工智能的解决方案,更多的是专注于解决一个非常清楚定义的问题,某一个领域,接下来可能会看到人工智能的解决方案,会解决一个领域甚至跨领域的很多个问题。

在这样的背景下,我们也以医疗为例,医疗领域的解决方案,可能是为医院服务,可能是为病人服务,可能是为保险公司服务,可能是为政府服务。比如说为医生服务,你有可能是做医疗影像、慢性病的管理,你可能是做全科医生,你可能是做肿瘤分析。

在从技术角度,你可能是用深度学习,用自然语言理解。所以它还是一个非常非常复杂的宽泛的概念,在这样的背景下,与其说是不是有一个通用的人工智能解决方案,能够全部处理医疗领域的问题,我倒觉得我们可能更多的需要聚焦在人工智能的模型上,所以模型是基于算法和解决方案之间的。

我们需要构建可以重复使用的人工智能的模型,而这些模型已经被适当的数据进行过训练,基于这样的模型,我们又可以构建更复杂、更完备的模型,最终构建人工智能的解决方案。不像今天,我们遇到一个问题,拿到一个算法,拿到数据,进行大规模的数据训练等等。

这样就催生出另外一个概念,我们可能要考虑到基于人工智能模型的东西,大家把我们提前构建的、针对某些领域的,甚至是通用的一些可重复使用的人工智能的模型,放在这样的场景,使得我们的使用者可以拿来使用,这里面当然也包括了这些技术架构的设计,包括了这些人工智能模型本身的安全性等等方面的问题。

高欣欣:接下来我想问一下宋院长,假设我们真的有这样广义的人工智能的话,需要什么样的计算力来支撑?

宋继强:其实广义人工智能不一定跟计算力有多高的线性增长,或者指数级增长有关。我们知道现在的天河一号的计算力,超过我们任何一个小芯片,我们也没有看到那里面长出一个通用智能的技术出来。所以在人脑的工作方式里面,用这么小的一个功耗和短短的时间,我可以处理好多事儿,这是通用人工智能最高的境界,既能够被用来处理多种事儿,又能够同时处理多种事儿,这是两个层次。

现在的深度学习,以及深度的强化学习,是可以被用来处理多个事儿的,但还不能同时处理多个事儿,跟人还是有差别的。

我们又看到,Intel现在芯片尝试的路线图上,有尝试模拟人脑、跟IBM类似的神经芯片,属于内脑型芯片,也有纯粹是提高计算量的ASIC芯片或者多核芯片都有。我们就可以看到,对于某些类型的算法,比如说深度学习,它适合于处理一些视觉的问题,识别人和物体,这种用某种加速芯片来解决是最好的,ASIC就可以。

如果说我要解决一些又有推理,又有一些隐藏的知识,又需要持续不断地适应的,那可能就放在神经芯片里比较好,而且功耗很低,因为那个可以用异步的技术来设计。所以这两种如何结合起来,有可能就像刚才晓卫院长说的,有一个AI方案的场景,这里面有软件模块、硬件模块,有些是专门针对某些具体的功能,通过小的ASIC就可以很快搞定,功耗也低。有的也需要配合一些推理,配合一些概率的分析,就像人,人也不总是推理正确的嘛,也有一些概率在的。

这样就能改造出来,既在某些方面很强,又能够构造出一种通用适配的能力,我觉得不是光看算力,而多看看架构的变化,各司其职。我们的人脑也一样,一个简单的例子,我们去背九九乘法表,不想每次都重新算,而是一下就记住了,都是一些不同的办法来解决各种问题。我觉得这可能是一个比较合适的思路。

高欣欣:深度学习是现在普遍提到的,那么孙剑老师觉得深度学习是我们的一个终极选择吗?有没有什么技术会替代深度学习呢?

孙剑:最近业余时间在学习平行宇宙的理论,给我的感想就是,我们研究了这么长时间,追求一些大一统的理论,终极理论。但目前是越研究越迷茫,越研究越不清楚到底会是什么。我相信深度学习目前肯定不会是一个终极的方案,但里面的核心思想,比如说分层嵌套的方式来逼近函数,或者用端到端学习的方式来做事情,这些方式可能还会延续很长时间,一直有很强的生命力。 

深度学习如果从技术上来说,我们核心研究几个子问题,一个是这个模型表示能力强不强,我们今天知道随着神经网络深度的增加,表示能力很强,我们还研究怎么优化的问题,包括现在有了Intel的CPU、GPU,让我们的优化问题,能够在非常大的计算力下解决好,解的不好的是推广问题,强泛化能力问题。

泛化能力的话,我们一般讲有两种,一种叫弱泛化能力,一种叫强泛化能力。弱泛化能力其实是我们机器学习经典研究的问题,训练数据和测试数据是同分布的,在训练数据上能够做好,八成在测试数据上就能做好,这个东西现在研究已经比较深入了,而且经常做的比较好。

研究不清楚的是,今天神经网络的模型为什么在很多情况下还能工作的很好,这个还是不清楚的。因为往往模型的参数比训练样本还多很多,为什么不会overfit,为什么还可以做,这是要研究的问题。但更重要问题是,刚才像芮总说的像小样本,弱标记,这些能不能做通用问题,这就是强泛化的问题。

强泛化的问题,包括我们每天工作中遇到的训练样本和测试样本不太一样,比如说前两天Uber的车出了问题,包括以前特斯拉的问题,确实有一些样本以前是没有见过的,包括我还听说目前做无人驾驶,为了收集一些难的样本,拍可能是不行了,找画家来画吧。

这是一个深度学习目前面临的最核心的问题,最亟待突破的问题。大的思路方向怎么做,这可能分短期和长期的做法,长期我们都号称要做无监督学习,要从世界的观察中学习。短期的话,我们内部就比较看好元学习(meta learning)基于学习的学习,用另外一个神经网络或者学习系统,学习已有的系统是怎么去学习的。现在有很多形式,这个是短期来解决强泛化能力的思路,我们正在做这个方向。

高欣欣:强哥,这么多的大公司在做算力、算法的努力,你觉得这样的基础研究在初创公司还有机会吗?

沈强:我先说结论,我觉得很有机会,为什么这么说?我们来看一个成熟的AI生态系统,它应该具有什么样的特征,我有3个数字很关键:1百、1万、1百万。

先说1万,1万是说一个成熟的AI生态系统,我们的算力要提升到今天算力的1万倍。为什么这么说?

一个繁荣成熟的AI生态,必须能支撑海量AI应用的低成本高效率开发。正如移动互联网的蓬勃兴起,一个程序员,一台电脑都可以开始开发,所以我们才有那么丰富的移动应用生态。再来看典型的AI应用,我可能第一个最容易被转化为大规模经济的AI应用是自动驾驶。NVIDIA曾经针对自动驾驶应用开发的计算需求给出了一个报告,一个典型的数据集,包含100辆车,一年的运行数据进行训练,原始数据几百个PB,预处理后从100多个TB到400多个TB不等,这样的一个模型的训练,根据模型训练的复杂度,使用当今深度学习算力最强的DXG-1服务器,需要166天到778天的范围,平均1万小时。然而我们的移动应用开发,PC应用开发,最频繁的操作是改代码、重编译。当我们对代码做一些调整重新编译,可能就是在几分钟或者十几分钟就能完成。而对深度学习AI应用而言,核心逻辑是放在模型里的,该逻辑改代码的方式就是调整模型重新训练,这可比移动互联网应用的改代码慢多了。能够大规模产生丰富应用的前提条件是,我的生产工具要足够高效,能够帮助我快速的生成这些东西,所以必须把1万小时的时间压缩到1小时级别,这是一万倍计算能力的提升。

自动驾驶只是第一个规模化的AI应用,我们还指望AI能广泛的去改造每一个行业呢,这个算力必须提升。

然后说1百,是指一百倍的成本降低。刚才讲到的自动驾驶训练模型用的设备,是一台NVIDIA DGX-1,价格是80多万人民币,而我们,我们做一个移动应用开发,我们只需要一台Mac或者一台PC就可以了,是几千块钱的,这是1千倍的价格差异。开发设备门槛很低,要不怎么可能有那么多个人开发者投入其中呢?只有个人开发者都有能力投入到这个AI应用开发的时候,应用生态会形成一个大爆发,所以价格要降100倍。

再说100万,是指AI生态系统里面应用的数量要达到100万个,才能覆盖足够广泛的场景和需求,稳定的生态格局才会形成。我们看移动互联网,我们看PC,我们看互联网,都有这样的规律。就移动互联网来说,IOS和安卓今天在移动市场的统治地位很稳定,它的标志性事件是什么?是三国大战的终结,2013年底,2014年初,随着微软收购诺基亚,整个的移动应用市场后面就趋于一个稳定的结构。

在那个时候无论是苹果的App Store,还是Google的Google Play,上面的移动应用数是多少呢?都是100万的水平,相同在Windows,在PC年代,它发展到一个很稳固的地位,正好应用数也是在100万个的水平。

所以1百、1万、100万这三个数很关键,如果我们把这个作为一个成熟AI生态系统的目标,我们今天还处在AI生态的原始社会,而这样的一条路径中有无穷多的可能性。虽然大公司已经做了很多工作,也只是起点,可能的路径可有很多的选择。至少眼前有两条路线:一条路径是线性发展的迭代过程我们沿着深度学习这条路在做技术上进行不断的优化,包括算法的演进,像刚才大家谈到的弱标签,小样本等等也包括算力上,沿着数字电路路线不断开发新的AI芯片。但可能也有可能能够突围的路线是不走寻常路,比如全新的算法不再基于深度学习了,而算力也不再基于数字电路了,而是采用像量子计算、神经拟态计算等其他的路径。

在这条这么长的道路上,有太多的可能性,太多的分叉,不一定都是大公司的机会,初创公司一定有机会。

高欣欣:通过各位院长、老师的分享,其实都表明了对于技术整个影响和升级行业的信心,接下来的时间要深究很多个行业,让我们有信心、有耐心迎接美好的未来,谢谢各位老师。

以上就是此次将门年度创新峰会技术高峰论坛的全部内容,各位专家由浅入深地从多个维度去帮助我们回顾和展望了人工智能的过去及未来,相信在大趋势下,人工智能的落地及发展会正如他们所言,带给我们前所未有的改变与突破。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分