智能时代的三大核心技术

电子说

1.3w人已加入

描述

作者:曾鸣,阿里巴巴集团学术委员会主席、湖畔创业研学中心教育长。

这张图可能大家都比较熟悉,这就是人工智能在过去20年的一个大发展。最早在搜索阶段叫大数据,那时候还没有AI提法。大家知道,去年底到今年ChatGPT火了后,中国关于大模型的创业团队就有100多家,叫“百模大战”。实际上,第二阶段的人脸识别,是深度学习第一次在视觉领域得到大规模应用,2014年就有上百家的视觉公司在创建。人脸识别,今天大家已经觉得无处不在的一个应用,比如,大家刷抖音背后的推荐引擎,也是基于AI技术。实际上,是这一轮AI用深度学习的方法第一次大规模应用。大语言模型呢?这个叫Large Language Model。为什么说是通用AI的一场革命?它实际上是一个非常简单的算法,就是去预测一个字后面,最有可能出现的下一个字是什么。

就这么一个简单的算法,但是它达到了预测的准确度足够高,足够有用。在这个意义上,它看起来掌握了语言。大家知道在《人类简史》这本书上也提到,语言是人类最伟大的发明。语言让我们可以沟通,语言的背后天然就蕴含着人类的智慧,而且人类海量的知识,1万年左右的知识,基本上都被最近二十年的IT通过文字、音频、视频给沉淀下来了。所以,你掌握了文字,掌握了语言,基本上就破解了人类到今天为止所有的知识。我们今天还不太理解,大语言模型背后的运行机制到底是什么。它也许不像人一样在思考,但是在局部领域里,它表现出了像人一样的逻辑推理能力。这个对于我们未来就会产生非常根本性的影响。

过去三十年的发展,从互联网到无线互联网,到传感器,数字化转型,大数据计算等等。这些逐步增强了软件世界的能力边界,但是它本质上是在做加法,是叠加。但是AGI、通用人工智能把这些串在一起,提高了所有软件的适配能力和自主能力,开始从量变到质变,发生了一个新的飞跃。比如说AGI能够自动编程,这样一下子让软件的能力有一个急剧的提升,这是一个质的变化。

在这个意义上,大家一般都认为,大语言模型是 AI时代第一个类iphone时刻,也是一个大变革的时代。从另外角度来看,通用智能的时代也可以说成是机器人的时代,因为AI是大脑,它和各种硬件的结合就是各种机器人。比如说自动驾驶,自动驾驶的车,就是一个机器人,特别是未来的Robotax公司,本质上就是一个技术外包服务公司。从这个角度来理解,就会对技术,对商业,到底产生什么样的影响,有个更本质的体会。大家一讲到机器人,都会想到波士顿Danymics各种各样很炫的机器人,但是波士顿Dynamiac发展了30年左右,很可能还不如特斯拉的人形机器人这两年所取得的速度和进展更快。这也是AI技术带来的在硬件方面的突破,我们可以看到机器人,在整个环境下,也会有飞速的发展。除了大家讲的ChatGPT之外,我还想强调一下,另外两条AI、AGI的发展主线也非常重要。一个就是自动驾驶,自动驾驶的要求和ChatGPT不太一样,它要确保安全性,而且它本质上解决的是人和物理世界的互动。

ChatGPT更多的是人大脑的行为。

但是自动驾驶要解决人和物理世界的互动,所以为什么自动驾驶的特斯拉公司,可以在机器人方面有那么多的积累,因为它本质上是要去感知外部世界。另外一个非常重要的领域是AI for Sicence(科学智能),而且它更根本,至今为止AGI只能应用人类现有的知识,并不能创造新的知识。但是AI for Sicence(科学智能)把AI用来做科学的发展。它很有可能创造完全不一样的格局,因为它可能会发现,甚至是新的化学方程式或者是新的物理定律,整个人工智能又会往前迈一大步。但即使是今天,像Deepmind下面的Alpha-Fold对蛋白质的解析,合成生物学,其实过去几年非常新生的领域,也是AI驱动的。所以,有很多领域已经取得了很大的进展,只是不那么广为人知,但是这方面的积累,也会带来下一步的突破。刚才是一些背景知识,大家可能在不同的场合也听过,接下来的两页PPT是今天最重要的两页PPT之一。如今,我们从互联网时代来到智能时代,互联网跟AI到底有什么本质区别?互联网本质上处理的是海量数据,它解决的是信息流转和匹配的效率,让信息尽可能地流通匹配,不要有信息不对称而带来各种各样的摩擦。

核心价值在于:解决信息不对称的问题。

举个简单的例子。在线教育过去所有的努力,都是想利用互联网提高老师的教学效率,这是一个非常典型的互联网案例,也取得了很大的进展。但是AI时代的在线教育,是通过无限制的高质量老师供给,满足个性化的学习需要。原则上每学生都应该配一个自己的老师,而这只有AI老师才有满足。同样的道理,全世界现在最大的问题之一,都是医疗成本太高,医生服务不够。如果有AI医生出现,整个人类的健康状况,会有一个质的飞跃。

所以,AI本质上是解决供给不足的问题。过去五年,大家做数字化转型、做产业互联网、做线上化,为什么做的那么辛苦?本质原因就是:这些行业不是信息不对称的问题,是供给不足的问题。比如说,大家所有做互联网医疗以及医疗服务转型。你解决所有的问题价值都非常有限,因为你解决不了最核心的问题,看病治疗那个瓶颈总是在那的,就那么些好医生,你怎么去做信息匹配都没用。所以这个是AI时代,带来一个全新的机会,是我们真正去创造新的供给,海量的供给会创造新的需求。但AI时代,AI最本质的问题是处理海量知识,不再是数据,也不仅仅是信息,是通过对数据和信息的加工产生的知识,这个知识跟原有知识的结合去解决实际问题,所以他解决的是决策的效率与成本,也就是机器能否取代人。到目前为止所有的决策都是人在做决策,机器如果能取代人做决策就是一个智能飞跃,其核心价值是创造新供给。 所以,AI时代最核心的能力是根据决策场景建立决策模型的能力,“场景”一词,非常重要,因为我们所有的决策都是基于一个特定场景的。人很多时候的决策是下意识,甚至是潜意识的,你怎么将它显性化变成一个机器用它的逻辑去实现的决策,这是一个根本性的挑战。

所有的难度在这前面,特别对于AI应用企业来说,对于大模型的一些前沿公司来说,算法是一个很大的瓶颈,但对于AI应用来说最核心的就是建模能力,理解真实场景下的决策,这个难也是因为AGI的决策方法与人的决策方法不一样,所以你需要一个翻译。这个模型有意思的地方,只要你建立了这个模型,形成一个闭环,它自己就能够不断地迭代、优化与生长,所以是一个“活”的AI系统。在这个意义上,过去所有的发展都可以说是一个机器时代,再复杂的机械系统都是简单的系统,他们只能做确定性的执行,但再简单的认知系统都是复杂系统,所以AGI现在的在发展,处于一种类似生物的可有机生长的一套系统,这也会是一个根本性的发展。我们怎么去拥抱自己带有某种能力,某种倾向,又有自我学习,自我成长的能力。

这是AGI的本质,跟互联网时代不一样。互联网时代还是在解决相对确定性的信息匹配的问题,但是AI时代是打造认知系统的问题。这是今天第一个需要跟大家分享的观点。总结一下,在2017年公开课的基础上,再做一个提升,时代驱动力是智能化,我把“智能化”提到更高高度,成为这个时代的主导。互联网时代其实是在线化,软件化跟网络化,在线化跟软件化的结合过去20年最火的SaaS,网络化就是从pc互联网到移动互联网到IOT物联网的一系列的发展。它本质是连接,完成网络协同的基础设施。每一个新时代,都建立在上一个时代的基础之上,所以在互联网时代继续发展,基础设施会变得越来越好的基础之上,我们可以看到,智能时代新的驱动力。一方面是智能化。这是我们刚才整个讲演都在讲智能化的发展,特别是通用人工智能,会越来越强大。我们不知道它最终会强大到什么样,我们只知道它会越来越强大。另一方面支撑智能时代的发展还有两个平台性的基础技术做支柱:一是人机交互能力的不断的提升,这是我们马上就要展开讲的XR话题。

二就是区块链和Crypto,带来我们全网协同的能力的提升。

1.XR:人机交互AR、VR到XR,整体就是人机交互的一个发展过程。从pc时代开始,今天最牛逼的几家公司之一微软,苹果。核心发明就一个GUI图形交互,然后产生了今天所有的互联网革命。个人电脑到鼠标到键盘,本质上是键盘输入,到微软的全套的软件系统。然后到了移动互联网时代,主要是触摸屏的输入,也包括部分的语音输入。第三条路就是过去十年开始发展的。

① 虚拟现实

2012年Oculus成立,2014年被Meta买了,虚拟眼镜VR;2014年GoogleGlass也出现了,2015年推出了一批产品;2016年,来到了虚拟现实的元年。那一年,发布了第一代Oculus Rift。索尼推出了VR眼镜。微软发布了Holowlens。还有一款叫PokemonGo的游戏。当时,第一个基于虚拟现实的火热游戏,很快就沉寂了。高科技发展轨迹,中间都有阶段性的悬崖。2018年的Magic Leap是当时特别有希望的一家创业公司,得到了谷歌,阿里巴巴很多公司的支持。2018年我去看Magic Leap,当时快要投产的下一代产品。我看完以后,当时特别的震撼,不是真假的问题,是将来分不清真假的问题。它是完全可以迷惑你的眼睛,因为都是真实的光源,所以眼睛是没有办法判断,我看到的到底是真是假,它看到的就是成形的图像,然后给大脑输送信号。第二个是,当时Magic Leap的Founder(创始人),就讲我们做的不是眼镜,我们做的是未来的人机交互。大家想想看,你只要眼睛动一动,看一看电脑就能执行你的命令,那不是快多了吗?也容易多了。

很可惜,最后的技术难关没有过去。所以Magic Leap后面转型做了ToB的公司,没有做成消费品的爆炸性的成长。今年有两个重磅的发布,一个就是Apple的VisionPro,这是Apple第一次正式在这个领域发布产品,定义了很多新的标准,也给大家带来很多的期待。第二个就是,上个礼拜Meta发布的Quest3,正好打的是中低端,苹果做的是高端,两家选的技术路线都基本一致,这就说明了行业标准再开始慢慢的浮现,然后又有高端又有低端。附带说一句,Meta还推出了个AiGlass,也是为了人机交互的发展,它虽然不是一个虚拟眼镜的产品,但大家可以看到视觉交互又一次成为行业的焦点。

② 人机交互

回到讲硬件,它的核心目的是什么?硬件的核心目的是完成人机交互的新的机缘,最早的PC计算是通过键盘来交互的。移动计算的手机是通过触摸屏,到了所谓的空间计算的时代,空间计算核心强调视觉跟感知。每个人的定义不一样,我们不用去计较细节。我想总结一下,XR这个领域为什么对在座的每一位都很关键,它的技术背后的本质是什么?这也是一次人机交互的质的飞跃。以前我们跟机器,机器包括后面的AI,我们以前跟机器交互都需要主动的去操作机器,都是要我们去输入。但是未来是机器主动的响应人,我们可能什么都不用做,它自然的感受到了,如果我们进化到脑机结合的时候,甚至它潜意识就知道我们想什么,它可能就去执行了。

所以未来是机器感知人,它来主动行动的一个交互界面,所以这个是完全不一样的时代。我们会看到,会有越来越多的各种各样的机器,将会把人体感官跟数字世界直接连接。我们现在是AR、VR眼镜,可以穿戴的设备,包括衣服、类似皮肤。距离是从远到近,贴近皮肤,再进入皮肤。植入芯片之类的肯定早晚都会发生。这些是十几二十年非常大的一个发展趋势。这个趋势的商业意义是什么?是从XR、VR眼镜开始,我们开始了人类自身感知和注意力的数字化,人自身不再独立于数字世界之外。

③ 元宇宙为什么说元宇宙,大家曾经那么向往,就是因为那是一个纯粹的数字世界,不受物理规律的限制,而且在元宇宙里头能够实现极致的个性化,还有你非常丰富的生物特征,还有非常丰富的场景,可以有无穷无尽的服务。所以那时候元宇宙为什么让大家那么兴奋,也是一个让人很期待的未来。但是XR,类似的设备,除了硬件设备之外,它同样需要软件和算力的提升,所以跟这匹配的是边缘计算,包括算法的微型化。所以,将来每一个边缘设备,它的感知,计算,思考,决策能力也会有一个质的飞跃。所以这个技术和AI技术,也是相辅相成的,它实际上是提供了一个无限广阔的场景,让AI可以得到更广泛的应用。但它反过来又会促进AI技术的进步,因为没有AI技术的进步,它支撑不了更深一步,更复杂,更实时的技术要求,所以这两个是完全相辅相成的技术。

2. AIGC:生产力的大突破

① 我们将迎来创作者经济

我认为最有价值的突破,是通过AGI(通用智能)创造海量的新的数字资产。AGI第一个突破的领域就是AIGC,就是深层次AI,也就是创造海量的内容。明年的某个时刻,肯定会有非常好用的文字、语音转视频的工具出来。基本上从文字到语音到图片到视频,创作的门槛会急剧的下降,创造新的数字资产的空间会急剧的上升。而且就像我们讲虚拟世界一样的,未来的这些数字资产,它会越来越走向主流,它的重要性会越来越大,这些资产有价值,大家就会重视,大家就会对它的流转交易,非常上心。所以在那个基础之上,新的数字资产,天然会去用新的价值网络的技术平台。同时,我刚才讲到以太坊核心是智能合约,但未来机器跟机器之间的合作,它们的互动方式跟人是完全不一样的。它们需要有更多,更自动,更高效,更智能的合约直接完成。所以在这个领域里,区块链、Crypto有很大的发展空间,也是在这个意义上,我也把它当作AGI整个智能时代重要的组成部分。

无论是从刚才讲的Crypto的领域,对创造经济的呼吁。还是看AGI带来的价值,我觉得未来,我们将迎来一个创造者经济的时代。一方面,这个趋势看得非常清楚,AGI会逐步取代结构化的人类知识,并且变得越来越智能。另一方面,人借助机器智能的力量,有机会变得越来越有创造力。就像工业革命的早期,大家都非常恐惧,人不再能够以体力来获取价值了。但是过去的100年,出现了白领阶层,出现了知识工人,出现了软件工程师,他们靠自己的脑力活动,创造了过去100多年、200年的繁荣。我能看到的相对美好的场景,由于机器或者人工智能把人从繁琐的、重复性的、无聊的脑力劳动里解放出来,人可以把大部分时间,用在开发自己的创造力上,去做自己真正有激情的,也能够做得更好的事情。这个可能是两个基本的动力。在这个基础之上,对人跟人、人跟机器、机器跟机器之间的协同都提出了更高的要求。互联网时代,机器跟机器之间协同是靠API,就是应用之间要有一个约定的规范来互助,但是由于AGI的发展,未来所有的服务之间,是用自然语言来交互。也就是说,机器会学得像人一样,直接来对话,机器跟机器之间就完成了协作,自然语言反而变成了人跟人、人跟机器、机器跟机器之间的沟通语言,对于智能合约就提出了更高的要求。

如果我们从一个更宏观的角度来看,刚才讲的这些内容,德鲁克可能是20世纪最伟大的商业思想家,他把工业革命划分成了三个历史阶段:

第一个阶段是生产力的革命,本质上是工厂取代了手工作坊,因为过去的手工作坊知识,都只能靠师傅带徒弟,人传人。但是有了工厂以后,就开始有了科学化管理。

第二个阶段,是100年前开始的管理革命,也就是说开始有了企业的概念。以前只有单个工厂,核心就是生产和销售,但是我们从管理开始,有了矩阵式管理、职能化管理、人力资源部门、战略规划部等等。一百多年前成立的商学院,目的就是为管理革命输送批量化的高质量的管理人员。所以,MBA出来都是标准化的语言,这是管理革命。

第三个阶段,随着IT的发展,从六七十年代开始进入了软件革命,也就是IT革命的时代,软件工程师创造最大的价值。顺着刚才讲的AGI对人类结构化知识的替代,人必须走向创造力的发展。所以,我把未来的第四个发展阶段,新的发展阶段,叫做创造力革命的阶段,人未来的价值就体现在创造力上。我们将要迎来的是一个新的经济范式。智能时代的经济核心,我们把它叫做智能经济,从另外一个角度来理解,刚才讲的创造者经济。三个核心的支撑,就是我们刚才讨论的通用人工智能、Crypto、AR&VR。当然,这三个发展阶段不一样,目前是AGI发展势头最猛,Crypto处于相对低谷正在酝酿的阶段,AR&VR可能还要三五年才会产生大规模销售的应用级产品。但是这几个的趋势是非常清楚的。

② 人类文明的演进

我们如果从智能经济再跳出来,从一个更广大的角度来看人类文明的演进。实际上,人类的发展核心依赖于两个,一个是人类网络的发展,就是我们讲到的语言、文字、文化、制度等等,都是所谓的软的制度性的东西。还有一个是工具网络,从最早的火,到工具的使用,到农业化到物理的网络,到今天的物流网、通讯网、计算网,这都是物理的工具网络的发展,工具的网络促进了社会进步,促进了人类的发展,然后人类又发明出了更多的网络,发明了更多的工具,促进新一代的技术发展。所以,技术进步跟社会进步就通过这两个网络,产生了一个质的飞跃,一轮一轮的发展。从生物学的角度来说,人类单个大脑的容量提升很小。所谓,未来的进步就两个:第一个,对大脑开发,一步步的开展,就我们大脑开发比例还很低的。所以为什么创造力革命有可能?

我们有可能开发出很多我们想象不到的能力。第二个,目前看起来更重要的是群体智慧的涌现,也就是通过社会协同创造更大的价值。技术变革推动的工具网络的进步,是人类文明发展的主线。基于这个,我们可以做一个判断,我们今天讨论是处于一个什么样的状态,从火的发现和应用,到工具的使用和发明,到农业经济才1万年左右,再到工业革命。第一次工业革命是机械动力,第二次工业革命是电力,虽然有人把信息革命叫做第三次工业革命跟第四次工业革命。但是我觉得从概念的角度来说,把信息革命独立出来可能更清楚。

所以,我们有了第一次信息革命,就是电脑的发明。然后第二次信息革命,大概从70年代末到80年代初。开始有个人电脑,互联网的发明,到最后通讯网络跟计算网络的融合,形成了互联网过去20年的大爆炸。我们过去的五年跟未来的五年,就是一个过渡期,从互联网时代走向智能时代,我个人倾向于把它叫做互联网3.0。从互联网1.0的PC到2.0的移动,到3.0的未来。为了在概念上更清晰,我们可以把未来10年,甚至接下去20、30年,定义为智能时代的开端。

智能时代1.0,这就是我们今天所处的时代的机会,也是时代的挑战。我们今天不论什么位置,所有人只有一个共同的挑战:成为智能时代的原生物种,你才有机会发展,甚至才有机会生存下去。

编辑:黄飞

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分