今天讨论AI大模型,最重要的一个议题是,AI对一个产品、服务、产业意味着什么?对于一个个体、企业、区域、国家的竞争力意味着什么?未来3-5年,哪些产业的竞争力会被AI大模型重新定义,以及以什么方式重构定义?
2024年4月2日,在北京大学国家发展研究院主办的“《新经济公开课》”论坛上,安筱鹏博士提出:AI大模型是数字技术体系的竞争,将会带来人机交互、认知协作和计算范式三场革命,大模型正在重新定义产业核心竞争力,产业竞争力的重塑将会有五种路径和模式:
模式1:产品竞争力升级(AI for Product)
模式2:创新效率大变革(AI for Science & Technology)
模式3:AI原生产业兴起(AI-Native Industry )
模式4:体验升级与决策优化(AI for Industry)
模式5:生产力工具再造(AI for Productivity)
以下是发言要点:
今天的分享,是基于一个基本假设:大家对AI大模型本身已经有所了解,我重点讲讲AI大模型的应用,它对于一个产业竞争力到底意味着什么。
AI大模型引发三场革命 正在重新定义产业的核心竞争力
2022年11月30日OpenAI发布了ChatGPT,2024年2月16日又发布文生视频大模型Sora。2024年2月23日,英伟达市值涨了2770亿美元,创造了华尔街历史上最大的单日涨幅,市值从1万亿美元到2万亿美元只用了9个月时间。
这些惊艳的产品和疯狂的数据的背后,意味一个新的智能时代的开启。
去年4月28日和5月5日中央政治局和中央财经委会议上,提出把握人工智能等新一轮科技革命浪潮。如何理解和认识这场革命?这是一场什么革命?
AI大模型引发了人机交互、认知协作、计算范式三场革命。
当我们说一个技术具有革命性的时候,这种技术对人类社会的影响可能是根本性的、全局性的和长期性。AI大模型带来了三场革命,它会重新定义产业的核心竞争力。
一是人机交互革命。人机交互是连接“碳基”和“硅基”的核心纽带。几十年前,人类要跟机器对话,需要掌握汇编语言,后来有了高级语言Basic、C、C++等,再后来有了图形界面交互,今天人们可以通过自然语言对话实现人机交互。从历史上看,每一次的人机交互技术的进步,都带来新一轮的产业重塑。
二是认知协作革命。AI大模型重新定义了解决问题的路径和方法,它找到了从问题到答案的最短路径,这就是AI大模型的价值。人机交互也将带来协作革命,大模型驱动的智能体会逐步深度嵌入各类组织的需求定义、应用开发、运维管理和资源调度等环节。
三是计算范式革命。计算范式革命的表现就是十年前英伟达的市值只有英特尔的六分之一,今天英伟达是英特尔的10倍,这意味着这个时代从“以CPU为核心的计算体系”正加速向“以GPU为核心计算体系”进行一次巨大的迁移。这个迁移会从服务器、云计算开始,并逐步拓展到普通人使用的手机、笔记本电脑等等。未来计算的芯片、架构、存储、网络、通信、调度等,以及与之相关的协议和软件开发范式,都会迎来一次巨大的变革。
AI大模型是数字技术体系的竞争,ChatGPT只是美国数字创新森林里的一棵树上的一片叶子,Sora是另一片叶子。
当讨论AI创新的时候,我们不能只盯着ChatGPT、Sora这两片叶子,当下所有的聚光灯都聚焦在这两片叶子上,都快把这个两片叶子“烤黄”了。需要思考的是:这棵树是什么样子?树根什么样子?土壤什么样子?森林什么样子?只有这样,我们才可能找到今天缩小中美AI创新差距的正确路径。
我们需要思考一个基本问题:为什么又是美国在这一轮的AI大模型浪潮中引领全球呢?我们认为主要有5个原因:
一是AI基础理论模型的突破。2017年谷歌发布了Transformer模型,成为这一轮大模型突破发展的基础。
二是“AI+GPU”算力新Wintel体系的崛起。这个生态体系就相当于IT时代的Windows+Intel,移动互联网时代的ARM+安卓。“AI教父” Geoffrey Hinton的学生在2012年的ImageNet大规模视觉识别挑战赛(ILSVRC)上获得了冠军,获得冠军不重要,重要的是他将模型的训练从CPU切换到了GPU,当时他使用了两个NVIDIA GTX 580 GPU,训练了一个名为AlexNet的神经网络模型,大幅提高模型训练效率、同时降低了训练成本,引发了新的深度学习革命,此后GPU成为学术界、产业界训练AI模型的“标配”。
三是云计算大规模的推广和普及。大模型需要大算力,大算力需要新技术和低成本,云计算为大模型的训练创造了条件。
四是互联网的发展为AI在数据、工具、人才、场景等方面进行了积累。
五是美国具有全球影响力的开源开放创新生态。这一点远远被我们所忽视。因为开源开放生态很大程度上还决定了今天AI大模型的推广速度、广度和深度,也将深度影响今天AI大模型的商业模式。
今天讨论AI大模型,最重要的一个议题是,AI对一个产品、服务、产业意味着什么?对于一个个体、企业、区域、国家的竞争力意味着什么?
结论是,AI大模型将会重构产业的核心竞争力。这种“重构”,或短期或长期,或渐变或突变,或润物细无声或疾风暴雨式。重要的是,这一进程是确定的、不可逆的。
问题是,未来3-5年,哪些产业的竞争力会被AI大模型重新定义,以及以什么方式重构定义?
AI大模型对一个产业核心竞争力影响可以分为三种状态:一是高敏感行业,如手机、PC、汽车、人形机器人、影视、短视频、游戏;二是中敏感行业,如生物、医药、新材料、机器人、保险、法律、教育等;三是低敏感行业,如发电、化工、工程机械等。
在不同行业,AI大模型对涉及产业竞争力的哪些关键环节产生了影响?麦肯锡对16个AI应用场景进行了研究,结论是,软件工程、产品开发、客户运营、市场营销是AI创造价值的主要领域。
AI大模型重构产业竞争力的五种模式
AI大模型将会重构产业的核心竞争力,那底是如何重构的?我认为主要有五种路径和模式:
(一)模式1:产品竞争力升级(AI for Product):重新定义终端智能化水平
今年1月,美国拉斯维加斯消费电子展(CES)的核心关键词是AI,PC、手机、汽车、智能家电、可穿戴设备等,已经和大模型开始结合,三星发布首款AI手机Galaxy S24,联想发布AI PC,奔驰等车企升级人车交互系统。
AI大模型将重新定义产品智能化水平,重新定义产品核心竞争力。中国的手机产业占了全球的67%,PC占全球的30%,电动汽车产量占了全球的60%,大模型正在不断融入这些产业功能。关于AI+智能产品,有几个基本的判断:
判断1:AI手机将成为继功能机、智能手机之后,手机行业的第三阶段。如果一家手机厂商没有赶上这一波AI大模型应用,那么可以非常确定地讲,全球任何一家优秀的手机公司,也会沦为一个二流公司。
判断2:我们不知道AI会给手机增加多少新功能,但我们知道的是,没有AI大模型驱动的手机肯定会在市场上消失。也许今天有人认为AI大模型在手机上的功能是鸡肋,没那么惊艳;但肯定的是,没有大模型的手机,没有未来。
判断3:2024年是“具车智能”元年,而且会首先诞生在中国车企,强大的AI基础大模型是具车智能的关键。人工智能好比是一个“大脑”,这就像一辆车只有发动机不行,还需要底盘、轮胎、方向盘。光有一个大模型还不够,需要和机器结合起来,所以有一个词叫“具身智能”。显然,AI大模型也可以进入到汽车领域,我们把它称之为“具车智能”。
判断4:模型上机并与云端协同,将成为智能终端大模型商业化的重要形态,AI开源大模型的重要性进一步突显。未来的大模型会有很多类型,参数相对小的模型,可以装进手机、汽车等各种智能终端设备里。今年的3月28日,阿里云宣布通义千问已经基于联发科处理器,把大模型“装进”并运行在手机芯片中,打造端侧AI的Model-on-Chip(片上大模型)部署新模式,这是通义大模型首次完成芯片级的软硬适配,标志着Model-on-Chip的探索正式从验证走向商业化落地新阶段。
不仅如此,未来所有的智能硬件都会被AI大模型所驱动。这句话的关键词是“所有”,或者说一切的智能硬件都会被AI大模型所驱动,包括手机、PC、汽车、机器人、家电、可穿戴设备等等。未来无论是何种形态的机器人、无论何种形态的终端,其核心竞争力就在于它是被什么样智力水平的大模型所驱动。
(二)模式2:创新效率变革(AI for Science& Tech):研发范式的跃迁
近年来,AI4S(AI for Science)成为一种基本科学研究方法, AI大模型正在加速全球芯片、药物、病毒、材料、自动驾驶等一系列科研范式的创新突破,其深刻影响正逐步显现。
AI与EDA双向奔赴,引领芯片设计变革。
今天,AI已经成为芯片设计的“器”,AI与EDA的双向奔赴,推动着芯片设计开启下一场革命。英伟达用AI设计GPU,比传统EDA减少25%芯片面积,功耗更低。英伟达研究人员提出了PrefixRL——用深度强化学习优化并行前缀电路。英伟达Hopper架构H100就拥有13000个AI设计电路。EDA设计公司Synopsys和Cadence等公司积极拥抱AI设计。
AI预测蛋白质结构,加速新药研发进程。
蛋白质在疾病发生中起着举足轻重的作用,例如在阿尔茨海默病中,它们会折叠和聚集,在癌症中它们的调节功能丧失。确定蛋白质的结构,对于药物研发至关重要。以往确定蛋白质结构的冷冻电镜等技术,既昂贵又耗时,而且确定的数量比较有限。2022年,DeepMind通过AlphaFold2模型,预测了2.2亿种蛋白质结构,覆盖DNA数据库几乎所有已知生物体的蛋白质,解决了长期困扰生物医学研究领域的难题,为加速生物医学研究打开了大门。2023年9月,DeepMind首席执行官Demis Hassabis以及该公司科研人员John Jumper,因AlphaFold获得了有“诺奖风向标”之称的拉斯克基础医学奖。
AI生成驾驶决策,革新自动驾驶研发模式。
特斯拉的自动驾驶FSD V11版本有30万行代码,是基于海量标注+规则代码;而FSD V12版本只有2000+行代码,其技术路线是海量数据+BEV+Transformer。2023年9月2日,1200万人围观马斯克特斯拉自动驾驶,他试驾后讲的最重要的一句话是,“没有一行代码让特斯拉在停车标志处停车”。大模型带来了自动驾驶研发模式的跃升:从规则代码输出的驾驶决策,到基于AI大模型生成的驾驶决策。
AI推理未知材料性能,催生材料研发新路径。
材料科学是近代工业飞速发展的支柱学科。从石器时代到青铜时代,再到铁器时代,人类文明的各个演化阶段都和材料紧密相关。今天,AI正在变革材料研发的路径:从过去的理论计算获得材料科学数据,到高通量计算生产海量此类数据,再到将数据喂给人工智能模型,到借助模型推理未知材料性能。2023年11月底,Google旗下的DeepMind,通过AI模型——GNoME,寻找到38万余个热力学稳定的晶体材料,极大加快了发现新材料的速度。2024年1月,微软等机构利用AI和高性能计算,从3200万种无机材料中筛选出了一种全固态电解质材料,完成了从预测到实验的闭环,该技术可助力下一代锂离子电池材料研发。
AGI:重构人类认识世界方法论
当我们把AI带来的科研效率变革抽象出来,我们会看到:AI大模型其实是在重构我们认识和改造世界的方法论。近几百年来,人类社会认识客观世界的方法论大致经历了四个阶段:
从牛顿、爱因斯坦的“理论推理阶段”,人们通过观察、抽象和数学认识这个世界;到爱迪生在一百多年前发明电灯泡,这是一个“实验验证阶段”,通过假设、实验、归纳总结来认识这个世界;然后再到了80年代进入到“模拟择优阶段”,大飞机的研发,高铁的研发,基于样本数据和机理模型,通过数字仿真的方式去认识和改造这个世界。
到今天,AI for science新科研范式和模拟择优有什么区别?模拟择优阶段,如研发波音777,所有的机理都是清晰的;但今天AI大模型还处于“前牛顿时代”,科学家也搞不清楚为什么会有涌现、泛化,但它已经创造出巨大的经济社会价值。
(三)模式3:AI原生产业兴起(AI-Native Industry)
AI大模型正在催生AI原生的新兴产业。
互联网时代的原生产品最典型的就是Google,他解决的是信息流转跟匹配,解决的是信息不对称的问题。而AI原生产品是基于AI大模型创造的新产品,也就是说,如果没有AI大模型,就不会没有这样的产品出现,也不会有这样的应用场景。提供AI原生产品和服务的企业,叫AI原生企业,这类企业的核心竞争力来源于 AI 驱动的业务体系,解决决策效率与成本问题,能够找到答案的最短路径,进而提升效率和竞争力。
AI大模型重构机器人产业的核心竞争力
今天,可能有人认为大模型只是生成个文字、图片、视频等,事实上它已经进入到了机器人,也就是进入到物理世界。2023年7月28日,谷歌DeepMind推出了一款新的机器人模型Robotics Transformer 2(RT-2)。这是一个全新的视觉-语言-动作(VLA)模型。例如,对AI说“捡起已灭绝的动物”,机械臂会在一堆塑料玩具中精准的选择恐龙,“灭绝的动物”很多,在此之前,机器人无法做到把“灭绝的动物”和“塑料恐龙玩具”联系在一起。
近期,很多人也关注到了:OpenAI在今年2月投资了一家机器人公司Figure AI,获得投资的13天后,Figure AI公司就推出了OpenAI大模型加持的机器人产品——Figure 01,它基本可以完全理解人类的自然语言指令和意图并执行相应动作,更重要的是,通过Figure AI公司公布的视频,我们能看到Figure 01已经具备很好的理解能力、分析能力、规划调度能力和执行能力。
不仅如此,其实大模型+机器人已经实际商业落地了。比如浙江有一家机器人公司叫有鹿机器人,它的路面清洁机器人集成了通义千问开源模型,使机器人能以自然语言与用户进行实时交互,理解用户提出的需求,完成用户交办的任务。比如,物业经理说“一号楼门前有个可乐瓶,你过来扫一扫”,机器人就能找到这个位置、完成清扫任务。
以上这些案例,归结为一句话就是:AI大模型正在重新定义机器人产业的核心竞争力。当别人的机器人产品都有一个大模型作为“最强大脑”的时候,如果你的机器人产品没有这样的大脑,它还能卖得出去吗?显然是不能的。未来,机器人拥有一个“大脑(大模型)”会成为标配,成为机器人产业核心竞争力的核心组成部分。
当大模型不断涌现的时候,也会催生很多独角兽企业,我们看美国已经有很多的AI原生企业,比如OpenAI、Anthropic、CoreWeave等等,其中的AI独角兽层出不穷,它们的估值、收入、客户均不断创出新高。AI原生企业是智能时代国家产业竞争的风向标,其数量和质量将深度影响产业竞争格局。福布斯2023年“AI 50榜单”显示:美国AI创业公司共42家,占比84%。美国呈现出“千亿级+百亿级+十亿级+几亿级”不同规模、不同行业的AI原生企业,产业生态持续繁荣。
(四)模式4:体验升级与决策优化(AI for Industry):对外体验升级+对内自动化决策
AI大模型通过优化组织内部的的决策流程,对外可以提升用户的体验,对内可以提升组织的自动化决策效率。
AI大模型重构一切软件系统:重新定义客户体验,个性化服务实现规模化供给
去年在GPT-4刚推出不久,《美国医学会杂志》做了一个测试实验,让一群病人和真正的医生和“ChatGPT医生”对话,测试的结论是:面对病人咨询中,“ChatGPT医生”获得好评的数量是人类医生的4倍;在“富有同情心”的指标中,“ChatGPT医生”更是收获了45%的肯定,而人类医生仅有4.6%。
基本趋势是:大模型生成代码的价值,将远远超过生成文字、图片、视频的价值,但是这个价值被远远低估了。因为未来AI大模型将重构一切软件系统,所有的软件都需要基于AI大模型重新做一遍。这句话的关键词是“所有”。“所有”的含义是:手机上所有的APP会被重构,PC里的Windows、Office等等软件会被重构,ERP、PLC、SCADA等等这样的企业级软件也会被重构,未来还会有很多的应用场景。
游戏产业正因为AI大模型的加持而增加新的体验和玩法,81%的玩家表示愿意为此支付更多钱,微软、谷歌以及新兴游戏企业,纷纷加速AI驱动的游戏产业创新。网易《逆水寒》手游最大的亮点是,游戏中有数百个AI引擎加持的智能NPC(non-player character,非玩家角色,游戏中不受真人玩家操纵的角色)。
基于人机交互的复杂系统自动化决策。
AI带了一场决策革命,会融入到企业经营管理决策中。比如电力系统出现故障,面临设备故障定位周期长、有经验的调度员稀缺、调度方案生成不及时等挑战。而通过AI大模型的“加持”,可以秒级生成高质量的调度方案,实时指挥多名在线保电人员。浙江电力的AI虚拟调度员“帕奇”,通过大语言模型,AI理解并下达调度指令,自动核实指令完成,从人工派单到AI派单,实现高效的电力调度。在杭州一个区的电网调度早晚高峰中,降低人工调度量40%,降低重复无效话务量22.5%。
(五)模式5:新生产力工具涌现(AI for Productivity):智能时代的工具革命
AI大模型带来一场工具革命。
数字化本质是两场革命:工具革命+决策革命。工具革命就是从“传统能量转换工具”向“智能工具”演变。马克思曾说“手推磨产生的是封建主的社会,蒸汽磨产生的是工业资本家的社会”,“各种经济时代的区别,不在于生产什么,而在于怎样生产,用什么劳动资料生产。”无论是体力劳动者,还是脑力劳动者,通过新的工具,可以提高生产、研发效率。今天因为有了AI大模型,我们的生产力工具再次处于被重构和再造的阶段。
AI驱动软件工具创新:开发模式重构,软件开发开启效率变革
软件行业是过去几十年人才最稀缺的行业,AI大模型正在改变这一格局,AI软件开发和编程能力正在逼近人类。去年4月GPT-4发布后,国内研究机构CSDN的测试结果是:GPT-4的软件编程能力相当于中国月薪3万人民币的软件开发人水平。在美国,GPT-4通过了谷歌编码L3级工程师测试,L3属于入门级,平均有18万美元的年薪。
软件开发:10%的1000倍效应
肯特·贝克(Kent Beck)是全球软件开发方法学的泰山北斗,软件开发模式、敏捷开发的领导者,他就AI大模型对软件开发的影响有一个著名的断言:软件开发90% 的技能变得分文不值,而10% 的技能会被提升1000倍,软件开发者的能力模型将会根本性的改变。
今年4月2日,阿里云新入职了一名新员工——通义灵码,它不仅有正式的员工工号——AI001,还有自己的主管和HR。通义灵码具备强大的代码理解与生成能力,支持代码补全、单元测试生成、代码解释、代码查错等核心场景,已熟练掌握 Java、Python、Go、C/C++等200多种编程语言,目前下载量超过200万,每天数百万行代码被程序员采纳,每日推理次数超过2000万。未来阿里云20%的代码将由通义灵码编写。
根据对2.6万名软件工程师的调研,84%的软件开发者或多或少使用AI了工具,五分之三的受访者认为AI编码工具将从根本上改变软件开发就业市场,但只有13%相信AI将完全取代开发者编写代码。尽管如此,大约三分之一的人相信软件工程一定会变成提示工程。
近期,美国技术圈热议一个招聘案例:一家技术公司准备招聘1名员工,有2名程序员来应聘:一个是拥有4年的编程经验的巴基斯坦人Hamid,一个是拥有19年的编程经验德国 人Alex,公司安排两个候选人开发一个软件(创建最小可行性产品MVP)。一周后,Hamid完成了95%的MVP,而Alex只完成了7%的MVP。为什么只有4年编程经验的人反而编程速度更快呢?因为他借助了GitHub Copilot等代码大模型。不仅编程效率更高,整个开发成本也极大降低。
影视行业工具革命
AI大模型对影视行业的变革已经拉开序幕。今年3月6日,美国好莱坞上演了一部影片,叫《终结者2》,它是由50位AI电影艺术家利用Midjourney、Runway、Pika、Kaiber、Eleven Labs、ComfyUi、Adobe等多个AIGC工具进行创作而成。还有一些其他人利用文生图及视频工具制作的视频,质量和效果看起来都还不错。去年阿里云也推出了一项名为Live Portrait的数字人视频生成工具,用户只需上传一张照片和一段文本或语音,即可生成一段开口说话的数字人视频。这项工具可应用于视频直播、聊天机器人、企业营销等多个场景。
当然,也有人会说,这个Sora不就是生成一段视频吗?王坚院士有一段非常经典的评论:“如果谈到Sora,只说它可能会影响短视频等行业,那我觉得是对它极大的羞辱,它的意义远超这种事情。”
Sora的重要的意义在于,在世界模型的建构上,迈出重要一步。它让虚拟世界模仿现实物理世界,理解世界物理属性,如重力、摩擦力、动能、光、声、电、材料、生物等的规律。
用一句话来概括就是:在比特的世界中还原原子的运行轨道。
中国AI大模型的两条道路 移动互联网的超越 VS.加拉帕戈斯效应
今天,我们不仅要看到ChatGPT、Sora背后美国的创新森林体系。我们还要清醒地认识到,中国AI大模型发展已经走到了一个十字路口:向左走会走到“移动互联网的赶超”。向右走会走向“加拉帕戈斯效应”。
什么叫“加拉帕戈斯效应”呢?加拉帕戈斯是太平洋上的一个群岛。达尔文在一百多年前写的《物种起源》中提到,这个岛上有很多物种,每个物种都在自我进化、自我迭代、自我演进。但它一旦离开了这座岛,就会因为无法适应环境而死掉。
“加拉帕戈斯效应”本质上是在一个封闭的、局部的生态体系里,形成的非常弱的竞争力。在2B数字化市场,如果没有形成全国统一的大市场,一方面会导致市场丧失孵化培育大企业的能力;另一方面,也会让这个市场丧失优胜劣汰的能力,同时也不利于产业生态的建设。“加拉帕戈斯现象”提醒我们:要警惕在特殊背景和条件下形成的独特能力,并保持开放性,不断审视以往的成功,同时不断拓展边界。
造成“加拉帕戈斯效应”的三大原因
一是统一市场的“碎片化”。这样的市场无法形成统一大市场优势,数据要素与技术优势无法顺畅流动,这样的市场会丧失孵化“小企业”功能,也会丧失支撑“小企业长大的”功能。日本的手机产业、中国SaaS产业之所以没有发展起来,是因为他们面对的是一个高度碎片化的市场。比如中国的SAAS市场,以私有化、混合云为主的定制类政企项目,难以形成强大的SaaS标准化服务能力。
二是市场竞争的“关系化”。2B数字化市场主体会将首先将项目给到自己的儿子、孙子公司,市场丧失了对好技术、好产品、好服务的遴选能力,市场竞争从产品竞争转向客户关系。
三是市场生态的“盐碱化”。没有良性的投资回报,就无法孵化创新企业,丧失培育有持续有竞争力企业的产业生态。比如中国“AI四小龙”、SaaS等产业。
当前,中国大模型市场存在“加拉帕戈斯隐忧”,要高度警惕统一大市场的“碎片化”。定制化、私有化部署的大模型无法大规模商业化,成本很高、效率很低,会导致很多企业锁死在一个狭窄的赛道上,这是落后的产业模式,会导致大模型统一大市场的“碎片化”。
只有公共云才是新质生产力的代表,私有云不是。如果用公共云的方式来做大模型,发挥公共云集约化、规模化优势,提供平台化的服务而不是项目化的服务,这样不仅可以大大降低模型训练推理成本和创新门槛,更为重要的是:中国完全有机会依托统一的消费大市场、算力服务大市场和AI服务大市场,像当年中国发展移动互联网产业一样,再次实现产业的繁荣和全球领先。(本文完)
审核编辑:刘清
全部0条评论
快来发表一下你的评论吧 !