质疑大模型,理解大模型,用上大模型

描述

2023年,以聊天机器人ChatGPT爆火为代表,起起伏伏、整体向上的人工智能产业迎来了大模型时代。

回溯过往,人工智能的发展经历了三个阶段:

第一次是上世纪末的专家系统时代,特征是将专家的领域知识转变为计算机模型,用以推理并得出与专家相同的结论。

第二次是不久前的“机器学习+深度学习”时代,在以CNN、RNN为代表的神经网络的赋能下,比如车牌识别、人脸识别这类计算机视觉应用,识别准确率从过去的92%、93%,提高到了99%以上,在该阶段有部分产品彻底实现了产品化、规模化应用。

第三次即是眼下的大模型时代,起源是2017年谷歌发表的一篇论文《AttentionIsAllYouNeed》,里面提出了革命性的Transformer深度神经网络,一举将深度学习的模型参数提高到了上亿级别,并且在之后的迭代发展中,模型参数被逐步提升到了几十亿、几百亿甚至几千亿,意味着模型的复杂程度和学习能力逐步提高,越来越有接近人的表现。

换句话说,大模型产品并非采用上个时代模型参数受限的CNN、RNN架构,而是借助Transformer另起炉灶,达到了一种类似“小孩开窍”的「涌现」现象——当模型突破某个规模时,能力水平直线上升。

这样一来,大模型能做的事情变得更多了,并且效果更好,比如文本生成、语言理解、知识对话、逻辑推理等等。

再由于Transformer是一项新技术,无论是传统玩家还是新兴企业都处在接近的起跑线,所以业界参与大模型的玩家非常多、类型非常广,各方都希望通过大模型抓住新一轮产业机会。

此时,为了深入探究大模型与物联网行业是否存在关联?大模型是否将创新IoT产品或改善企业流程?物联传媒记者特别采访了中科创达物联网事业群副总裁杨新辉先生,基于中科创达近来在大模型领域的诸多动作,询问行业及企业的详细信息,希望增进大众对大模型的了解。

中科创达大模型产品基本信息一览:

产品名称:中科创达魔方RUBIK大模型

产品定位:为行业客户的智能化升级提供AI赋能

产品规划:全面覆盖了从边缘端(RUBIK Edge)、语言大模型(RUBIK Language)、多模态(RUBIK Multi-Modal)、机器人(RUBIK Robot)等大模型系列,并积极探索大模型在不同行业场景的落地应用。

以下是杨总和物联传媒的对话精选。

Part 1:

中科创达的大模型产品特征

物联传媒:根据2022年财报,中科创达的营收可以分出三类来源,分别是智能软件业务、智能汽车业务、智能物联网业务,三者营收占比均接近三分之一,并且智能物联网业务较上年同期增长39%,增长仅次于汽车业务。请问对于智能物联网业务,可否向我们简单分享它的起源与发展方向。

杨新辉:中科创达成立于2008年,是全球领先的智能操作系统产品和技术提供商。得益于移动互联网时代来自智能手机的爆发式需求,中科创达业绩快速增长并于2015年在深交所上市。随着发展向前推进,物联网行业兴起,中科创达物联网业务最早开始于2016年,寄托了我们将操作系统从智能手机推进到物联网的目标。

我们物联网业务的定位是硬件产品及解决方案提供商,覆盖从智能模组、参考设计、到整机,再到物联网平台的端到端完整方案。但中科创达的优势还是操作系统及基于操作系统构建的软件和解决方案,包括端侧、边缘侧操作系统,再加上AI算法、平台管理能力。

神经网络

物联传媒:在所有业务中,了解到大模型是公司比较新的一项业务,公司基于哪些原因推出了大模型?

杨新辉:主要是基于对产业发展的洞察,大模型有望推动产业产生结构性的变化,虽然这还是一件长远的事,但我们看得到趋势正在形成,中科创达也愿意拥抱、布局新兴技术来给产业赋能。

物联传媒:公司大模型产品的定位和用途是什么?

杨新辉:我们的大模型产品叫中科创达魔方RUBIK大模型,定位是在边缘侧和端侧产品上优化交互,以及面向企业提供基于模型的AI服务。

为方便理解,可以将我们的业务拆分为两部分:

一部分是产品创新,就是传统的手机、汽车、物联网业务,会通过大模型把AI能力补充上去,以创新内容交互的形式提高产品价值。比如市面上常见的语音实时转写终端,加入大模型能力后可以新增语篇规整、生成摘要、生成纪要等能力,显著提高一些岗位的工作效率;再比如汽车场景,传统座舱内不少用户困扰于繁杂的表盘信息,加入大模型能力后,智能座舱的出现为用户提供更直观、准确的交互和指导,跨越式提高了用户体验。

另一部分是流程创新或称为企业数字化转型,这部分的热门应用有智能客服、直播数字人等等。

物联传媒:现在中科创达魔方RUBIK大模型的应用规模如何?

杨新辉:坦白讲现在整个大模型行业都还处于发展早期,B端客户们也都还在理解、认知、思考、学习和研究大模型的阶段,用量方面还有很大增长空间。

但中科创达也都一直在努力推动应用落地。

今年6月,我们与高通合资成立的公司创通联达推出了旗下首款集成大模型的智能搬运机器人解决方案,使用户可以通过自然语言与智能搬运机器人交互,提出服务指令。

7月份,我们与北京智源人工智能研究院共同成立“魔方未来联合实验室”,希望推进大模型技术创新与成果转化,促进技术在智能汽车、智能机器人、智慧工业、智能物联网等领域的应用落地。

神经网络

Part2:

大模型与物联网行业的相关性

物联传媒:会不会存在场景不需要用到大模型,直接用之前一代的人工智能版本就够了呢?

杨新辉:这种情况是存在的。比如前面提的人脸识别、车牌识别应用,行业的成本、效率都足够好了,大模型就不需要往那个领域创新。但比如多轮对话,要让对方感知不到是机器人,就需要更换为大模型。大模型解决的是以前技术无法解决的问题。

物联传媒:我们前面聊了ChatGPT是一种大语言模型应用,但在实际的使用中,我个人感觉它在垂直领域产出有思想、有深度的内容还依然有不足。

杨新辉:对,这方面它还不是说要完全取代,但是大模型完全可以做好一个助理的角色了,包括收集过去的信息、整理资料、列出框架,并且耗时非常短。比如说写高考作文,人写完需要30分钟,大模型只需要30秒。

而且我们认为,大模型的重要性是可以比拟工业革命时期蒸汽机的出现。当时,以蒸汽机为动力的机械使纺纱、织布工序从人工转向自动,可能产生了10倍以上的产能提升;现在大模型出现,也在主打对智力工作进行替代或显著增强。

打个比方,我们把人工智能的技术能力想象为一个水平面,技术的成熟和完善相当于水平面不断被抬高,以至于盖过了一些岛屿和陆地,这些岛屿和陆地就是人类承担的部分工作。

这种情况下,假设说基于CNN、RNN技术构建的人脸识别、车牌识别等应用可以算是小模型,替代了10%的人类工作;那么到大模型应用里,对人类工作的替代率就可以达到30%-40%。

比例数据仅做参考,但根本上来说,大模型确实比此前几代人工智能技术能做的事情更多了,甚至现在新型的大模型可以去通过图灵测试,比如一些客服电话,可能当我们发现是机器人的时候,其实这个电话已经把想传达、想询问的信息说清楚了。

物联传媒:除了互联网应用,大模型将最先在哪些物联网场景有应用潜能?

杨新辉:今天我们谈的大模型浪潮主要还是在AIGC大的范畴里,即基于人工智能做内容产生。物联网场景里有内容产生的地方,比如说跟人有反复交互的产品类型,不管是语言还是图像形式,大模型就会有突出的应用价值。

物联传媒:既然行业整体处于发展早期,公司在该赛道上有哪些具体规划?

杨新辉:我们的模型会做一个长期的工作。

今年是先从语言模型开始,从百亿规模参数一直到千亿规模参数,大概会做五、六个档次。其中参数规模相对最小的一类(比如说70亿、130亿或者300亿以下参数),主要用在边缘和端侧设备上,这也是我们业务发展的重点。

到明年中期,预计多模态产品会出来,到时不止覆盖语言,也会覆盖图像类应用,并且这些产品也将逐步应用在边缘端和机器人领域。

物联传媒:我们应该怎么想象和理解大模型的发展潜能?

杨新辉:从产品角度来看,大模型就是一个软件形态的生产效率工具,把它用上去了,工作效率有望大幅提升。

从更产业化的角度来说,市面上好多需求都是由新技术来驱动的,因为没有新技术,用户没有替换的动力。大模型就是一项新技术。

比如现在我们看到一些品牌在酝酿、研发大模型手机,原因是用户换机的意愿已经大幅降低,当未来大模型手机产品出来并且切中用户痛点、爽点的时候,那就会驱动整个行业都用上大模型。其他很多行业也与此相似,大模型技术具有非常大的发展空间。

Part3:

大模型的建设与选型

物联传媒:您觉得大模型有没有技术门槛?

杨新辉:大模型的技术门槛其实很高,壁垒主要有三个——数据、算力和算法,这三者分别代表了数据获取及清理能力、投入资金水平、技术复杂度,除了部分头部企业,很多公司无法长期投入在所有这些事上。

物联传媒:在客户了解大模型产品时,势必会看到行业中有不少开源产品,您是如何看待开源大模型的?

杨新辉:现在开源模型的确有很多,可能初步能满足用户使用的需求,但在商业场景,开源产品存在的风险不容忽视。

举个简单的例子,国外的开源模型可能就没有做过与国内价值观、风俗文化等方面的对齐,这才有模型区域化的趋势,很难存在一个模型全球都好用。

另一方面,我们认为大模型并非是一个直接套用的标准化产品,它的商业模式更多是“产品+服务”,所以大模型应该有很多服务阶段,比如对企业业务的咨询、对数据的理解、对模型的训练/部署/调优,本质上是一个非常复杂的工作,需要有非常复杂的、全栈的技术团队才能把这件事做出来,这不是开源产品能保证效果的。

物联传媒:结合现在热闹的情况,您认为最终行业会留下多少大模型?

杨新辉:通用模型可能只会剩下几个,但是在垂直行业领域,面向不同的数据基础会存在很多的领域模型。

领域模型与通用模型的区别,就好像专科医生与普科大夫,专科医生势必在专业领域里能力更强,并且会有非常多类型的专科医生。

物联传媒:中科创达大模型产品的定位是专科医生还是普科大夫?

杨新辉:我们还是会先训练出一个普科大夫。因为从根本上说,中科创达的定位是提供基础的、底层的技术,以第三方平台的身份,帮助垂直领域有数据资产的企业更快构建属于他们自己的模型而不用从0开始。

当然,后期当我们参与的行业、服务的企业、经验的积累足够多时,也就有机会直接向他们提供专业的垂直行业模型。

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分