云天励飞AI推理芯片如何赋能千行百业

描述

11月26日,云天会客厅第二期生态沙龙暨深商联高科技高成长创新营走进上市公司活动圆满举办。来自深圳科技领域的多位企业负责人齐聚云天励飞,共同探讨AI推理时代的技术变革、产业机遇与落地挑战。

本次活动亦是高科技高成长创新营的正式启动。作为由深圳市商业联合会面向高潜力科技企业打造的系统化成长加速平台,创新营旨在链接前沿技术、产业场景与资本资源,推动AI、算力、先进制造等关键能力的协同创新与应用落地。云天励飞副总裁郑文先担任创新营营长。

在致辞中,郑文先表示,创新营将以“链接前沿技术、赋能产业升级、共创增长生态”为使命,助力深圳高科技企业形成更紧密的创新网络。他分享了云天励飞在AI推理芯片与城市级场景落地的实践经验,希望借助创新营的平台优势,与更多企业伙伴开展开放合作,在可控成本路径下推动AI规模化落地,形成可复制、可推广的产业案例。

随后,深圳国际研究生院副教授、博士生导师郑海涛以“从传统AI到大模型:推理系统的变革”为主题分享研究观点。他指出,大模型正从“规模驱动”走向“推理驱动”“落地驱动”,核心在于强化归纳、演绎、溯因三大推理能力,并通过“思维链”(Chain-of-Thought)和“工具调用”构建具备感知、记忆、规划与执行能力的智能体系统。他强调,企业要用好智能体,必须先构建自身知识库,通过RAG等技术减少幻觉风险,并建立完善的数据安全与权限体系,培养懂业务、懂AI的复合型人才。大模型是能力放大器,既能放大优势,也会放大管理中的薄弱环节。

在技术落地层面,深信服云计算解决方案总经理杨廷柱分享了企业“上AI”的现实痛点及AICP平台实践。他指出,企业普遍面临复合人才缺乏、GPU投入大且需求难以预测、大模型引入后运维复杂度显著提升等挑战。针对这些问题,深信服打造AICP平台,通过兼容多品牌GPU实现异构算力池化管理,并针对大模型与MoE场景进行调度、并行和显存切分优化,从而提升资源利用率、降低单位Token成本。平台还内置模型仓库和统一API网关,将深信服的安全基因下沉为大模型的“安全护栏”。目前,AICP已在公司内部支撑上百个AI应用,并在金融、制造等行业落地。杨廷柱建议企业在布局AI前,应优先打牢“算力底座—安全体系—知识资产”三大基础,再稳步推进应用规模化。

围绕算力创新方向,云天励飞AI芯片方案专家赵治平带来了“从训练走向推理的算力变革”主题分享。他指出,随着深度学习和大模型的快速演进,行业关注点正从“如何把模型训得更大”转向“如何以更低成本、更高能效运行模型”。相比训练导向的通用GPU集群,推理基础设施更强调能效比、单位Token成本、并发能力与云边端协同。基于这一趋势,云天励飞面向推理场景自研专用架构,通过专用指令、存算一体、3D DRAM堆叠与高带宽互联技术,在制程受限条件下依然显著提升单位功耗的推理吞吐,为产业提供高性价比的国产AI推理算力底座。

在随后的主题研讨环节,嘉宾们围绕AI落地过程中面临的实际问题展开深入讨论,从算力供需、模型工程化,到推理成本控制与产业场景机遇,观点碰撞充分,现场交流氛围热烈。活动不仅展示了深圳科技企业拥抱AI时代的前瞻思考,也为产业协同提供了高密度、开放式的交流平台。

面向未来,云天励飞将继续发挥AI推理芯片方面的技术优势,持续打造专业化的生态交流窗口,通过更多形式的行业沙龙、开放日与合作项目,连接更广泛的产业伙伴,共同探索AI在城市治理、智算、机器人等关键领域的深度落地路径。希望未来能够与更多创新企业一道,把握新一轮技术变革的战略机遇,在推理时代贡献更多可规模化、可持续的“中国方案”。

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分