沐曦致力于为客户构建软硬件一体的全面生态解决方案

描述

近日,elexcon 2023深圳国际电子展在深圳会展中心圆满落幕。沐曦集成电路(上海)有限公司(下称“沐曦”)携自主研发的全栈GPU芯片产品及解决方案亮相本次大会,沐曦AI解决方案总监虞新阳应邀出席并发表主题演讲。本次大会以“智能、创新、开源”为主题,汇聚近千家国内外优质企业和专家,涵盖从产品设计到应用落地的上下游产业,展示全球产业动态及未来技术趋势。

沐曦AI解决方案总监虞新阳发表主题演讲

在GPU技术与生态专题论坛中,沐曦AI解决方案总监虞新阳发表了题为“智能时代的GPU算力构建”的主题演讲。虞新阳表示,随着ChatGPT这一标志性产品的发布和发酵,人类迈向智能化时代。信息化革命使人类能够在数字世界中劳动并创造价值,智能化革命则能够将人本身从各种劳动创造中解放出来。以大模型为例,这一在特定应用场景具备超越人类能力的AI工具将彻底重构人类社会,为人类创造巨大的价值。从整体上来说,大模型越大效果越好,ChatGPT以Transformer结构为主干,包含了1750亿的参数,模型训练及推理都需要很大的算力系统做支撑。近几年来,语言大模型主体结构从Bert到T5转换到了GPT,预计接下来还会持续进化;语音图像的AIGC主要包含GAN、VAE、Flow和最近火热的Diffusion这4种生成方式,接下来也将继续迭代并相互融合。在智能化过程中,模型和算力展现了双螺旋协同和促进关系,大模型依赖海量的GPU算力进行迭代,另一方面GPU算力架构本身也需要随着模型而更新。沐曦千亿参数AI大模型训练及通用计算GPU曦云C500一方面包含了很强的计算性能和存储带宽,另一方面基于MetaXLink 2.0有很强的卡间通信能力。在芯片基础上,沐曦构建了强大的MXMACA软件栈,依托通用计算架构、先进的算子库和编译器能力,能够原生支持PyTorch、TensorFlow以及国内的飞桨、MindSpore等框架。曦云C500芯片回片短短2个多月内,已能流畅地运行Stable Diffusion,LLaMA 65B,LLaMA2 70B以及国内ChatGLM等模型。

 

在GPU应用圆桌论坛中,虞新阳与来自清华大学软件学院、中国科学院大学、清华大学集成电路学院、武汉理工大学、上海交通大学电子信息与电气工程学院、华南理工大学的专家学者一同探讨GPU算力芯片如何支撑国内大模型应用落地。虞新阳表示,国内上层应用市场已走在世界前列,国产GPU厂商要在布局及建立底层能力的同时,充分拥抱结合上层应用的发展并进行持续的迭代创新。沐曦的产品和解决方案能够全面兼容主流GPU生态,最小化存量用户迁移成本,为客户构建软硬件一体的全面生态解决方案。国产GPU生态的建设不仅需要本土GPU厂商的努力,还需要软件解决方案商等上下游合作伙伴携手共进。

        审核编辑:彭菁

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分