GPU如何突破算力供需瓶颈

沐曦MetaX 2023-08-22 964

描述

近日，2023中国算力大会在宁夏银川举行，沐曦集成电路（上海）有限公司（下称“沐曦”）联合创始人、CTO兼首席硬件架构师彭莉受邀出席由中国信息通信研究院、中国互联网协会联合举办的智能计算论坛，并担任演讲嘉宾，探讨后GPT时代算力需求激增带来的挑战以及GPU如何突破算力供需瓶颈、推动人工智能产业普惠化发展。

沐曦联合创始人、CTO兼首席硬件架构师彭莉

发表主题演讲

在题为“后GPT时代的算力需求”的演讲中，彭莉预测大模型商业模式将分为通用计算市场和专用定制化市场两大类：在通用计算市场，大语言模型将终结多数NLP任务，NLP技术水平被强行拉平，通用大模型或被大厂“垄断”；而在专用定制化市场，开源大模型将呈现百花齐放的发展态势，可针对私有数据、敏感数据进行快速定制和领域对齐，大模型开发和部署能力将趋于普及化。

彭莉指出，区别于传统AI，生成式AI技术可以借助接入类ChatGPT应用发挥显著的技术优势，为大语言模型的开发降本增效，同时也对算力提出更高和更迫切的要求。由于大模型训练的一次性成本被大规模推理摊薄，大模型盈利的一大难点是降低推理成本。沐曦致力于打造高效通用的GPU芯片及软硬件一体的生态解决方案，通过GPU软件生态优势、硬件架构优势、先进封装等方面全面提升GPU算力，降低大模型训练和推理的算力成本，在产品路线和生态战略上均可满足大模型对算力基础设施的大规模需求，为推进智能产业可持续发展打造坚实的算力底座。

审核编辑：彭菁

打开APP阅读更多精彩内容