海光信息DCU平台完成对DeepSeek V4模型极速适配

描述

4月24日,深度求索正式发布并开源DeepSeek V4。海光DCU同步完成对DeepSeek V4的Day0适配,以“模型发布—芯片适配—产业落地”的高效闭环,为全球开发者、企业客户提供即取即用的部署方案。

海光DCU团队一直重视“国产大模型+国产算力”的联合创新,致力于以软硬协同的方式促进AI模型部署降本增效。本次适配过程中,海光DCU对DeepSeek V4模型实现深度调优,再次达成业界领先的计算效率。

全栈生态,支持更快迁移

依托海光DCU通用架构与全精度优势,DTK(异构计算平台)以完整成熟的计算库覆盖训练、推理、AI4S等全场景,为DeepSeek V4提供完整的软件生态支撑。

多重优化,实现更高性能

DAS(人工智能基础软件系统)集成超2000个算子,支持Pytorch、TensorFlow、vLLM、SGLang等100+主流AI框架组件,通过算子调优、编译优化、通算融合等多重技术,极致释放海光DCU算力,大幅提高DeepSeek V4微调与推理性能。

应用落地,激发创新潜力

DAP(人工智能应用平台)内置知识库引擎、智能体编排引擎等高阶模块,搭配OpenDAS开源拓展套件与光源模型仓库,面向OEM、伙伴、客户深度开放,可将DeepSeek V4便捷集成到主流AI平台。

依托自研AI软件栈+开放生态协同优势,海光DCU现已完成400+国内外主流大模型联合优化,覆盖全球99%非闭源大模型。包括DeepSeek、Qwen、智谱GLM等模型在内,均已实现“发布即适配、上线即可用”的高度同频。

在AI技术迭代与算力底座的协同步调下,海光正深度参与到超大规模计算基础设施建设:由数万张DCU组成的算力集群为多个万亿参数大模型训练提供可靠支撑,在技术成熟度、生态开放性与工程化能力方面均处于业内领先水平。

目前,基于海光计算平台的开放者生态越发壮大,光合开发者社区已汇聚超50万开发者,覆盖1200多所高校及企业。得益于国家级赛事、实战训练营、实习招募等多重资源赋能,海光DCU开发者正迎来从入门到进阶、从学习到实战的全周期成长路径。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分