电子发烧友网报道(文/吴子鹏)当全球AI竞赛进入白热化阶段,算力已成为决定行业竞争胜负的核心战场。经中国信通院测算,2025年全球计算设备算力总规模为4495EFlops,同比大幅增长117%,其中智能算力规模达3846EFlops,占总算力比重85%。预计未来五年全球算力规模将以超60%的增速持续增长,至2030年全球算力总量将突破50ZFlops,智能算力占比将超95%。
然而,随着应用场景从传统科学计算,延伸至深度学习、大模型训练、跨学科智能科研等多元领域,单一的通用图形处理器(GPU)或中央处理器(CPU)架构已难以适配行业发展需求。并且,在国家超级计算无锡中心创新发展大会期间,太初元碁联合创始人兼首席运营官乔梁接受电子发烧友网采访时表示:“受国际制裁影响,国际大厂的高端GPU、CPU资源供给极度稀缺,国产化算力替代已经成为行业发展的必然趋势。”
在此行业背景下,太初元碁走出了一条差异化、特色化的“超智融合”发展路径——以异构众核架构为核心,深度融合高性能计算(HPC)与人工智能(AI)技术,为AI产业提供高效、自主、可扩展的一站式计算解决方案。
超智融合:HPC与AI的双向赋能,重构计算范式
过去十年,超级计算行业完成了从“超算排名军备竞赛”到“落地产业实际应用”的核心范式转移。而AI技术的快速迭代,为沉淀十年的国产自主超算技术路线,开辟了全新的产业化赛道。传统技术体系中,超算的核心依托HPC技术,主打高精度、高稳定性的科学计算;AI技术则聚焦大规模并行数据处理与智能推演,两大技术体系边界清晰。但随着行业场景持续升级,HPC与AI的技术边界正逐步消融,形成双向赋能的发展格局:
·AI迭代依赖HPC的大规模并行能力:千亿、万亿级大模型训练需要数万乃至数十万张算力卡协同集群作业,核心技术逻辑与超算大规模集群调度、并行计算技术高度契合。
·HPC升级借力AI的智能化能力:传统科学计算长期面临数据量大、计算维度高、迭代周期长的“维度灾难”,AI智能算法可有效简化计算流程、压缩迭代周期,大幅提升科研计算效率,加速基础科研落地进程。
乔梁表示,超级计算机早已不再是单纯服务于科学计算的专用设施,正与AI深度融合,转型为普惠各行各业的通用算力基础设施,如同电力网络一般,以多元化形态、多类型算力节点,为全行业输出稳定、高效的智能算力。
与此同时,市场竞争加剧倒逼企业加速技术创新与产品迭代,HPC与AI的深度融合能够帮助企业提升核心技术竞争力,快速响应市场需求、缩短产品迭代周期。叠加国家相关政策持续加持,为HPC与AI融合创新、场景落地构建了优质的产业环境,全力赋能企业与科研机构开展技术攻关与应用创新。
太初元碁的核心差异化优势,源于深厚的超算技术基因,团队深耕极致算力性能研发、深耕底层硬件架构优化多年,积累的核心技术能力,精准破解当下AI大模型训练、推理环节的算力瓶颈。团队将过往在气候气象仿真、流体力学模拟、高端工业仿真等领域沉淀的大规模并行优化经验,全面迁移适配至AI大模型的训练与推理场景。同时,公司持续推动AI技术落地细分产业场景,全方位提升政企、科研用户的开发落地效率与应用价值。
异构众核:芯片级原生异构设计,解锁通用算力潜力
当前算力芯片主流技术路线以GPU、ASIC、DSA为主,太初元碁跳出传统技术路径,自研落地芯片级异构众核架构,打造专属核心技术壁垒。该架构将不同功能的计算核心,按照行业技术标准深度融合于单颗芯片内部,依托智能调度机制,将不同计算任务匹配至最优处理单元,实现多类型异构内核协同并行计算。乔梁介绍,基于异构众核架构打造的算力产品,具备极强的通用性,原生适配HPC+AI双场景,可实现高速、高精度算力输出,加速各领域科研探索与产业实践。
“我们没有在芯片内固化固定算法,所有计算单元均为完整通用计算核心。无论是科学计算领域的FFT数值运算、AI领域的海量卷积运算,还是未来行业涌现的全新算法模型,太初元碁异构众核架构均能提供稳定、高效的性能支撑,彻底解决算法快速迭代带来的硬件适配性不足、算力利用率低等行业痛点。”乔梁在采访中说道。
区别于行业主流通过系统软件实现CPU与GPU协同调度的模式,太初元碁实现了底层芯片级原生异构融合。同时,相较于仅聚焦单一模型计算环节的DSA、ASIC专用架构,该创新设计可让单颗芯片同时兼顾科学计算的高精度、智能计算的高效率,每一颗芯片均可构成微型高性能“超算节点”。
依托自研异构众核芯片,太初元碁搭建了面向下一代人工智能、高性能计算全场景的通用计算平台,兼顾算力效率、系统扩展性与行业适配性,可全方位覆盖AI智能计算与高端科学计算各类需求,突破传统算力芯片仅能完成单一模型计算的局限。
在产品落地层面,公司于2021年推出核心产品T100系列AI加速卡。该加速卡搭载的自研计算芯片,集成通用计算核心、加速计算核心、数据处理核心等多类异构处理单元,同时兼具GPU的超高算力性能与CPU的灵活编程通用性,适配各类复杂计算场景。目前,太初元碁已形成完整产品矩阵,覆盖加速卡、工作站、风冷服务器、液冷服务器、超大规模算力集群等全层级产品形态。
随着大模型参数规模持续扩容,单卡算力已无法满足产业需求,千卡、万卡级集群训练成为行业主流,对芯片间高速互联、集群通信带宽提出了极高要求。针对这一行业核心瓶颈,太初元碁自主研发TC-Link高速互联技术,可支撑千卡及以上规模算力节点高速互联,构建高性能算力“超节点”。同时,公司联动网络设备、服务器头部厂商深度合作,持续优化集群内部、跨集群通信性能,从容应对大模型参数持续增长带来的算力与通信挑战,稳固异构众核架构在大规模集群算力场景的核心竞争优势。
目前,太初元碁在全国多个地区落地高端智能算力中心,产业化成果丰硕,核心落地项目如下:
·河南空港智算中心:规划总算力超10万P,致力于打造中部最大、国内领先的万卡算力集群,2025年一季度一期项目投运后算力达30000P,获评2025年
中国算力大会“创新先锋”称号,并率先完成与DeepSeek-R1等开源大模型的深度对接。
·盐城智算中心:规划总算力400P智能算力,整体国产化占比超60%,首期206P算力已建成投用,获批国家新一代人工智能公共算力开放创新平台。项目自2022年6月运营以来,长期保持近满负载运行状态,累计运营收入突破亿元。
·太湖之光A+智算中心:落地200P智能算力,搭载业内最高密度自研机柜,单机柜可部署128张太初AI加速卡,单机柜算力达32PFlops,为国内算力密度最高的算力机柜;采用集中式供电方案,整机功耗100KW,兼顾超高算力与集约能耗。
·延安智算中心:建设200P智能算力,搭载四链路400Gbps高速计算网络互联架构,全面支撑大模型预训练、微调等核心任务,助力延安数字经济产业转型升级,实现全域智算基础设施布局。
·蠡湖未来城智算中心:规划300P智能算力,采用四链路400Gbps通用AI计算网络,以高端算力基础设施为核心,搭建搭载大模型的公共服务平台,助力无锡蠡湖未来城打通AIGC全产业链,赋能区域数字经济创新发展。
·开源生态算力平台:布局200P智能算力,搭载四链路200Gbps国产AI计算网络,主要用于底层基础软件栈研发、算子开发、模型适配优化,同时支撑用户POC验证与合作伙伴科研创新合作。
生态构建:全栈自主可控,共建超智融合产业共同体
算力的终极价值在于场景落地,而软件生态是打通硬件算力与产业应用的核心桥梁。太初元碁始终将生态建设作为核心战略,公司已搭建起涵盖系统中间件、编译器、硬件驱动、核心功能组件、全流程开发工具链的完整软件体系,为用户提供从底层硬件适配、中层软件调试到上层应用落地的全流程平滑适配方案,同时为开源社区生态建设筑牢技术根基。
乔梁介绍:“过去五年,我们聚焦底层软件栈自主研发与上层API适配优化,现已建成全栈自主可控的开源软件生态,彻底摆脱国外技术依赖。”
为降低行业用户开发门槛、提升落地效率,太初元碁将AI技术融入软件生态建设,自研专属AI开发模型,可实现算子自动化开发、适配与调试,大幅提升软件适配效率,让非计算机专业的科研人员、行业开发者,也能快速将算法思路落地至太初元碁算力平台。
在生态共建层面,太初元碁积极拥抱开源生态、深化产业协同。其中与百度飞桨的战略合作成为行业典范,双方依托各自硬件架构、软件框架的核心优势,构建起“芯片-框架-应用”全链路、一体化的国产化AI技术生态。
在前沿的AI4S(人工智能赋能科学研究)领域,太初元碁已实现多项技术落地与场景突破,核心应用成果如下:
·生物医药领域:深度赋能湖南大学等高校科研团队,助力基因测序、蛋白质结构预测与验证等核心科研工作。依托自研芯片超强算力,高效承接蛋白质结构重构中的海量超算任务,结合AI算法加速科研验证环节,大幅缩短创新药物研发周期,赋能生物医药产业创新。
·流体力学领域:落地TensorLBM项目,以张量计算为核心,实现通用计算流体力学LBM算法研发,融合AI湍流模型打造HPC+AI一体化应用方案。项目基于统一机器学习框架,打通科学计算与智能计算融合开发路径,目前已将SUBOFF绕流场通用计算案例成功适配移植至太初PyTorch框架,可精准模拟大规模航行体绕流问题,生成高质量训练数据,结合AI模型持续优化推演精度与计算效率。
除此之外,太初元碁前瞻性布局量子计算赛道,联合清华大学团队研发TecoQSim量子电路模拟器,依托自有超算集群完成量子计算算法的模拟、验证与迭代,探索构建量子计算与经典计算协同的异构算力系统,为下一代量子计算产业化发展筑牢技术基础。
结语
太初元碁的产业实践充分证明,HPC与AI的深度融合,既是算力技术迭代的核心趋势,更是我国高端计算产业升级、基础科研突破的必然路径。凭借“超智融合”的精准战略定位、自主创新的异构众核芯片技术、完善的全栈软件生态与扎实的产业落地能力,太初元碁走出了一条差异化、自主化的国产高性能计算发展之路。