深度剖析中科海光CPU与DCU产品系列技术

描述

海光信息技术股份有限公司:成立于2014年10月,注册地位于天津,2022年在科创板上市。主营业务是研发、设计和销售应用于服务器、工作站等计算、存储设备中的高端处理器。产品包括海光通用处理器(CPU)和海光协处理器(DCU)。

海光CPU系列产品兼容x86指令集以及国际上主流操作系统和应用软件,软硬件生态丰富,性能优异,安全可靠,已经广泛应用于电信、金融、互联网、教育、交通等重要行业或领域。海光DCU系列产品以GPGPU架构为基础,兼容通用的“类CUDA”环境,可广泛应用于大数据处理、人工智能、商业计算等应用领域。

公司下设CPU设计中心、DCU设计中心、SOC设计中心、后端实现中心、定制工艺中心、工程平台技术中心、产品开发运营中心、软件与安全中心、项目与质量管理中心、技术支撑中心、销售与生态发展中心、解决方案与优化中心、产品市场部财务管理部和管理保障中心15个职能部门。

X86

图片来源:组织架构 海光信息

1、产品线

高端处理器作为现代信息系统设备中的核心部件,在大规模数据处理、复杂任务调度和逻辑运算等方面发挥了不可替代的作用。

根据应用领域、技术路线和产品特征的不同,海光信息高端处理器分为海光CPU系列产品和海光DCU系列产品。海光CPU系列产品兼容x86指令集以及国际上主流操作系统和应用软件,软硬件生态丰富,性能优异,安全可靠,已经广泛应用于电信、金融、互联网、教育、交通等重要行业或领域。

海光DCU系列产品以GPGPU架构为基础,兼容通用的“类CUDA“环境,可广泛应用于大数据处理、人工智能商业计算等应用领域。

X86

图片来源:产品线 海光信息

(1)海光CPU

海光CPU主要面向复杂逻辑计算、多任务调度等通用处理器应用场景需求,兼容国际主流x86处理器架构和技术路线,具有优异的系统架构、高可靠性和高安全性、丰富的软硬件生态等优势。海光CPU按照代际进行升级迭代,每代际产品按照不同应用场景对高端处理器计算性能、功能、功耗等技术指标的要求,细分为海光7000系列产品、海光5000系列产品、海光3000系列产品。

图片来源:海光信息

海光CPU在国产处理器中具有非常广泛的通用性和产业生态,已经大规模应用于电信、金融、互联网、教育、交通、工业设计、图形图像处理等领域。海光CPU既支持面向数据中心、云计算等复杂应用领域的高端服务器;也支持面向政务、企业和教育领域的信息化建设中的中低端服务器以及工作站和边缘计算服务器。

(2)海光DCU

海光DCU属于 GPGPU的一种,采用“类 CUDA”通用并行计算架构,能够较好地适配、适应国际主流商业计算软件和人工智能软件。与CPU相同,海光DCU按照代际进行升级选代,每代际产品细分为8000系列的各个型号。海光8000系列具有全精度浮点数据和各种常见整型数据计算能力,能够充分挖掘应用的并行性,发挥其大规模并行计算的能力,快速开发高能效的应用程序。

图片来源:海光信息

海光DCU主要部署在服务器集群或数据中心,为应用程序提供性能高、能效比高的算力,支撑高复杂度和高吞吐量的数据处理任务。在AIGC持续快速发展的时代背景下,海光DCU能够支持全精度模型训练,实现LLaMa、GPT、Bloom、ChatGLM、悟道、紫东太初等为代表的大模型的全面应用,与国内包括文心一言等大模型全面适配,达到国内领先水平。

2、行业地位

(1)技术地位

x86指令集具有业界最好的产业生态支持,现有运行中以及开发中的绝大部分服务器、硬件设备、软件系统均基于或兼容x86指令集。公司研制出符合中国用户使用需求、兼具“生态、性能、安全”三大特点的国产x86架构处理器产品。

海光 CPU主要具有三大技术优势。一是优异的产品性能。海光CPU使用先进的处理器微结构和缓存层次结构、高主频设计技术,依托先进的SoC架构和片上网络,集成了更多处理器核心,使产品性能优势显著。二是良好的系统兼容性。海光CPU可以兼容国内外主流操作系统、数据库、中间件等基础软件及广泛的行业应用软件。三是较高的系统安全性。海光CPU通过不断扩充安全算法指令、集成安全算法专用加速电路等方式,有效提升了数据安全性和计算环境的安全性,原生支持可信计算。

海光DCU以“类 CUDA”良好的兼容性,为用户提供强大的计算服务能力。海光DCU 主要具有三大技术优势。一是强大的计算能力。海光DCU基于大规模并行计算微结构进行设计,具备强大的全精度各种数据格式的算力,是一款计算性能强大、能效比较高的通用协处理器。二是高速并行数据处理能力。海光DCU集成片上高带宽内存芯片,可以在大规模数据计算过程中提供优异的数据处理能力,使海光DCU可以适用于广泛的应用场景。三是良好的软件生态环境。海光DCU采用 GPGPU架构,兼容“类 CUDA”环境,解决了产品推广过程中的软件生态兼容性问题。公司通过参与开源软件项目,加快了公司产品的推广速度,并实现与GPGPU 主流开发平台的兼容。

(2)市场地位

公司在国内率先研制完成了高端通用处理器和协处理器产品,并实现了商业化应用。相较于国外厂商,公司根植于中国本土市场,更加了解中国客户的需求,能够提供更为安全可控的产品和更为全面、细致的运营维护服务,具有本土化竞争优势。海光CPU已被国内多家知名服务器厂商采用,相关产品成功应用到工商银行、中国银行等金融领域客户,中国石油、中国石化等能源化工领域客户,并在电信运营商的数据中心类业务中得到了广泛使用。

海光DCU兼容“类CUDA”环境,软硬件生态丰富。海光DCU系列产品可广泛应用于大数据处理、大模型训练、人工智能、商业计算等领域。

3、X86架构和服务器行业介绍

在高端处理器领域,由于x86 架构处理器起步较早,生态环境较其他处理器具有明显优势,因此,全球应用x86处理器的服务器销售额占全部服务器销售额的比例占九成以上,处于显著领先的地位。

高端处理器研发在架构设计、电路设计、工艺制程、先进封装设计等方面均有较高的技术门槛,对人才的创新能力和工程技术能力要求很高。高水平集成电路研发人才培养周期长,且我国高端芯片设计行业发展时间较短,导致行业高端专业人才紧缺。我国集成电路设计企业多处于成长期,与国际同行相比,资金实力相对较弱,技术差距尚待缩小,亦面临人才紧缺的问题。

在我国,根据IDC统计数据,2023年全年,中国x86服务器市场出货量为362万台,预期2024年还将增长5.7%。随着近几年人工智能技术爆发式的突破,人工智能产业链与商业化应用进入了高速发展阶段。

中国是全球重要的 CPU 消费市场,计算机用户基数庞大。信息产业的国产化是国家建设数字中国的先行条件,国产高端处理器已经从党政应用向重点行业逐步延伸,公司产品在能源、交通、金融、通信等关键信息基础设施领域已得到批量应用。对信息安全、供应链安全要求相对较高的领域,亦是国产CPU的优势市场。

X86

根据《2023-2024 中国人工智能计算力发展评估报告》,IDC 预计全球人工智能硬件市场(服务器)规模将从 2022 年的195亿美元增长到 2026 年的347亿美元,五年年复合增长率达17.3%;预计2023年中国人工智能服务器出货量将达到31.60 万台,同比增长11.3%,2027年将达到69.1万台,五年年复合增长率达21.60%。

X86

在 AIGC 持续快速发展的背景下,以 ChatGPT、Sora 等为代表的大模型人工智能技术浪潮席卷全球,大量企业和机构投入类似 ChatGPT 乃至功能更强大的大模型研发中,随着与业务紧密结合的人工智能应用场景逐渐落地,拥有先进算法和强大计算能力的企业成为了最主要的推动者,人工智能发展进入了全新阶段。随着大模型的迭代,训练所需的样本和参数呈指数级增长,多模态智能数据从训练到推理均需要算力的驱动,伴随模型逐渐复杂化,所对应的算力需求也进一步加剧,而这些需求都会推动包括人工智能处理器在内的高端处理器的快速增长。

4、经营业绩

2023年,海光信息实现营业收入60.12亿元,同比增长17.30%;毛利率60%,实现净利润12.6亿元。2023年,海光信息研发投入共计28.10亿元,较上年同期增长35.93%。

X86

图片来源:海光信息

X86

图片来源:海光信息

5、组织体系和人才队伍

海光信息成立技术委员会以指导公司研发工作,下设技术支撑中心和项目质量管理部,研发和服务范围覆盖北京、成都、苏州、上海等地,形成技术、平台和应用三个层次的完备支持。

X86

图片来源:海光信息 技术委员会

截至报告期末,公司研发团队总人数为1641人,其中硕士及以上学历1301人,占研发团队总数的79.28%。

X86

图片来源:海光信息

截至2023年,海光累计获得授权专利763项:其中授权发明专利670项、授权实用新型专利90项。在其他知识产权方面,海光累计获得软件著作244项、商标97项:2023年新增集成电路布图设计71项,累计拥有集成电路布图设计228项。

X86

图片来源:海光信息

6、核心技术

海光信息在CPU和DCU芯片技术领域持续投入,2023年在处理器体系结构设计、处理器核心微结构验证、处理器安全架构、处理器IP研发、处理器可测性与可调试性设计、处理器物理设计、处理器先进封装设计、处理器测试、处理器基础软件设计和处理器生态软件优化等核心技术上持续开展研发,优化、提升公司产品性能,具体如下:

(1)处理器体系结构设计方面

采用高带宽低延时chiplet互联技术,不断提升计算性能。兼容主流的处理器指令集,并根据应用需要扩展指令集。内存控制器支持SDRAM和HBM 等存储协议接口,访存带宽和高可靠性技术不断提升,同时支持内存加密。处理器利用ComboPHY灵活支持多种高速I/0,包括处理器之间互连总线、PCIe、CXL、SATA、1/10GbE等,具备对一致性互联总线CXL的支持。

可扩展片上网络,利用高数据位宽结合虚通道技术,提高了处理器核心之间数据访问带宽,降低了拥塞。支持 QoS,进一步降低敏感数据的访问延时。此外,针对高主频的复杂微结构、软件协同下功耗预估和管理等方面进行了创新性处理器体系结构设计。

(2)处理器核心微结构验证方面

建立了处理器核心功能部件级、处理器核心级、处理器核心簇级、全片多核心簇级、多芯粒级和多芯片级完整的多层次处理器验证环境。研发了包括指令集功能验证程序、微结构定向测试程序、随机指令序列测试程序、功能部件级随机测试激励的各项验证激励。建立了指令功能模型、功能部件级正确性模型。形成了包括基于先进设计方法学的多层次处理器验证环境、定向验证激励及随机验证激励、指令集功能模型及各微结构层次正确性检查器、基于硬件仿真加速器的验证等处理器核心微结构验证技术体系。

(3)处理器安全架构方面

处理器安全技术主要包括可信执行环境、密码运算加速、可信计算、漏洞防御等。可信执行环境方面,海光基于数据自动加解密和硬件隔离,有效防止安全攻击;集成符合国密标准的密码协处理器和密码指令集,支持国密标准 SM2、SM3、SM4;处理器内置可信计算平台,支持基于硬件信任根的 TSB可信安全启动、中国可信标准TPCM和TCM2.0。

可信计算平台不仅实现了可信计算所需的信任根,还可以对系统进行主动的度量及监控,并在检测到异常时及时采取措施,有效保护系统,符合等保 2.0要求。CPU漏洞防御方面,海光 CPU对熔断漏洞免疫,对幽灵漏洞和侧信道漏洞则采用有效的软硬件技术进行防御,可以提供先进的云计算上全流程安全执行环境。

(4)处理器IP研发方面

海光信息拥有高水平定制电路设计平台,拥有完善的设计流程和设计方法,具备丰富成熟的定制和半定制电路开发能力。有涵盖定制标准单元库、存储器编译器、各类通用接口(GPIO)、内核高速缓存,高密度 VcacheSRAM,高性能数字 PLL时钟,片上模拟和数字电源,模拟和数字测温等关键IP。

海光信息通过数模混合高速接口设计技术,开发的高带宽、低功耗、低延迟的芯粒互连接口,支持标准封装和Interposer 等先进封装互连,在芯片层面实现了处理器体系结构的重组。通过工艺结点下模拟和全数字低压差线性稳压器设计技术,高能效处理器供电技术,处理器独立控制各个单核电压,结合自适应电压和频率调节,实现电压动态调节,降低处理器功耗。通过对定制标准单元、存储器编译器的性能优化、面积优化和功耗优化,缩小处理器面积,提高了处理器性能和能效比。

(5)处理器可测性与可调试性设计方面

建立了全套先进的 DFT和DFD设计流程。DFT基于自上向下的设计理念,采用分布式与多路选择器相结合的测试访问机制,根据模块级评估结果划分顶层测试任务,完成顶层测试协议文件的映射,生成跳变时延故障、固定型故障、串扰故障等测试向量。针对片上特定IP及嵌入式存储结构,制定内建自测试等设计方案。

对于先进封装,建立了面向该封装的针对性芯片测试机制,以保障高效的测试覆盖和诊断。DFT通过全方位测试覆盖,保障芯片生产中良品筛选,助力工艺问题的快速诊断。DFD通过插入调试专用电路,提高电路故障区分度,通过生成扫描链诊断向量,提高电路故障诊断质量和效率。此外,公司研发了面向芯片硅后验证的软硬件调试工具,包括调试现场分析工具、内部信号观测工具、JTAG 调试工具、配置总线访问工具等。

(6)处理器物理设计方面

建立了完善的支持业界主流工艺的物理设计流程和适应不同产品与工艺需求的签核标准验证流程,实现不同工艺的快速切换。设计流程平台涵盖从逻辑综合、物理设计、物理验证到签核全流程。流程支持标准工艺单元库,结合定制的高速单元可实现高性能设计的快速收敛。顶层物理设计流程支持多层次设计和多层次模块复用,支持模块穿透过线和总线流水线复用,适用于不同设计,能够有效地提高超大规模集成的物理设计效率。自研的时钟网格设计、布线和分析技术支持高端芯片时钟网格设计与其他物理设计任务并行开展。

自研签核设计流程可针对不同的设计模式、工艺、电压、温度等要求,分析并得出相应的时序、压降、电迁移等签核标准。该签核技术支持芯片动态工作电压和频率变化以适应不同性能的需求和节省功耗,支持自适应工作电压变化以确保不同工艺偏差的芯片得到最佳工作电压。物理设计流程能够适配先进的Chiplet设计,结合不同的封装方案,完成跨芯片的布局规划,电源和时钟网络部署,数据通路分析以及时序和压降等签核验证工作。

(7)处理器先进封装设计方面

海光信息在多芯片互联、基板设计、封装电/热/力仿真、大尺寸多层基板设计、凸块(bumping)加工技术、高性能散热技术等已经形成一整套封装技术解决方案。在封装工艺上也掌握了多层高密度布线设计、大尺寸芯片贴装、微凸块结构设计等技术,完成了完整的国产供应链整合,形成了产品化能力。同时也掌握了窄节距、大尺寸LGA/BGA封装技术。

(8)处理器测试方面

海光信息建立了覆盖晶圆测试、封装测试、终测和系统级测试在内的处理器测试体系,保障了海光 CPU和 DCU测试的规范性,有效支撑了海光CPU和DCU 的研发和量产。晶圆测试方面,建立基于

产品需求的晶圆质量及性能判决模型,利用低温和高温环境下晶圆测试数据,对芯片进行速度与功耗建模并精细分类。封装测试方面,结合不同温度下晶圆测试的特征参数,优化电压等参数,实现产品级整体性能优化提升。可靠性方面,通过自建研发老化测试系统,实现可靠性测试自主可控,不断提高可靠性问题解决能力,进一步提升产品可靠性水平。

(9)处理器基础软件设计方面

海光信息形成了一套软硬件一体化的处理器基础固件设计与验证方法,实现了固件的功能、性能和稳定性。海光基础固件负责对处理器所集成IP的配置、管理和维护,从而简化 SoC架构设计,提升CPU和DCU产品开发速度。海光处理器使用安全启动技术保证加载到CPU和DCU内部运行固件的安全性。微码方面,公司自主设计和定义了微码指令集和功能,形成由微码程序、微码编译器、微码补丁、微码专用硬件以及微码验证环境等组成的海光处理器微码系统,支持微码编译和调试、高级语言编程,实现了微码安全加载和验证机制。

(10)处理器生态软件优化方面

海光信息对密集和稀疏线性代数、快速傅里叶变换等广泛使用的数学库进行分析和优化,形成了一套覆盖面广、性能优的高效能数学库,其技术主要包括多核并行化、自适应存储管理和指令集自适应优化技术等。通过对结构体内存布局优化,循环展开优化和减少动态指令数,不断提高缓存命中率和程序性能。

审核编辑:黄飞

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分