龙芯2K0500多功能SoC处理器及其解决方案

描述

近日,在河南郑州举办的2022世界传感器大会上,龙芯中科董事长胡伟武发表开幕主旨演讲,并发布了龙芯2K0500多功能SoC处理器,及其解决方案。

龙芯2K0500基于自主核心技术,是一款高集成度处理器芯片,面向工控互联网应用、打印终端、BMC等领域,合作伙伴已推出一系列板卡及解决方案。

龙芯2K0500片内集成单个64位龙架构(LoongArch)LA264处理器核、32KB一级指令缓存、32KB一级数据缓存、512KB二级缓存、32位DDR2/3-1066控制器、2DGPU图形核心、DVO显示接口、两路PCIe2.0、两路SATA2.0、四路USB2.0、一路USB3.0、两路GMAC、PCI总线、彩色黑白打印接口、HDA及其他常用接口,主频500-800MHz。

它还支持ACPI、DVFS/DPM动态电源功耗管理等低功耗技术,支持多种电源级别和唤醒方式,可根据具体应用场景,对芯片部分功能和高速接口进行动态时钟、电源开关控制,满足工控、网络安全等应用领域低功耗应用需求。

核心技术

核心技术

基于龙芯2K0500,龙芯中科与合作伙伴已推出多个基于该平台的解决方案。

1、国产化BMC方案

搭载国产化元器件,自主可控国产化率达100%。

通过PCIe、LPC和USB总线与主系统相连,实现主系统的VGA显示、带内通信、KVM相关功能,通过I2C、ADC、PWM等实现温度、电压、风扇等各种传感器的采集与控制,通过LAN、Serial、IPMB实现与chassis、机柜管理模块通信和带外管理控制。

2、全国产化模块

主频最高800MHz,模块具有丰富的IO接口:支持2路RGMII接口,2路SATA 2.0,4路CAN 2.0,4路TTL串口,4路USB 2.0接口,1路USB3.0接口并支持OTG模式;扩展接口部分支持2路PCIe x1通道,1路标准32位PCI(可配置localbus总线模式)。

模块尺寸76mmx55mm,总功耗3~5W,采用全表贴、高国产化设计,具有功耗低、体积小、满足宽温工作环境的特点,可广泛应用于政府、科研、医疗、数控、通讯、交通等各嵌入式领域。

3、工业物联网关

高度集成化设计,在一块单板上集成了主处理器、模拟量和开关量采集电路、开关量输出电路、4G模块、网络接口、串行接口、电源系统等功能部件和模块。

提供多路工业以太网接口、CAN接口、RS232/485串行接口、模拟量输入、数字量输入、开关量输出等功能来实现工业现场数据采集与协议转换,在智能工厂、石油石化、智慧水务各场景中实现应用推广。

4、邮票版模块

针对物联网、网关,多种嵌入式、教育、开发平台等。

5、龙芯2K0500派

IO接口丰富,板卡采用表贴化设计,具有稳定、安全、可靠、实用性强等特点,可广泛应用于工业、网络、科研、医疗、数控、通讯、交通、教育等领域。

可以通过PCe作为其他主控的外设进行接口的扩展或实现多SoC芯片高速总线互联。

6、龙芯2K0500 IDE

龙芯嵌入式集成开发环境LoongIDE是用于开发龙芯嵌入式芯片的编程工具,目前支持龙芯2K0500、1B、1C、1C101的裸机项目或RT-Thread/FreeRTOS/uCOS/RTEMS项目。

用户通过向导创建项目,自动生成项目框架代码,以项目为单位进行源代码管理,并支持YAFFS2、lwIP等网络协议栈、文件系统等第三方代码库的导入。

框架代码中有完善的芯片驱动程序库,并采用统一的格式编写,直接调用驱动函数即可。项目编译时自动生成makefile文件,链接成龙芯芯片的可执行程序。

提供复用引脚配置的直观图形操作界面,并自动生成初始化代码,并配套完善的帮助文档和编程示例。

7、自主可控的打印机方案

打印机控制器作为打印机核心部件,其安全性对于打印及整机系统的安全性至关重要,目前国产化打印机技术的研究越来越受到重视。

龙芯2K0500国产自主可控打印机方案可以确保打印机本体安全性,为国家的信息安全提供可靠保障,目已应用于众多国产打印机厂商。

龙芯2K0500集成一个打印机接口控制器PRINT,通过PRINT接口与打印机进行数据通信,其内部主要包括LSU机芯控制和JBIG85解码模块。

其中,LSU机芯控制模块同时支持8路机芯控制,可实现同时打印青、粉、黄、黑四种颜色彩打功能;JBIG85解码模块可实现对由JBIG85压缩算法压缩过的图片数据进行解码处理,可负责同时对青、粉、黄、黑四个颜色进行对应数据的解码工作。

核心技术

LSU控制模块主要包含三个模块:AXI/APB控制模块,LSU激光头控制模块以及MOTOR马达控制模块,结构框图下图所示:

核心技术

再看另一款非常牛X的国产芯片。

8月9日,国内科技创新企业壁仞科技(Birentech)正式发布了BR100系列通用计算GPU,号称算力国内第一,多向指标媲美甚至超越国际旗舰产品。

当地时间8月22日,第34届Hot Chips芯片大会首日演讲,NVIDIA Hopper、AMD Instinct MI200、Intel Ponte Vecchio三大巨头的通用GPU纷纷秀出肌肉,而与之并肩亮相的,就是壁仞科技BR100。

会上,壁仞科技联合创始人、CTO洪洲与壁仞科技联合创始人、总裁徐凌杰进行了题为“Biren BR100 GPGPU: Accelerating Datacenter Scale AI Computing”的主题演讲,为来自全球的专业听众介绍了BR100芯片的特点与原创芯片架构的细节。

核心技术

核心技术

根据介绍,作为主要用于加速数据中心规模通用计算的GPGPU芯片,BR100具有极高的算力密度,单卡16位浮点算力达到PFLOPS级别,并具备高速片上与片外互连带宽。

BR100采用7nm制程工艺、Chiplet小芯片设计和CoWoS 2.5D封装技术,以OAM模组形态部署,能够在通用UBB主板上形成8卡点对点全互连拓扑。

为了支持强大的算力,BR100配备了超过300MB的片上高速缓存,用于数据的暂存和重用,以及64GB的HBM2E高速内存。

它的核心计算单元由大量通用流式处理器组成,具备通用计算和2.5D GEMM架构的专用张量加速算力。

核心技术

在原创架构层面,壁仞科技按照深度学习等通用负载的计算特点,提供一系列针对数据流的增强特性,包括特殊的C-Warp协同并发模式、张量数据存取加速器TDA、NUMA/UMA访存模式、近存储计算等。这些特性是BR100能够在算力和能效比上达到全球领先水准的关键。

此外,壁仞科技还介绍了一种新的TF32+数据类型,具备比TF32数据类型更高的精度。

核心技术

在软件方面,壁仞科技还介绍了BIRENSUPATM软件栈,其核心编程模型具有C/C++编程接口和运行时API,风格与主流的GPGPU开发语言和编程范式类似。

它能够使开发者在BR100上非常容易地进行编程开发,同时大幅降低代码迁移工作量,实现从主流编程环境向BIRENSUPA平台的无缝迁移。

核心技术

核心技术

资料显示,壁仞科技BR100集成了多达770亿晶体管,规模上堪比人类大脑神经细胞,已经非常接近800亿个晶体管的NVIDIA GH100计算核心,而且BR100系列芯片一次就点亮成功了!

性能方面,INT8整数计算2048 Tops(每秒2048万亿次)、BF16浮点计算1024 TFlops(每秒1024万亿次)、TF32+浮点计算512 TFlops(每秒512万亿次)、FP32双精度浮点256 TFlops(每秒256万亿次)。

此外,它的外部IO带宽达2.3TB/s,支持64路编码、512路解码,还支持PCIe 5.0、CXL互连协议。

审核编辑 :李倩

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分