RISC-V芯片新突破：CPU与GPU一体化核心设计

i2et_wc_ysj 2024-04-07 872

处理器/DSP

894人已加入

描述

X-Silicon Inc. (XSi) 创建了一种新的 RISC-V 微处理芯片架构，将 RISC-V CPU 内核与矢量功能和 GPU 加速结合到单个芯片中。Jon Peddie Research 报告称， CPU/GPU 混合芯片是开源的，它旨在处理各种不同的功能，包括通常由专用 CPU 和 GPU 处理的人工智能。问题是它应该以更有效的方式完成这一切。

新的 CPU/GPU 混合处理器被设计为“万能”处理器。据 JPR 称，业界一直在寻求一种开放标准的 GPU，其灵活性和可扩展性足以支持各种市场，包括虚拟现实、汽车和物联网设备。这款新的 RISC-V CPU/GPU 旨在通过为制造商提供可以处理任何所需工作负载的单一开放芯片设计来解决这个问题。

X-Silicon 的芯片与其他架构不同，其设计将 CPU 和 GPU 的功能结合到单核架构中。这与 Intel 和 AMD 的典型设计不同，后者有独立的 CPU 核心和 GPU 核心。相反，核心本身被设计用来处理 CPU 和 GPU 任务。从这个意义上说，这听起来有点像英特尔放弃的 Larabee 项目，该项目试图使用 x86 来处理图形和其他工作负载。

该芯片采用X-Silicon 的 C-GPU 架构，将 GPU 加速合并到 RISC-V 矢量 CPU 核心中。该架构具有带有 32 位 FPU 和定标器 ALU 的 RISC-V 矢量核心。它具有线程调度程序、剪辑引擎、光栅化器、纹理单元、神经引擎和像素处理器。该芯片旨在处理包括人工智能、高性能计算（HPC）、几何计算以及2D和3D图形在内的应用。

gpu

理论上，X-Silicon的混合芯片能够在同一内核中处理CPU和GPU代码，这为其带来了许多优势。该芯片采用开源RISC-V ISA作为CPU和GPU，运行单指令流。这提供了低内存占用执行和更高的效率，因为在 CPU 内存空间和 GPU 内存空间之间无需复制数据。

CPU/GPU 内核可以组合在一起形成多核设计，使制造商能够根据需要扩展处理能力。在多核格式中，多个核心平铺在一个芯片上，并使用快速结构进行连接。此设计中还实现了快速片上 SRAM 或 eDRAM 缓存，这些缓存用作可以聚合来自多个内核的数据的 L2 缓存。每个核心都可以根据需要安排独立于其他核心运行图形、AI、视频、物理、HPC 或其他工作负载。

通过这种设计，X-Silicon 的 C-GPU 架构可以运行任何类型的 CPU 或 GPU 工作负载。X-Silicon 声称已经拥有与“融合 GPU 加速”配合使用的 Vulkan 图形 API。这将极大地有助于其在 Android 设备上的开发和采用。

由于新设计基于 RISC-V，任何人都可以使用该架构，而无需支付指令集版税——与 x86 和 ARM 不同。如果它按预期工作，这些芯片可能会震动微处理器行业。理论上，目前使用的标准设计并不像 X-Silicon 声称的那样灵活或强大。

尽管我们可能不需要等很长时间才能知道，但它在实践中是否和纸面上一样有效还有待观察。据报道，软件开发工具包将于今年某个时候向早期合作伙伴发布。

X-Silicon 的低功耗、开放标准、支持 Vulkan 的 C-GPU

X-Silicon Inc. (XSi) 展示了其开放标准、低功耗 C-GPU 架构，将 GPU 加速与 RISC-V 矢量 CPU 内核和紧密耦合内存相结合，形成低功耗、单处理器解决方案。它是其统一 RISC-V 矢量 CPU-with-GPU ISA 的开源版本，并通过硬件抽象层 (HAL) 提供寄存器级硬件访问。XSi C-GPU 中的 NanoTile 架构旨在处理实时数据处理和动态图形渲染，克服了传统 GPU 架构的限制。

20 多年来，业界一直在寻求一种足够灵活且可扩展的开放标准 GPU，以支持各种市场，例如 AR/VR、汽车、互联物联网以及包括机器人在内的庞大嵌入式垂直市场。X-Silicon 的动态且高度可扩展的 C-GPU NanoTile 架构及其同时或顺序处理多个任务的能力在这方面是独一无二的。

X-Silicon Inc (XSi) 是一家总部位于圣地亚哥的初创公司，成立于 2022 年 3 月，推出了其最新创新：开放标准、低功耗 C-GPU 架构，将 GPU 加速融入 RISC-V 矢量 CPU 核心，紧密耦合的内存，提供低功耗、单处理器解决方案。XSi 的方法引入了其统一 RISC-V 矢量 CPU-with-GPU ISA 的开源，并通过硬件抽象层 (HAL) 提供寄存器级硬件访问。该公司表示，这使得原始设备制造商和内容提供商能够通过不同寻常的定制来定制驱动程序和应用程序，这与竞争对手的封闭解决方案不同。XSi 相信，它在 RISC-V 上率先采用融合 GPU 加速的 Vulkan，促进了 Android 设备上的开发，这对于有效应对多样化的嵌入式垂直市场至关重要。

XSi的C-GPU采用NanoTile架构，该公司表示该架构可以满足实时数据处理和动态图形渲染的需求。传统的 GPU 架构难以处理动态数据，因此需要一种新颖的方法。XSi 表示，其处理器专为动态内容的最佳管理和渲染而设计，超越了传统 GPU 的限制。通过集成 AI/ML 计算和 GPU 渲染，NanoTile 可确保效率和适应性，是实现高级图形算法的理想选择。

该公司拥有 14 项专利，声称其 NanoTile 架构彻底改变了 AI/ML 计算和 GPU 渲染。这些专利专注于优化处理核心和内存之间的数据流、减少延迟并提高计算效率。此外，NanoTile 的专利 IP 可以在边缘和云配置中进行部署，从而培育 GPU 计算的联合模型并提供灵活性和可扩展性。

XSi 的开放标准、低功耗 C-GPU 架构和 NanoTile 平台预示着 GPU 技术的范式转变。凭借对开放标准、可定制硬件访问和动态内容渲染方法的支持，XSi 认为它将为 GPU 架构树立新标准，使开发人员和 OEM 能够在图形渲染和 AI/ML 方面释放前所未有的性能和效率水平。计算应用程序。

该公司报告称，RISC-V 生态系统对一家新的计算图形公司的推出做出了积极反应，该公司完全致力于推进开放标准生态系统。

该公司计划在今年晚些时候向选定的一组早期开发合作伙伴提供其软件开发套件。

初创公司将 MIMD 引入图形和计算领域

X-Silicon 由前硅谷专家组建，旨在通过能够执行 AI、HPC 和 2D/3D 图形任务的基于 RISC-V 矢量的统一图形计算引擎 (C-GPU) 彻底改变 GPU 设计。其 MIMD 架构可在单个内核内独立执行 CPU 和 GPU 代码，从而降低内存使用量并提高性能。该公司的多核布局具有快速合成器结构，可增强不同应用的数据聚合。X-Silicon 寻求通过近内存计算和新颖的硬件设置来减少 GPU 延迟，并获得 14 项专利的支持。X-Silicon面向AR/VR、嵌入式设备、汽车等领域，支持标准API和开放式编程，可实现快速开发。最初的 IP 销售针对 OEM 和超大规模厂商。

我们怎么看？一些新架构的市场已经成熟。三巨头已经从传统的 SIMD 中榨取了一切，并添加了额外的核心，例如矩阵数学（有时称为张量核心）、光线追踪干扰测试引擎、编解码器和音频处理器。X-Silicon 认为它可以通过紧密耦合的块通信 MIMD 架构来满足许多（如果不是全部）这些专用处理器需求。为此，他们将利用 RISC-V ISA。

在2022年，一群来自 AMD、高通、英特尔、ATI Technologies、戴尔和其他公司的工程师、建筑师、程序员和商业开发人员正在努力工作。开发了一种新的 GPU 设计，并意识到他们应该为自己的公司命名。作为新手，他们知道初创企业会浪费大量时间来尝试获得一个聪明、令人难忘的名称和徽标。所以选择了X。它可以是实验性的、性感的或未知的——希望这一切都是真的。

为了彻底改造 GPU 着色器核心，X-Silicon 表示正在创建一种新的可扩展的基于 RISC-V 矢量的统一计算图形引擎 (C-GPU)，该引擎可以高效地计算传统 GPU 所无法胜任的下一代工作负载类型。

此类应用包括人工智能、高性能计算、视觉、几何计算以及 2D 和 3D 图形。该公司表示，其 MIMD 架构具有独特的能力，能够在同一核心中独立运行 CPU 和 GPU 代码，提供低内存占用执行、硬件寄存器裸机编程、高性能、低功耗操作和替换等功能使用单个指令流，将传统着色器程序与适用于 CPU 和 GPU 的开源 RISC-V ISA 结合起来。

在该公司的多核设计中，多个 C-GPU 核心平铺在一个芯片上，并使用片上快速合成器结构进行连接，该结构可以将每个核心的输出动态聚合到一个公共缓冲区中，即用于图形用例的帧缓冲区或用于编解码器、视频效果处理和 AI 处理的流水线缓冲区，如下图所示。

gpu

在此设计中，快速片上 SRAM 或 eDRAM 缓存将用作二级缓存，可以聚合来自多个内核的数据。计算 RAM (C-RAM) 的常见操作在内存附近完成，将进一步减少带宽并进一步提高性能。该公司声称，每个核心都可以进行软件编程，以独立于所有其他核心来计算图形、人工智能、视频、物理、高性能计算或其他工作负载。

gpu

因此，工作负载可以并行或流水线方式实现，并在核心上同时运行，而不是在传统 GPU 上顺序运行。X-Silicon 表示，它还可以在核心上运行操作系统。

该公司声称，它还可以通过近内存计算、统一内存架构和其他新颖的硬件配置来加速计算，从而减少 GPU 固有的延迟。他们为此申请了 14 项专利。

前迪士尼/Applied Minds/Giant AI 动画行业专家 Eric Powers 评论道：“几十年来，高端动画和效果一直无法切换到 GPU 来生成最终图像。专业渲染管道软件的巨大复杂性和规模，加上专用 GPU 设计导致跨越内存和平台障碍的巨大成本，完全阻碍了我们最先进技术中 GPU 的大规模采用。集成设计使 HPC 开发人员能够就地访问直接硬件加速（例如 X-Silicon 的 C-GPU 架构），这是带领我们跨越这一边界的唯一未来。”

X-Silicon 的 C-GPU 为希望控制其计算和 GPU 命运的 OEM 提供了新兴用例的市场机会。它允许新的 API（包括自定义 API）以及为应用程序定制的生态系统，而不是引导 API 来执行它从未打算执行的任务。它不再要求原始设备制造商和制造商屈服于停滞不前的生态系统中的五巨头。该公司认为其市场机会在于新兴市场，例如具有更长电池寿命的娱乐和企业AR/VR、具有显示需求的智能嵌入式设备、需要可预测专用处理的低成本汽车显示器和模块、可穿戴设备、定制动画处理和别的。

gpu

该公司计划支持直接硬件和像素访问，因此对于低内存应用程序，不需要庞大的驱动程序。该公司表示，X-Silicon 的开放标准方法及其自己的开放编程模型将有助于快速、轻松地开发新用例以及改进现有产品。当然，X-Silicon还计划支持传统软件生态系统中的所有API，包括OpenGL ES、Vulkan、Mesa和OpenCL，但该公司还将提供硬件抽象层（HAL），允许直接访问其他人则优化开源或创建自己的驱动程序和自定义 API。这是特别有趣的，因为该架构支持新兴技术，包括传统架构不支持的新渲染模型，例如神经辐射场（NeRF）和非三角形图元。

该公司计划首先向 OEM、超大规模厂商和其他系统集成商出售 IP。首次硅片的推出日期尚未给出。

X-Silicon 将 CPU 和 GPU (C-GPU) 与单一 ISA 和开放图形操作系统 (GOS) 平台集成，可以对下一代图形渲染的整体软件开发、支持和维护产生深远影响。这可以在未来的图形领域开启一个激动人心的创新时代，为新兴和传统细分市场提供新的图形算法、性能、功耗、灵活性和成本的方法。这种方法彻底改变了图形世界，让 OEM 摆脱了传统 GPU 供应商的束缚，这些供应商提供具有复杂 API 和昂贵的传统支持的黑匣子驱动程序。

传统 GPU SIMD 架构受制于主机 CPU、操作系统和图形服务，限制了创新并有助于保持现有企业对其市场的控制。新的、新兴的、较小的垂直市场，通常得不到这些传统图形供应商的服务，可以开发和支持引人注目的图形解决方案，这些解决方案可以在产品的生命周期内升级和维护。使用新显示技术、新格式和使用范例（VR/AR、360、深度、立体、多平面全息）的下一代产品通常需要一种新的渲染方法。新的开发和部署范例还需要一致的架构，例如可从边缘扩展到云的架构。

X-Silicon 不仅仅是传统 GPU 供应商的开源替代方案，它还准备提供一种新技术图形处理框架，该框架融入了最新的人工智能和超越基于三角形的渲染，以提供自 3D 引入以来从未见过的创新平台本世纪初移动设备上的图形。

审核编辑：黄飞

打开APP阅读更多精彩内容