图引擎模块(GE)由C++实现，位于前端模块MindSpore/Tensorflow和底层硬件之间，起到承接作用。图引擎模块以ME/TF下发的图作为输入，然后进行一系列的深度图优化操作，最后输出一张可以在底层硬件上高效运行的图。GE针对昇腾AI处理器的硬件结构特点，做了特定的优化工作，以此来充分发挥出昇腾AI处理器的强大算力。在进行模型训练/推理时，GE会被自动调用而用户并不感知。GE主要由GE API和GE Core两部分组成，详细的架构图如下所示。

GE API

GE API是连接前端模块ME/TF和GE Core的接口，负责GE Core中初始化、Session管理模块的接口，支持运行环境初始化，Session创建、销毁，图添加执行。
GE Core

GE Core是GE的核心模块，负责整个训练过程中的图管理。GE Core中的图处理可细分为六大步骤，分别是图准备、图拆分、图优化、图编译、图加载和图执行，对于ME下发的每一张图都会经过这六个步骤的操作，最终得到可以直接在底层硬件上高效执行的图。
- 图准备 & 整图优化
  
  完成整图级别的数据准备和优化，涉及到IR库及算子库。使用IR库中算子的InferShape函数，完成整图的Shape推导，以便后续申请内存；同时根据算子的聚合属性，完成某些算子的聚合优化，如allreduce算子，会按照聚合参数，将若干各参数对应梯度的allreduce算子聚合为一个，以此减少通讯耗时。
- 图拆分
  
  昇腾AI处理器是一种异构芯片，含有CPU(AICPU)和向量计算部件AICORE，图中每个算子会按照开销模型选择执行的核心，此阶段会对算子进行最优的核心分配，每种核心对应软件上的一个抽象引擎；按照之前对各算子的引擎分配，以引擎为边界，将整图拆分为若干子图，在图边界算子上插入相应的Placeholder算子以做标识，之后的优化、编译、加载操作均会以子图为单位进行，这样可以有效减少优化过程的耗时。
- 子图优化
  
  根据子图所属引擎，调用不同的优化器接口执行优化。为了充分发挥昇腾AI处理器中AICORE模块的算力，在AICORE内CUBE单元进行计算的算子会采用一种5D的数据格式，图优化阶段会对相应算子进行4D/5D的类型转换；为了进一步发挥CUBE单元的算力，减少数据搬运次数，GE会对某种范式的算子连接进行融合操作，此步骤也在图优化阶段进行；对所有子图优化之后，需进行算子运行属性计算，以计算输入输出内存大小。
- 图编译 & 图加载
  
  GE采用即时算子编译技术，即按照实际网络结构即时编译生成算子可执行程序，同时完成内存复用与内存分配、流分配、算子可执行程序加载等。每个算子执行任务绑定到特定的流上，同一个流的任务是串行执行的，不同流上的任务可以并行执行。图加载阶段按照引擎归属的runtime，将子图加载到硬件上准备执行。
- 图执行
  
  最终在硬件上执行子图，并返回相应的输出值。为了提高运行效率，图执行阶段提供了一种下沉模式，可以在底层硬件上连续运行多轮再返回输出值，以此减少从底层硬件拷贝数据的次数。

在训练/推理过程中，上述过程会自动执行，通过上述图操作，GE可以将前端下发的图转换为一种可以在昇腾AI处理器上高效运行的图模式。

安装说明
- 安装GE
- 源码安装
- 社区
- 贡献

安装说明

安装GE

GE内嵌在MindSpore/Ascend安装包中，MindSpore/Ascend安装完毕后，GE以动态库的方式被调用。

源码安装

GE也支持由源码编译，进行源码编译前，首先确保你有昇腾910 AI处理器的环境（可通过昇腾开发者社区获取），同时系统满足以下要求：

GCC >= 7.3.0
CMake >= 3.14.0
Autoconf >= 2.64
Libtool >= 2.4.6
Automake >= 1.15.1

编译完成后会生成几个动态库，他们会链接到MindSpore/Ascend中执行，无法单独运行。

下载GE源码。

GE源码托管在码云平台，可由此下载。

git clone https://gitee.com/mindspore/graphengine.git
cd graphengine

在GE根目录下执行下列命令即可进行编译。
```
bash build.sh
```
- 开始编译之前，请确保正确设置相关的环境变量。
- 在build.sh的脚本中，会进行git clone操作，请确保网络连接正常且git配置正确。
- 在build.sh的脚本中，默认会8线程编译，如果机器性能较差，可能会编译失败。可以通过-j{线程数}来控制线程数，如bash build.sh –j4。
完成编译后，相应的动态库文件会生成在output文件夹中。

更多指令帮助，可以使用：

bash build.sh –h

如果想清除历史编译记录，可以如下操作：

rm -rf build/ output/
bash build.sh

社区

MindSpore Slack - 可以提问和找答案。

贡献

欢迎参与贡献，更多信息详见Contributor Wiki。

路标

以下将展示graphengine近期的计划，我们会根据用户的反馈诉求，持续调整计划的优先级。

总体而言，我们会努力在以下几个方面不断改进。

1、完备性：Cast/ConcatV2算子支持输入数据类型为int64的常量折叠；

2、完备性：onnx parser支持一对多映射；

3、架构优化：ATC解耦并迁移至parser；

4、易用性：提供tensorflow训练的checkpoint文件转pb文件的一键式转化工具；

5、易用性：提供一键式本地编译环境构建工具；

6、可维测：ATC转换生成的om模型包含框架信息、cann版本信息和芯片信息等；

MindSpore-GraphEngine基于C++的前端和昇腾处理器之间的连接模块

软件简介

安装说明

安装GE

源码安装

社区

贡献

路标

话处理器基础知识

C++ C语言函数查询电子版下载

C和C++实物精选《C专家编程》

C和C++经典著作《C和指针》

C和C++经典著作-C专家编程.PDF

基于C++和SCPI的功率传感器自动校准软件

采用混合信号前端设备和Blackfin®处理器的EE-236实时解决方案

基于ARM处理器的TFT-LCD显示系统

基于ARM处理器的禽舍环境监控系统

适用于ADSP-219x处理器的VisualDSP++3.5 C/C++编译器和库手册

适用于SHARC<sup>®</sup>处理器的VisualDSP++<sup>®</sup>5.0 C/C++编译器手册

用于SHARC<sup>®</sup>处理器的CrossCore<sup>®</sup>Embedded Studio 2.9.0 C/C++编译器手册

ADI处理器和DSP的μ模块调节器

用于TigerSHARC处理器的VisualDSP++<sup>®</sup>5.0 C/C++编译器和库手册

适用于Blackfin处理器的VisualDSP++<sup>®</sup>5.0 C/C++编译器和库手册

用于SHARC<sup>®</sup>处理器的CrossCore<sup>®</sup>Embedded Studio 2.9.0 C/C++库手册

用于Blackfin<sup>®</sup>处理器的CrossCore<sup>®</sup>Embedded Studio 2.9.0 C/C++编译器和库手册

AD9860/AD9862：宽带通信混合信号前端(MxFE)处理器产品手册

AD9861：宽带应用的混合信号前端(MxFE)处理器产品手册

Visual C++和MFC创建的应用程序基础知识

EE-340: SHARC®处理器和Blackfin®处理器的SPI 连接

FPGA Nios嵌入式处理器的硬件开发

ARM处理器CPSR标志位和条件符之间到底有什么关系

C++程序设计教程之C++工具的详细资料说明

C++程序设计教程之C++的初步知识的详细资料说明

Visual C++教程之C++的语言资料概述免费下载

Visual C++教程之C++的基础知识介绍

MATLAB和C++混合编程入门资料说明

如何从C转向C++ Effective C++ PDF中文版教材免费下载

VISUAL C++教程之VISUAL C++的安装和使用方法

润和软件将持续深化“昇腾+DeepSeek”技术路线

DeepSeek V3昇思MindSpore版本上线开源社区

迅龙软件出席华为昇腾APN伙伴大会，获昇腾APN钻石伙伴授牌及两项大奖

昇思MindSpore预测2024年中国AI框架市场份额将达30%

昇腾与昇思原生，助力智谱打造自主创新大模型体系！

昇腾AI框架全栈深度介绍

软通动力受邀参加“昇思MindSpore AI框架”主题论坛，持续探索大模型创新实践

加速解锁科学智能前沿，昇思MindSpore铸就了一把“全能”钥匙

人工智能框架生态峰会2023丨软通动力成为昇思MindSpore开源社区理事会首批成员单位

昇腾AI处理器：Ascend310和CANN简介

深度解析昇腾AI全栈架构设计

华为昇腾服务器研究框架 服务器行业演进历程

爱可生向量数据库基于昇腾AI实现全面升级

昇腾AI基础软硬件平台助力城市创新发展

中科院和华为联合发布基于昇腾AI和昇思MindSpore AI框架

昇腾AI训练营是什么

全场景AI框架昇思MindSpore获得国际认可

昇腾众智金质量奖获奖名单公布

基于昇腾CANN的AI应用开发

昇思MindSpore蛋白质结构预测模型研发进展

昇思MindSpore TechDay直播倒计时

昇思MindSpore全场景AI框架1.6版本的关键特性

Linux即将移除对Intel安腾处理器的支持

昇腾计算产业发展白皮书发布 全栈全场景AI共促昇腾计算产业发展

日报： 华为昇腾AI全栈软件平台首次全披露 谷歌AI新技术

处理器之间是怎么区分的

华为又放大招：发布正式商用的AI芯片——Ascend 910（昇腾910）

华为发布全球算力最强AI处理器，芯片昇腾910问世！

华为发布最强的AI处理器“昇腾910”与打造全栈全场景AI解决方案

华为首次发布基于ARM架构的处理器芯片

下载排行榜

飞利浦D8714收录机说明书

RK3506B原理图参考设计

人工智能+消费：技术赋能与芯片驱动未来

H110主板CPU PWM芯片ISL95858HRZ-T核心供电电路图资料

⼯业电源&模块电源产品⼿册

技嘉H110主板IT8628E_BX IO电路图资料

华为昇腾服务器研究框架服务器行业演进历程

昇腾计算产业发展白皮书发布全栈全场景AI共促昇腾计算产业发展

日报：华为昇腾AI全栈软件平台首次全披露谷歌AI新技术