开源软件-TNN移动端推理框架-电子发烧友网

TNN是一个移动端高性能、轻量级推理框架，同时拥有跨平台、高性能、模型压缩、代码裁剪等众多突出优势。TNN框架在原有Rapidnet、ncnn框架的基础上进一步加强了移动端设备的支持以及性能优化，同时也借鉴了业界主流开源框架高性能和良好拓展性的优点。目前TNN已经在手Q、微视、P图等应用中落地，欢迎大家参与协同共建，促进TNN推理框架进一步完善。

快速开始

使用 TNN 非常简单，如果你有一个已经训练好的模型, 那么一般而言通过以下三个步骤就能完成模型在目标平台上的部署。

第一步是把训练好的模型转换成TNN的模型，为此我们提供了丰富的工具来帮助你完成这一步，无论你使用的是 TensorFlow、PyTorch、或者 Caffe，都可以轻松完成转换。
当你完成了模型的转换，第二步就是编译目标平台的 TNN 引擎了，你可以根据自己的目标平台的硬件支持情况，选择 CPU/ARM/OpenCL/Metal 等加速方案。对于这些平台，TNN 都提供了一键编译的脚本，使用非常方便。
最后一步就是使用编译好的 TNN 引擎进行推理，你可以在自己的应用程序中嵌入对 TNN 的调用，这方面我们提供了丰富而详实的 demo 来帮助你完成。
- 从0开始跑通一个iOS Demo
- 从0开始跑通一个Android Demo

技术方案

目前TNN已经在手Q、微视、P图等应用中落地：

计算优化
- 针对不同架构在硬件指令发射、吞吐、延迟、缓存带宽、缓存延迟、寄存器数量等特点，深度优化底层算子，极致利用硬件算力
- 主流硬件平台(CPU: ARMv7， ARMv8， GPU: Mali， Adreno， Apple) 深度调优
- CNN 核心卷积运算通过 Winograd，Tile-GEMM， Direct Conv 等多种算法实现，保证不同参数、计算尺度下高效计算
- Op 融合：离线分析网络计算图，多个小 Op（计算量小、功能较简单）融合运算，减少反复内存读取、kernel 启动等开销
低精度优化
- 支持 INT8， FP16 低精度计算，减少模型大小、内存消耗，同时利用硬件低精度计算指令加速计算
- 支持 INT8 Winograd 算法，(输入6bit)，在精度满足要求的情况下，进一步降低模型计算复杂度
- 支持单模型多种精度混合计算，加速计算同时保证模型精度
内存优化
- 高效”内存池”实现：通过 DAG 网络计算图分析，实现无计算依赖的节点间复用内存，降低 90% 内存资源消耗
- 跨模型内存复用：支持外部实时指定用于网络内存，实现“多个模型，单份内存”。

主流模型实测性能：v0.1 2020.05.29

麒麟970：

model	cpu time(单线程，ms)	gpu time(ms)
Mobilenet_v1	88	12
Mobilenet_v1_int8	55
Mobilenet_v2	58	11
Mobilenet_v2_int8	41
squeezenet_v1.0	127	20
squeezenet_v1.0_int8	82

骁龙835：

model	cpu time(单线程，ms)	gpu time(ms)
Mobilenet_v1	94	16
Mobilenet_v1_int8	62
Mobilenet_v2	61	14
Mobilenet_v2_int8	47
squeezenet_v1.0	122	28
squeezenet_v1.0_int8	93

骁龙845：

model	cpu time(单线程，ms)	gpu time(ms)
Mobilenet_v1	60	10
Mobilenet_v1_int8	37
Mobilenet_v2	39	8
Mobilenet_v2_int8	28
squeezenet_v1.0	74	14
squeezenet_v1.0_int8	56

TNN架构图：
通过 ONNX 支持 TensorFlow， PyTorch， MXNet， Caffe 等多种训练框架，充分利用和融入不断完善的 ONNX 开源生态。当前支持 ONNX 算子55个，近期会完善到约80个，覆盖主流CNN网络
支持主流安卓、iOS、Embedded Linux 操作系统，支持 ARM CPU， GPU 硬件平台（近期还会加入达芬奇 NPU 支持）
模块化设计，将模型解析、计算图构建、优化、底层硬件适配、高性能 kernel 实现各部分抽象隔离，通过 Factory Mode 注册、构建设备，方便接入更多的底层硬件、加速方案。
Runtime 无任何第三方库依赖，CPU 动态库尺寸仅约 400KB，并提供基础图像变换操作，调用简单便捷。跨平台模型统一、调用接口统一，通过单个配置参数快速切换。

开源软件-TNN移动端推理框架

软件简介

快速开始

技术方案

ChatGPT:AI模型框架研究

通过Nano框架使用LCD的开源项目

物联网GitHub框架开源

纳米框架Esp32开源分享

移动电话开源分享

开源软件-Msnhnet小型PyTorch推理框架

基于OpenHarmony适配移植的移动端和Web的JS桥接框架

开源雾计算软件框架FogLAMP介绍（二）：FogLAMP介绍

开源雾计算软件框架FogLAMP介绍（三）：FogLAMP架构分析

AI开源浪潮的领军力量！OPEN AI LAB Edge AI推理框架Tenigne全解读

移动端基于GPU推理的神经网络推理框架

端侧softmax推理的数学等价优化

三个基于WebRTC开源MCU框架的横向对比

MCU软件开发——软件框架

开源pcb设计软件

开源网络协议分析器WireShark软件下载

基于手绘轮廓图的移动端图像检索方法

面向群体协作开发的开源软件峭壁特性分析

浑源软件项目中的代码结构和开源组件综述

移动通信中的软件无线电技术研究

ThinkPHP 6.0完全开发手册资源下载

基于AADL的自主无人系统可成长框架综述

跨媒体数据分析与推理技术综述

基于计算机视觉和NLP的跨媒体问答与推理

一种基于机器学习的流簇大小推理模型

如何安装MPLAB Harmony v3软件开发框架

VxSCADA组态管理软件使用手册电子版

一种基于框架特征的共指消解方法

如何使用PVRTexTool提升移动端图形效果

嵌入式系统的应用框架详细资料分析

华为鸿蒙正式开源SimpleGPULayer高性能GPU加速框架

RT-Thread任务+消息订阅管理框架软件包：thread_manager+event_loop

软通动力基于OpenClaw开源框架深度自研端侧智能体平台

NVIDIA TensorRT LLM 1.0推理框架正式上线

端侧AI推理赋能效率革命，美格智能多领域落地打造行业范本

Arm率先适配腾讯混元开源模型，助力端侧AI创新开发

润和软件StackRUNS异构分布式推理框架的应用案例

润和软件发布StackRUNS异构分布式推理框架

SSM框架的优缺点分析 SSM在移动端开发中的应用

大语言模型开发框架是什么

阿里云开源推理大模型QwQ

Arm成功将Arm KleidiAI软件库集成到腾讯自研的Angel 机器学习框架

bootstrap框架用什么软件开发

AI推理框架软件ONNX Runtime正式支持龙架构

谷歌模型框架是什么软件？谷歌模型框架怎么用？

边缘计算平台开源框架有哪些类型

主流大模型推理框架盘点解析

深度学习框架区分训练还是推理吗

Katalon：移动端测试

测评分享 | 如何在先楫HPM6750上运行轻量级AI推理框架TinyMaix

NVIDIA Triton 系列文章（6）：安装用户端软件

腾讯云TI平台利用NVIDIA Triton推理服务器构造不同AI应用场景需求

NVIDIA推理平台和全栈方法提供最佳性能

基于医疗图像的深度学习开源框架

NVIDIA宣布其AI推理平台的重大更新

关于推出适用于设备端推荐的自适应框架

谷歌重新定义开源软件漏洞治理框架

基于IIoT-EDDP开源平台和PYNQ软件框架的电机控制

阿里开源首个移动AI项目，淘宝同款推理引擎

Facebook与CMU联手打造开源框架PyRobot

下载排行榜

人形机器人执行、感知系统技术及市场解析

瑞芯微RK3588系列开发板-产品资料更新-2026.06

OK3506-S12 Mini开发板产品资料-2025.10

ZS73XGaN 高性能 PWM+D-GaN 芯片数据手册

FS4054H 输入电压范围3.8V~6.8V 输入最大耐压28V 输入过压关闭充电阈值6.8V

LZC9300A 高性能恒压恒流碳化硅驱动控制芯片