瑞萨RZ/V2H平台支持部署离线版DeepSeek -R1大语言模型

RA生态工作室 2025-05-13 2022

描述

1 DeepSeek在端侧设备的应用场景

DeepSeek大语言模型（LLM）可用于理解人类语言的交互方式，思考，并给出合适的回应。同时，通过结合RAG（Retrieval-Augmented Generation，检索增强生成）技术，可以从用户定制知识数据库检索信息，将其作为提示输入给LLM，LLM通过将这些额外的知识与自己的语言技能相结合，可以撰写更准确、更具时效性且更贴合具体需求的文字，提供面向某个具体领域的专业应答。在AI概念和端侧AI技术火热的当下，瑞萨半导体推出的面向端侧AI应用的高性能MPU，也可以部署DeepSeek-R1模型。在我们预想的应用场景中，我们可以在部署了DeepSeek-R1模型和RAG定制数据库的瑞萨MPU电路板上，在不联网的情况下，实现如下应用：

向AI模型投喂高端家电、车辆等复杂电子产品的用户手册，对这些模型进行训练，以创建一个AI助手，能够自动执行某些复杂功能的设置。如此，用户就不必为了使用某一样新奇的功能而花费大量时间阅读手册。相对于传统的语音识别应用需要特定的命令或者唤醒词，引入LLM对口头语言的表达进行分析，可以让硬件设备更容易理解用户的需求。
面向骑行爱好者，让AI助手在自行车电脑中运行，这样用户在骑自行车时就可以获得个性化的导览/导航以及其他信息。
AI智能眼镜&耳机，直接理解用户口语表达的命令，以日常使用的人类语言与电子系统进行交互。
实时的翻译机，在不联网的应用场景中，利用AI做一些简单的语言转换，甚至可以作为人与宠物之间的交互。例如，宠物猫和宠物狗的语言表达相对于人类语言更简单，可以把它们的语言转换成人类理解和思考的方式表现出来。

为此，我们在瑞萨定位于AI应用的MPU芯片RZ/V2H，适配了DeepSeek-R1:1.5B的LLM模型，以支撑这些潜在的AI应用。

2 瑞萨RZ/V2H硬件平台简介

在演示用例中，使用瑞萨官方的RZ/V2H-EVK开发板，如图1所示。