中科亿海微举办具身智能专题讲座共探数据与算法驱动下的具身智能构建路径

描述

 

6月13日,中科亿海微举办“具身智能构建:数据与算法”专题讲座。本次讲座邀请中科院自动化所紫东太初大模型中心资深研究员、博士生导师唐明作专题分享,报告围绕具身智能发展特点、核心竞争领域、数据体系建设、具身脑设计方案及前沿研究成果展开。

中科亿海微

唐明研究员长期从事多模态大模型、目标检测、跟踪与识别等方向研究,深度参与多模态大模型技术研究,在人工智能与多模态感知领域具有深厚积累。本次讲座采取线下与线上相结合的方式举行,公司相关研发、产品、市场及业务团队成员参加学习交流。

讲座中,唐明研究员从具身智能的基本概念切入,指出具身智能是能够与物理环境进行交互感知、认知、自主规划、决策和行动的智能体,其核心在于构建自主的“感知—动作”闭环。相比传统机器人主要依赖预设任务、精确建模和结构化指令,具身智能更强调数据驱动学习、自然语言交互、环境自适应,以及感知、规划、决策、行动与反馈之间的闭环协同。

围绕产业发展格局,报告系统梳理了具身智能的五大核心竞争领域,包括算法大模型层、整机本体层、核心零部件层、工业应用层以及民生与特种应用层。唐明研究员指出,具身智能的发展不是单一算法或单一硬件的突破,而是算法、数据、算力与本体协同演进的系统工程。其中,算法是灵魂,算力是关键,本体决定场景操作能力上限,而数据则是当前制约具身智能规模化发展的重要瓶颈。

在数据体系建设方面,报告重点阐述了“具身数据金字塔”的搭建思路。当前具身数据远未达到支撑“规模定律”的门槛,真实机器人数据采集仍面临本体不统一、采集效率低、成本较高等问题。针对这一挑战,报告介绍了由互联网数据、仿真数据和机器人真实数据共同构成的数据体系,并阐述了数字资产生成、虚实融合数据工厂、遥操作实机采集、大模型驱动实机采集等路径,为具身智能数据建设提供了系统化思路。

中科亿海微

在算法层面,报告围绕“具身脑”设计进行了深入讲解,重点介绍了VLM、VLA和WAM三类关键模型。VLM视觉语言模型侧重感知与认知,VLA视觉语言动作模型侧重从语义指令到动作执行,WAM世界动作模型则通过预测未来环境状态,支持智能体进行前瞻性推理和长期规划。三类模型的协同,为具身智能从环境理解走向动作执行提供了重要基础。

讲座还结合多项前沿研究成果,介绍了世界模型生成仿真数据、可交互三维数字资产生成、跨本体机器人操作学习、自动化数据采集等方向的最新进展,展现了具身智能在数据构建、模型训练和任务泛化方面的探索路径,报告内容为公司进一步理解具身智能技术演进趋势、把握智能系统对底层计算架构和芯片能力的新需求提供了有益参考。

交流环节中,与会人员围绕FPGA在具身智能系统中的作用,VLM、VLA、WAM等模型在端侧部署中的挑战,世界模型的发展路径,具身智能产业落地难点以及LLM与触觉等多模态信息融合等问题,与唐明研究员进行了深入探讨。唐明研究员结合前沿研究进展和产业实践,对相关问题进行了细致解答,现场交流气氛热烈。

本次专题讲座内容前沿、系统且富有启发性,不仅加深了公司员工对具身智能数据与算法体系的理解,也为国产FPGA在多模态感知、边端推理、实时控制、数据采集与系统协同等方向的应用探索提供了新的思路。未来,中科亿海微将持续关注具身智能、机器视觉、边缘智能和异构计算等前沿方向,充分发挥国产FPGA、嵌入式FPGA IP核、自主EDA软件和可重构系统等方面的技术积累,推动芯片技术与人工智能应用场景深度融合。

砺志创芯,产业报国。中科亿海微将持续加强前沿技术学习交流,深化产学研协同创新,以国产可编程芯片技术服务智能时代发展需求。

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分