2024年7月13日-14日,由中国人工智能学会主办的2024中国元宇宙大会在杭州隆重举行。大会期间举行6场专题论坛,分别聚焦AIGC与数字人、人机交互与混合现实、AR/VR与光场显示、具身智能与元宇宙、艺术元宇宙、文旅元宇宙等关键领域和垂直场景。
摩尔线程作为中国全功能GPU创新引领者和元计算概念提出及实践者,受邀参加本次盛会。摩尔线程联合创始人、首席技术官张钰勃联合主持了人机交互与混合现实专题论坛。摩尔学院院长李丰参与了大会发布的《中国人工智能系列白皮书—元宇宙技术(2024版)》撰写。摩尔线程高级专家杨丰博士发表了《虚实结合 加速未来:以全功能GPU综合算力加速元宇宙产业发展》的主题演讲。
杨丰博士在演讲中首先介绍了摩尔线程全功能GPU的多元计算能力。
接着从具身假设开始,杨丰博士介绍了具身智能感知、规划、行动一体化的思想。他表示,具身智能的发展使得AI学习从仅依靠静态的数据集逐渐转换到还需要动态的模拟器。这种面向AI学习所设计的模拟器,主要目的是为了支撑Sim2Real,即“AI Agent需要被部署到实际的设备上,从而与物理世界产生交互”。这种面向AI学习的需求,给模拟器的设计带来了新的挑战。
以灵巧手为例,当前机械臂逐渐开始采用视触觉传感器GelSight。这种传感器利用相机拍摄接触面的凝胶,从而通过图片感知接触物体的几何形状、纹理、切向摩擦等信息。在模拟器中模拟这样一种视触觉传感器,需要通过渲染管线渲染160x120大小的图片。但是,由于在每根手指上都存在多个传感器,因此每一帧需要大量调取Draw指令进行渲染,使得渲染成为了主要的性能瓶颈。因此,近年来很多工作都在使用现代图形API实现批量渲染的引擎,将渲染合并在一起进行一次性处理,大幅提高渲染效率。
基于感知获得的信息,接下来要让机械手完成任务,最直接的方式就是行为克隆。通过XR设备,人类可以录制对应的操作数据,甚至可以进入到虚拟训练环境中与Agent互动。摩尔线程端到端全国产XR解决方案MTVerse XR支持多种XR设备运行在摩尔线程全功能GPU上,利用全功能GPU的视频编解码能力,可提供低延时体验,降低因为延时带来的操作失误。
事实上,行为克隆技术很早就进入到了机器人研究当中,但这种方式总归需要人录制数据。在录制数据中,往往还需要一些专家知识,例如:避免动作的多模态等,数据的获取往往比较困难。强化学习可以降低对数据的依赖,但是这种方式采样效率低。GPU物理引擎结合GPU上的强化学习,可以大幅提高任务的吞吐量。摩尔线程很早就基于全功能GPU自研了全自主物理引擎AlphaCore,产品已经在多个场景大量应用。
在模拟器中学习,最大的好处就是提高学习的泛化能力。对于抓取这样的任务,现实空间中针对不同大小、形状、材质的物体进行训练成本很高。通过AIGC生成大量3D物体,结合物理引擎,可以为Agent泛化学习提供很好的支持。基于高度CUDA兼容的摩尔线程MUSA架构,摩尔线程GPU广泛支持国内外主流AIGC大模型,最新的AI模型可以很容易迁移到摩尔线程全功能GPU上,进行训练和推理。
从具身智能的发展来看,模拟器和AI这两项技术逐渐融合,越来越需要全功能GPU的各项技术结合在一起才能完成AI Agent的训练任务。
杨丰博士最后表示,混合现实技术为人机交互带来了革命性的创新,引领我们步入一个虚实交融的新时代,也对多元算力提出了更高的要求。摩尔线程全功能GPU将成为未来计算的中坚力量,为迈向AGI时代提供加速动力。
元宇宙作为融合人工智能、虚拟现实等多项前沿技术的全新领域,蕴含了感知、计算、重构、协同、交互等关键核心技术,是未来技术发展和社会生活变革的重要路径,将催生出新型虚实融合应用和社会形态,引领数字经济等多个万亿级未来产业发展。具备多元算力的全功能GPU将成为元宇宙产业的核心算力支撑平台,摩尔线程将发挥全功能GPU的产品技术优势,致力于为元宇宙产业提供中国算力解决方案。
▼ 关于摩尔线程
摩尔线程成立于2020年10月,以全功能GPU为核心,致力于向全球提供加速计算的基础设施和一站式解决方案,为各行各业的数智化转型提供强大的AI计算支持。
我们的目标是成为具备国际竞争力的GPU领军企业,为融合人工智能和数字孪生的数智世界打造先进的加速计算平台。我们的愿景是为美好世界加速。
全部0条评论
快来发表一下你的评论吧 !