迅龙软件参加开源中国《数智漫谈》,探讨AI如何迈进大模型时代

描述

 

当前,人工智能技术正加速向大模型时代迈进,在政务、金融、医疗、工业等领域展现出颠覆性潜力。然而,大模型的训练与部署面临算力成本高、技术生态依赖性强、行业落地门槛高三大挑战。

为加速技术普惠,4月 23 日晚,开源中国直播栏目《数智漫谈》邀请华为昇腾生态技术专家、行业先行者以及迅龙软件等,分享一线开发经验,助力开发者与企业用户抓住国产 AI 新红利。

开发板

 

该话题围绕“如何让AI既跑得快(性能优化)又用得好(场景适配)”而展开。华为云 HCDE、微软 Insider Dev Tour China姚圣伟针对“昇腾插件化接入vLLM加速大模型推理创新最佳实践”做了主题分享。他表示,基于自主研发的昇腾处理器及CANN异构计算架构,昇腾推出插件化接入方案,与开源推理框架vLLM深度适配,为大模型推理提供高性能、低时延的创新实践。通过该功能,用户可以像实现自定义模型一样,插件化的完成vLLM的硬件支持。用户可以实现自己的Woker、ModelRunner、Attention、Communicator以及自定义算子。

开发板

 

迅龙软件技术专家以OrangePi AI Studio Pro为例,分享了迅龙软件在AI方面的探索实践,并现场演示了在OrangePi AI Studio Pro上完成DeepSeek-R1-Distill-Qwen-14B模型的本地化部署。OPi AI Studio Pro是基于2个昇腾 AI 处理器的新一代高性能算力卡,可提供352 TOPS INT8的计算能力,内存提供了96GB和192GB两个版本。

OPi AI Studio Pro融合“通用处理器、AI Core、编解码” 于一体,提供超强 AI 推理、目标检索、视频图片编解码等功能,具有超强算力、超高能效、超大视频解析路数、高性能特征检索等优势,支持高清视频实时分析,可广泛应用于 OCR 识别、目标识别、搜索推荐、内容审核、智慧城市、智慧交通、智慧园区等诸多 AI 应用场景。

 

开发板

《数智漫谈》是开源中国推出的一档直播栏目,每月1期,已推出22期。以“深度对话、多元视角、前沿洞察”为核心理念,聚焦IT技术、开源治理、行业趋势与创新实践,通过轻松互动形式搭建开源领域的思想交流平台。

 

 

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分