基于龙架构的AI加速开发系统正式落地

描述

随着信息数据的爆炸式增长、计算能力的提高以及理论算法的突破,AI技术快速发展,AI技术不仅在学术界产生突破性研究成果,同时在工业界被广泛应用。目前,绝大多数流行使用的AI系统均为国外开发者发布,使用国外的开发系统平台开展AI的研究和应用,具有风险性和安全问题。AI系统作为关键系统软件,亟需解决国产化问题并确保安全可控。

近期,在龙芯中科、松科智能、寒武纪等多方的共同努力下,基于LoongArch(龙架构)的AI加速开发系统,在金陵科技学院成功部署验收。

基于龙架构的AI加速开发系统

1基于LA架构,算力最高达20T

基于龙芯最新高性能处理器龙芯3C5000L设计,处理器基于龙芯自主指令系统架构LoongArch。配合国产 AI加速卡,最⾼可以完成10T算⼒的⼯作任务。多卡最⾼可以⽀持4路⼈⼯智能计算卡的部署,最⾼算⼒可以达到20T。

2与系统软硬件深度融合

该AI加速开发系统,与系统软硬件的深入融合,提供了开发、调试与维护的系统平台,有可靠的硬件支持和性能优越的算法模型,把AI技术和硬件系统环境进行有机结合,应用到具体和安全密切相关的实际场景中,例如人脸识别认证,智能检测控制、大数据风控等。在这些场景下AI技术能提供比人工更加好的识别精准度,节省人工成本,为生产生活带来便利。

AI开发系统的硬件结构

3支持多个人工智能场景

该AI加速开发系统,可以实现包括⼈脸识别、矩阵推导、模式识别、智能驾驶等⼈⼯智能场景,提供深度学习定点化训练框架以及模型的定点化⼯具,提供通⽤模型的编译以及部署开发SDK套件,⽀持 MXnet、 Caffe、TensorFlow 等主流算法框架。

人脸识别功能测试

在很多场景下的AI开发系统平台无法满足系统性能的需要,不易于开发,资源利用率低等,基于龙架构的AI加速开发系统,发挥计算芯片的效率,搭载设计先进的计算卡,开拓了机器学习系统新的发展方向。此系统搭载国产⼈⼯智能芯⽚,可以⾼效完成多路动态视频流的⼈脸检测、跟踪、特征提取和识别,⾼效⽀持墨镜、⼝罩、性别、年龄等属性检测。提供强⼤的可编程运算能⼒,满⾜CNN算法实时性处理的运算要求和算法移植和应⽤。

在国家大力发展自主可控的关键基础软硬件背景下,基于龙架构的AI加速开发系统的落地,为国产AI产业发展提供了新的创新动能与实践样本。高校是培养创新型科技人才的前沿阵地和摇篮,龙芯中科愿携手金陵科技学院及其它各类院校,不断进行产学研深度合作,培养创新技术人才,共同建设自主信息技术体系和产业生态。

原文标题:龙芯联手松科智能与寒武纪,基于LoongArch的AI加速开发系统落地南京高校

文章出处:【微信公众号:龙芯中科】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分