电子说
5月3日下午,AI领域最强独角兽寒武纪科技(Cambricon)在上海举办新品发布会,正式发布了中国第一款云端智能芯片——Cambricon MLU100芯片,以及云端智能芯片 MLU100 和相应的板卡产品。
寒武纪表示 MLU100 芯片是寒武纪发展历程上全新的里程碑,标志着寒武纪已成为中国第一家(也是世界上少数几家)同时拥有终端和云端智能处理器产品的商业公司。
此次发布会,寒武纪也兑现了去年年底的承诺——进军云服务领域。
首款云端智能芯片:MLU 100
MLU100采用寒武纪最新的MLUv01架构和TSMC 16nm的先进工艺,可工作在平衡模式(1GHz主频)和高性能模式(1.3GHz主频)下,平衡模式下的等效理论峰值速度达每秒128万亿次定点运算,高性能模式下的等效理论峰值速度更可达每秒166.4万亿次定点运算,但典型板级功耗仅为80瓦,峰值功耗不超过110瓦。
与寒武纪系列终端处理器一样,MLU100云端芯片仍然延续了寒武纪产品一贯出色的通用性,可支持各类深度学习和经典机器学习算法,充分满足视觉、语音、自然语言处理、经典数据挖掘等领域复杂场景下(如大数据量、多任务、多模态、低延时、高通量)的云端智能处理需求。
MLU100的板卡使用PCIe接口,其外形设计灵感来自于寒武纪地质时代的远古海洋生物三叶虫,以黑色、蓝色为主色调,简洁而富有科技感。
作为一家国际智能芯片领域的先行者,在人工智能大爆发的前夜,寒武纪科技又一次带来了新突破,也在它“引领人类社会从信息时代迈向智能时代,做支撑智能时代的伟大芯片公司”的理想之路上迈进了一步。值得一提的是,MLU100云端智能芯片是上海寒武纪百名科研人员历时近2年的研发成果。
端云协作,三代IP发力“智能生态”
这次最新发布的寒武纪1M,则是该公司的第三代IP产品,在TSMC 7nm工艺下8位运算的效能比达5Tops/watt (每瓦5万亿次运算),提供三种规模的处理器核(2Tops/4Tops/8Tops)以满足不同应用场景下不同量级的智能处理需求,并可通过多核互联进一步提高性能。
2016年,寒武纪推出的第一代终端智能处理器IP产品寒武纪1A是全球第一款商用终端智能处理器IP产品,已经应用于千万级智能终端中(包括华为Mate10、P20和荣耀10等手机)。
寒武纪1M处理器延续了寒武纪前两代IP产品(寒武纪1H/1A)卓越的完备性,单个处理器核即可支持CNN、RNN、SOM等多样化的深度学习模型,并更进一步支持SVM、k-NN、k-Means、决策树等经典机器学习算法,支持本地训练,为视觉、语音、自然语言处理以及各类经典的机器学习任务提供了灵活高效的计算平台,将广泛应用于智能手机、智能音箱、智能摄像头、智能驾驶等不同领域当中。
寒武纪终端和云端产品均原生支持寒武纪NeuWare软件工具链,可以方便地进行智能应用的开发,迁移和调优。
陈天石博士表示,寒武纪创立的初衷就是要让全世界都能用上智能处理器。寒武纪将秉承学术界开放、协作的精神,以处理器IP授权的形式与全世界同行共享寒武纪最新的技术成果,使全球客户能够快速设计和生产具备人工智能处理能力的芯片产品。
寒武纪在技术上贯彻“端云协作”的理念,这次发布的MLU100云端芯片,不仅可独立完成各种复杂的云端智能任务,更可以与寒武纪1A/1H/1M系列终端处理器完美适配,让终端和云端在统一的智能生态基础上协同完成复杂的智能处理任务。
“寒武纪生态”爆发
在发布会上,寒武纪的合作伙伴们展示了基于寒武纪芯片的部分应用方案。其中联想推出了基于 Cambricon MLU100 的服务器 ThinkSystem SR650。该产品为 2U2 路机架式规格,支持两个 MLU100 智能处理器计算卡。这款服务器打破了 37 项服务器基准测试的世界纪录。
中科曙光也在发布会上推出了基于 Cambricon MLU100 的服务器产品系列“PHANERON”。这款服务器可支持 2-10 块寒武纪 MLU 处理卡,面向多种智能应用任务。其中 PHANERON-10 集成了 10 块寒武纪人工智能处理单元,可以为人工智能训练应用提供 832T 半精度浮点运算能力,在推理时提供 1.66P 整数运算能力。中科曙光表示,新一代服务器可以在典型场景下将能效提升 30 倍以上。
科大讯飞也在发布会上披露了与寒武纪的深度合作研发项目。其是披露根据最新的测试结果,寒武纪智能处理器在语音智能处理上,能耗比领先竞争对手的云端GPU方案超过5倍,可使语音本地识别准确率相对传统处理器加速9.8%。
最后,陈天石表示:“我们期待与全世界人工智能和集成电路的上下游同行携手共进,从‘芯’开始铸造人类社会的智能时代,向着全人类共同的美好未来前进。”
全部0条评论
快来发表一下你的评论吧 !