图:2020 LF AI & DATA DAY(AI开源日)
鹏城实验室人工智能研究中心副主任、北京大学教授田永鸿指出,鹏城实验室自创建以来便以AI开源开放作为重要使命,建立了算力国际先进、国内领先的AI超级算力平台,持续支撑AI基础研究、前沿技术突破与重大产业赋能的开展。此次,OpenI启智社区、鹏城实验室与LF AI&Data基金会三方面战略合作将是很好的起点,加速中国AI开源社区融入国际化的进程。
近年来,AI 技术在全球特别是中国地区高速发展,开源开放也成为了开发者社区的主流趋势,全球和中国AI开源社区呈现哪些趋势?AI开源项目要进入LF AI&Data基金会,需要具备哪些条件?在AI开源社区中,鹏城实验室主要扮演怎样的角色?华为MindSpore全场景AI计算架构有什么独特的优势?LF AI & Data 基金会未来一年在中国的发展目标是什么?电子发烧友记者独家专访了LF AI & DATA基金会理事会主席星爵、鹏城实验室人工智能研究中心副主任邱景飞和华为MindSpore开源社区运营负责人黄之鹏,他们带来这些前沿领域最新趋势和AI开源社区国际化落地的最新情况解读。
LF AI & DATA基金会理事会主席星爵对记者表示,2020年是不平凡的一年,对中国开源是一个很好的起点。从结构化数据到互联网时代的变化,是如今基金会从AI基金会拓展到囊括数据领域的基金会的原因。想要完成如此庞大的数据解读与应用,必须强化开源合作。
图:LF AI & DATA基金会理事会主席星爵接受记者采访
“开源运动在全球蓬勃发展,越来越多的基础软件都会通过开源的方式,实现广泛的传播。在最近2年,中国开源开发者的数量,开源项目的总量已经位居全球第二。开发者和项目的增速位列全球第一。30%的开发者来自中国,全球开源项目中,大概有30%-40%的项目来自中国,” 星爵分析说,“在全球开源的持续发展中,中国取得可喜的发展。在AI领域,由于数据量和场景的领先,导致中国在AI应用领域走在全世界前列,包括AI数据的采集和数据的处理分析。”
今年,虽然有新冠疫情的影响,LF AI & DATA基金会还是取得快速发展,包括会员数,顶级会员加入,全球的会员数量达到39家,有二十多个项目在不同的孵化或毕业阶段。例如2020年上半年,腾讯开源项目Angel从LF AI基金会毕业,是中国首个从LF AI基金会毕业的开源项目。Angel得到全球技术专家的认可,成为世界最顶级的AI开源项目之一。
又比如2020年,Zilliz 发起的 Milvus 项目已取得了相当亮眼的成绩,在未来社区希望能通过 Milvus 向量搜索引擎的易用性与通用性进一步帮助更多的企业进行 AI 应用落地。
图:左二鹏城实验室人工智能中心副主任邱景飞、左一华为MindSpore开源社区运营负责人黄之鹏
鹏城实验室人工智能中心副主任邱景飞认为,为了运营好AI开源社区,社区就要对人工智能四大要素(算力、算法、数据、知识)有所支撑。首先,AI开源社区不仅包括开源代码,还要包括开放的数据集,因为数据集对人工智能开发者和研究相当重要;其次,AI领域的科技创新需要算力支撑,需要模型进行训练,鹏城实验室可以给开源社区提供算力支撑,对于开发者降低开发门槛,意义重大。通过训练后生成模型也可以成为AI开源的一部分内容。
华为MindSpore开源社区运营负责人黄之鹏表示,国内开源社区的开发者更重视人与人的交流,我们会做一些活动拉近开发者之间的距离。
“鹏城实验室建立之初,实验室主任高文院士就要求将开源开放作为重要的使命和任务,在鹏城实验室科研人员做出的成果都能尽量开源开放” 邱景飞指出。
首先,鹏城实验室专门成立了AI开源运营和服务团队,投入了专人运作,并为启智社区的运营提供很强的支撑。
其次,实验室建立了国内领先的AI智能算力平台,这些算力除了用于人工智能的科研工作,也会把一部分算力开放给启智社区,让更多的AI开发者就有机会免费或用低廉的费用使用AI算力。
此外,在针对不同类型的开源项目在不同的社区进行运营,OpenI启智社区就汇聚了精品的开源项目,鹏城实验室还打造了聚焦在AI领域的代码托管平台鹏城汇智(iHub.org.cn),AI开发者可以在这个平台上分享AI的数据集、代码、算法和模型。
“2020年12月2日到3日启智社区将在北京国家会议中心举办OpenI/O启智开发者大会(2020.openi.org.cn),欢迎广大AI开发者踊跃参与。” 邱景飞分享说。
图:2020年OpenI/O启智开发者大会
据了解,OpenI启智社区从2018年开源项目孵化到今年的开源项目孵化推进,现在开源项目中鹏城实验室参与的就占一半以上,正因为鹏城实验室有这样的机制,汇聚全天下的开发者经营一起推动开源平台做一些事情加速AI技术和应用结合的落地。
MindSpore开源社区运营负责人黄之鹏重点分享了MindSpore的近期成果。作为今年3月底才正式开源的深度学习框架。MindSpore目前已经取得了辉煌成功,它可以给开发者提供自动微分、自动并行、深度图优化等主要特性,支持面向端边云全场景统一的一套API,并拥有高阶优化、图算融合、量化训练、手机/IoT支持、深度概率编程等一系列特色能力。
MindSpore框架的优势,黄之鹏分析有三个方面:一、开发态友好,整个框架前端写起来简单;二、MindSpore整个运行态的性能高效,MindSpore和昇腾的软硬件的结合,整体软硬件的吞吐性能基本上比同类可以高出1.8到2.2倍;三、部署态方便,MindSpore是全场景框架,现在手机侧或者在数据中心的硬件上面都可以部署。方便开发者在云上开发相关模型,通过量化训练之后,量化的模型可以直接部署到华为手机上。
MindSpore对于普通的开发者没有门槛,只要熟悉开源,开发的一些很基本的流程就可以加入,我们在社区设立了MindSpore布道体系,如果开发者确实非常深入的参加社区,帮助宣传mindspore,我们设置两档:一个叫MindSpore优秀开发者,然后还有一个Mindspore布道士,优秀开发者和布道士都会有一些相应的物质激励吧。
Mindspore采取开放治理,无论你是个人或企业,你的贡献都得到保证。每个贡献者的名字都会保留在文件里。如果说开发者自己开发了一个模块,让Mindspore更好用,他就可以通过成立特殊兴趣组这种机制把模块共享给社区。所有贡献信息都是被公开承认的。
MindSpore社区在LF AI &Data基金会发起了MLWorkflow & Interop委员会,旨在与社区伙伴一起,讨论南北向面向应用对框架集成以及面向硬件对框架支持的互操作性问题。
MindSpore社区亦在OpenI启智社区发起了OpenI-巴别塔项目,旨在借鉴Linux基金会OPNFV社区的开源集成平台思路,推动基于MindSpore+Tensorlayer的AI开源集成类项目,并进一步推动社区联邦实验室的建设,为AI原生编程生态提供坚实的基础。
本文由电子发烧友网原创,未经授权禁止转载。如需转载,请添加微信号elecfans999。
全部0条评论
快来发表一下你的评论吧 !