2019年6月21日,美国白宫政府发布了《美国人工智能研发战略计划2019更新版》(The National Artificial Intelligence Research and Development Strategic Plan:2019 Update),在2016年发布的报告基础上,增加了公私合营的战略提法,并强调了要大力推进开源软件和工具。
美国政府深谙开源软件在人工智能发展过程中的作用,在2016年的报告中,就有一个部分“开发开源软件库和工具”(Developing open-source software libraries and toolkits),其目的就是为了让更多人接触到人工智能。
为了推进共享公共数据集和开源软件,自2016年以来,美国各级政府做了不少工作:
(一)美国交通部支助第二届战略高速路研究项目(SHRP2,Second Strategic Highway Research Program)自然驾驶研究(NDS,Naturalistic Driving Study)。
该项目记录了3400名驾驶人员540万次旅程,通过车内的数据获取系统(DAS,Data Acquisition System),从前置雷达、四个视频录像机、加速器、汽车网络信息、GPS和道路追踪器等获得数据。
这些数据摘要是公开的,对于详细数据的获取需要一定的认证程序。
(二)退伍军人事务数据共性平台(VA Data Commons)创造了世界上最大的关联医疗基因数据集,可以用机器学习和人工智能工具进行分析。
据工业4.0研究院观察,这些数据都符合美国NIST标准,可以更好被公众所应用。
当然,之所以VA Data Commons可以做这样的数据共享,是因为退伍军人需要更好的治疗,通过政府提供的资金,可以对这些问题进行研究,更好改善对退伍军人的服务。
(三)通用服务管理部门(GSA,General Services Administration)采用上云的方式促进人工智能的应用。
《美国人工智能研发战略计划2019更新版》介绍称,通过data.gov和code.gov两大开放开源平台,通用服务管理部门提供了24.6万个数据集和源代码。
这些数据集和源代码来自政府各个部门,通过分享出来,可以帮助研究机构和开发者更好进行研发。
(四)美国卫生研究院(NIH,National Institutes of Health)利用云平台共享数据和开源代码。
美国卫生研究院探索、试验和持续的科学研究基础设施计划(STRIDES,Science and Technology Research Infrastructure for Discovery,Experimentation, and Sustainability)与业内领先的云服务平台合作,可以访问美国卫生研究院支助的各种数据。
工业4.0研究院了解到,美国卫生研究院跟亚马逊进行了合作,结合到亚马逊的一些开源项目,共同推进相关开放数据和开源项目的共享。
美国经历了完整的20年发展,形成了完善的专业化分工,政府对开放和开源的认识比较成熟,可以理性的、较长期的支持开源社区工作,这跟美国市场化力量相得益彰,形成了良性的互动格局。
在中国做同样事情就比较困难。一方面政府大部分工作成果公开有困难,更谈不上要把接受政府支助的数字化成果开放或开源出来,因为这些接受支助的企业大都是一些大型企业,它们从来没有开放和开源的习惯;另外一方面,中国还缺乏宽容的开放和开源环境,正如一位开源界人士所讲,中国开源社区充斥着一批互相鄙视的人群,难以进行协作。
在数字经济时代,大量数字化成果不能通过开放或开源方式共享,其创新速度肯定难以提高,这会影响我国推进工业互联网等大计。
正因为如此,早在2017年,笔者就写了《开源项目是人工智能的基础设施》一文,一年之后,工业4.0研究院发起了开源工业互联网联盟(Openii Consortium),希望可以做一些力所能及的事情。
全部0条评论
快来发表一下你的评论吧 !