2018年AI技术的应用现状和未来发展

电子说

1.3w人已加入

描述

对AI技术应用的扩展导致全球AI人才极度紧缺,中美在AI产业相关领域的人才和地盘之争愈演愈烈,以半导体行业为焦点,两国几乎因此陷入贸易大战。这份报告由剑桥大学两位博士制作,从研究、人才、行业和政策等角度详述2018年AI技术的应用现状和未来发展。

人工智能是一个跨领域学科,旨在创造出智能机器。我们相信,AI 将会成为促进数字化、数据社会的强大催化剂。这是因为,如今我们周围的一切,从文化到消费产品,无一不是智能的产物。在本报告中,我们将重点从过去 12 个月中 AI 所取得的进步来一窥其发展状况。这份报告汇集了我们看到的可能引发关于 AI 讨论和代表 AI 未来发展方向的最有趣的事实,并将从 AI 研究、人才、行业和政策几个角度展开详述。

本报告目录如下:

研究:研究与技术突破

迁移学习

人工智能硬件

图像场景理解

大规模视频理解数据

文本语义理解

目标导向的强化学习:以游戏为例

AlphaZero 无监督棋谱学习, OpenAI 魔兽争霸

怎样保证模型训练的无偏性

调参的可解释性

对抗攻击

谷歌 AutoML 自动学习

Federated Learning

人才:AI 领域人才供需和分布

行业:目前和未来 AI 驱动的大型平台、资金和应用领域

云计算

健康医疗

政务国防

隐私保护与数据匿名化

卫星数据处理

网络安全

工场自动化

替代蓝领工作

农业

自动驾驶

金融

企业自动化

材料科学

政策:公众对 AI 的意见,经济意义和新生的地缘政治学 (P109)

公众对自动化的态度:两份综述

公众对自动化的态度:皮尤研究中心

公众对自动化的态度:布鲁克林研究中心

美国劳工市场的变化

AI 对劳工市场变化的影响

AI 对就业率和工资的影响

各国的 AI 国家战略:中国,法国,欧盟,加拿大,韩国

中国对半导体器件的强大需求

为什么跟美国比中国的半导体产业规模如此小

预测

未来一年的 8 个预测

总结

第一部分:研究与技术突破

迁移学习

我们通过学习示例来训练机器学习模型解决任务。但是,为解决一个新的任务,需要使用专门的新数据重新进行训练。迁移学习可以让经过训练获得的知识应用于新任务中。

迁移学习能够对人类患者的危险皮肤病变进行自动、最先进的检测。Google InceptionV3 网络首先在 ImageNet 上接受训练,再使用 129,450 张临床图像进行重新训练以检测 2,032 种不同的皮肤病。它可以学习仅基于像素输入和疾病标签对图像进行分类。

结果显示,该模型优于 21 名斯坦福皮肤科专家。

AI硬件新前沿

半导体在促进AI 发展中的角色

半导体(或芯片)是 AI 研究和应用进步的关键驱动因素,这是因为 AI 模型经常需要训练大量数据来学习特定任务(如图像识别)。

GPU 成为 AI 模型训练的得力助手,很大部分原因是其能提供比 CPU 更强大的并行计算能力。这意味着更快的训练速度和迭代。

硬件之战: 更多数量的 GPU 会让训练速度更快,构建规模更大、功能更强大的模型。

AI 硬件对深度学习意义重大

AI 模型性能随着数据规模和模型参数提高,计算量提高。

毫无疑问,GPU 越来越受到开发者的欢迎。

然而,GPU 更擅长处理图像任务,并进一步扩展到高性能的计算和 AI 任务。

训练时虽然广泛使用 GPU,但它却并不擅长推理。

虽然大多数情况下,GPU 性能优于 CPU,但数据中心大量的 CPU 使其成为一个有用且广泛使用的平台。

例如,在 Facebook,GPU 基本上被用于线下训练,而不是实时用户数据处理。

处理器内核时钟频率没有变得更快,摩尔定律产生的能量有限。

GPU 和新型硅片的租金价格太高,意味着计算资源会受限于资金预算。

虽然谷歌的 TPUv2 价格更贵,但是模型训练速度更快,更加经济。

在 Google I/O 2018 上,谷歌发布了第三代 TPU。

在 2018 年 5 月的 GTC 上,英伟达发布了 HGX-2,可同时用于高精度要求的科学计算和低精度要求的 AI 负载任务。

很多企业在开发定制 AI 芯片,包括 IC(集成电路)供应商英特尔、高通、英伟达等,科技巨头和 HPC(高性能计算)供应商谷歌、亚马逊 AWS、三星等,IP 供应商 ARM、新思科技等,中国创业公司寒武纪、地平线机器人等,以及全球的创业公司 Cerebras、Wave Computing 等。

大型云服务商在制造专用 AI 硬件,并大幅提高预算支出。

图像场景理解

传统计算机视觉通过检测物体来描述视觉场景

AI 模型进行物体像素关联(语义分割)或识别展示物体(分类)

然而,检测出图像中的物体还不足以理解真实场景

AI 模型在进行基于目标理解描述视觉场景任务时犯了明显的错误。

真正的视觉场景理解需要理解动作和常识

使用深度学习和标记目标动作的视频来学习常识是一种可行的方法。

大规模视频理解数据

创建训练机器学习模型理解视频的数据集

创建描述感兴趣的动作的视频,例如假装扔下一些东西

如果深度学习模型能够识别和消除视频中行为中的细微差别,那么它具备了关于世界的常识。这也被称为“直观物理学”(intuitive physics)。

文本语义理解

深度学习模型实际上可以理解视频中的动词和名词。

机器还可以通过学习从不同视角理解视觉场景

如果机器学习模型可以正确地预测同一场景的另一全新视角,它就获得了这个场景的内化知识。

目标导向的强化学习:以游戏为例

AlphaZero 表明深度强化学习可以通过学习击败世界围棋冠军

AlphaZero 是一个无人类干预或历史玩家数据输入,通过自我对弈即可预测从一特定棋盘位置走棋输赢概率的 AI 系统。让人震惊的是,AlphaZero 系统超越所有其他版本的 AlphaGo(基于两套神经网络),经过 40 天的训练即超越人类最高水平。

OpenAI 的多代理强化学习系统学习复杂的实时战略游戏《DOTA 2》

OpenAI Five 是由 5 个 RL 代理组成的团队,通过强化学习自我对弈优化游戏策略每个代理的神经网络经过强化学习训练都可观察局部和高维环境来生成长期动作规划。这些强化学习代理可以组团打败人类玩家,它们采取的多样化行动和大范围地图互动十分引人关注。

怎样保证模型训练无偏见

机器学习偏见例 1: 刻板印象

土耳其语中性别是中立的,但是谷歌翻译会在英语 - 土耳其语转换时产生性别区别,反之亦然。

机器学习偏见例 2: 种族歧视

当训练数据中未合理标识皮肤颜色时,计算机视觉系统会做出冒犯性的种族偏见的行为,比如一些人脸识别系统无法识别黑皮肤的人。

调参的可解释性

与所有软件一样,ML 模型也需要调参,但是却很难解释原理

许多 ML,尤其是 DL 模型,很多完全就是“黑盒子”

可解释性可以证明机器学习的推理是“正确”的

在计算机视觉中,模型可以解释一个具体的标签是由哪个像素推导而出(例如,哪个像素是狗)

这样,我们就可以知道模型到底是真的正确学习了还是因为某些错误的原因偶然得出了正确的预测标签。

下一步:用简单易懂的语言解释决策的合理性

结合文本生成基本原理和注意力视觉化可以深入解释决策原理。

对于特定问题和图像, Pointing 和 ustification Explanation (PJ-X) 模型预测答案和多模态的解释都指向决策的视觉证据并提供文本。多模式解释可以生成更好的视觉和文本解释。

对抗攻击

对抗攻击意味着现实世界中将存在严重的安全风险

受到对抗攻击之后,原来可以检测到穿越斑马线行人的计算机视觉系统就再也“看”不到他们了。

当自动驾驶车辆上路之后,这显然会造成巨大的安全隐患。

谷歌的 AutoML 自动学习系统可以找到计算机视觉任务的最佳模型。AutoML 遍历架构搜索空间,找到两个可以集成到一个优于所有现有人造模型的最终模型(NASNet,右图)的新单元设计(正常和缩小,左图)。

分布式 Federated Learning 学习分散数据采集和模型训练

大型技术公司集中了大量的用户数据。社区现在开始通过创建工具来分散数据所有权。OpenMined 这个 AI 模型本身是由模型所有者加密的,因此用户无法窃取。而用户数据则保留在用户本地设备,并可访问更新模型参数。随后,所有者聚合用户参数更改,再统一进行更新。

Federated learning 分散数据获取和模型训练

谷歌使用 Federated learning 训练其移动键盘预测模型 Gboard

第二部分:全球人才供需分布

人才供给: Element AI 预计全球有 22000 名 AI 研究者和工程师拥有博士学位

全球仅有 3000 名可用的 AI 人才劳动力;亚洲市场紧追西方市场;中国同业互查公开发表数量超过美国。

Element AI 预计全球有 5000 名高级 AI 研究者

美国是全球 AI 人才的温床,岗位空缺 10k,是人才交流最集中的地方

人才分布:众所周知,谷歌是最大的 AI 人才雇主

2017 年 ICML 6.3% 的论文的作者来自谷歌 /DeepMind

今年 ICML 论文作者来自谷歌 /DeepMind 的论文数量相比 2017 年翻了一倍

2017 ICML 谷歌贡献的论文最多

在 NIPS 大会上,谷歌&DeepMind 论文作者数量占主导

需求:机器学习工程师薪水持续上涨

据《纽约时报》报道,一般来说,刚出校门的博士生或有若干年工作经验但教育水平低于博士的 AI 专家年薪可以达到 30 万 -50 万美元,或通过持有公司股票可能得到更高的薪水。

“在 DeepMind,员工规模扩大到 400 名,成本达到 1.38 亿美元,每名员工成本约为 34500 美元。”

“OpenAI 2016 年为研究负责人 Ilya Sutskever 支付了 190 万美元的薪酬,为 Ian Goodfellow 支付的薪酬超过 80 万美元。”

据百度前主管 Thomas Liang 估计,AI 行业薪资水平较 2014 年翻了一倍。

两则争议案例:《谷歌自动驾驶负责人薪酬 1.2 亿美元,他却投入 Uber 的怀抱》、《Uber 和 Waymo 以 2.4 亿美元达成和解》

机器学习从业人员多样性:参加 NIPS 会议的女性数量每年小幅增加。

第三部分:行业

关于 AI 的知识产权集中在 GAFAMBAT(谷歌、苹果、Facebook、亚马逊、微软、百度、阿里巴巴、腾讯)这几家巨头公司,它们每年的研发费用达数十亿美元。

云服务巨头正在通过 API 建起各自的城墙

谷歌通过其云生态投入大量资金宣传 ML 服务,亚马逊、谷歌等公司也在做着同样的事情。

谷歌 TensorFlow 在机器学习框架之战中胜出,但是战局变化迅速

这意味着谷歌赢得了开发者的拥护,借此打造了一条云服务通道,让一代开发者和研究人员使用他们的技术并不断改进。他们的开放战略也解决了一些潜在的竞争对手。然而,实践者却感觉到这一领域潜藏巨大的不确定性。选择错误的框架会产生严重的后果,不仅包括重构成本。

医药行业

目前,医药行业的发展进程慢且价格昂贵。

在医疗行业,机器学习可用于开发新药,或者改变现有药物的用途。

在保健行业,机器学习可用于医疗成像、液体活检等。

预计相关公司产品通过临床试验和监管检测之后将会采取更多行动。

政府与国防

民众级监控应用开始在中国兴起

中国政府继续推广使用计算机视觉监控软件。2017 年末,中国共有 1.7 亿台闭路监控器。此监控网络将在 3 年内将增长至 4 亿台。成立 4 年的商汤科技遥遥领先,2018 年 5 月获得 C 轮融资后估值超过 450 亿美元。

在美国,谷歌和 Clarifai 因与五角大楼合作军事项目 Project Maven 遭到抗议,其中谷歌 4500 多名员工联合签署公开信要求谷歌停止该协议。

受剑桥分析公司丑闻事件影响,个人数据隐私问题成为焦点,数据保护和匿名成为人们关心的话题。其中欧盟的 GDPR 已于 2018 年 5 月生效,以保护用户数据隐私。

在数据保护和信息匿名方面,机器学习可以用于:

人工数据合成:训练机器学习模型学习源数据的关键数据特性,并生成合成数据以保留这些特性。

混淆敏感数据:检测敏感数据字段并对其进行匿名处理,同时保留敏感数据重要特征,使机器学习模型仍然可以学习有用的信息。

卫星数据

随着微型卫星的发展,部件成本和发射成本降低,向地传输架构逐渐完善,卫星数据的成本随之降低,分辨率和频率不断提高。

在卫星数据领域,机器学习可用于保险、金融和农业。

网络安全

云计算、移动设备和更多联网供应链意味着网络攻击的风险在增加。但是,网络安全从业人员的缺口却越来越大。机器学习能够以灵活的方式从过去的攻击中学习,并自动进行处理,节约时间。

在网络安全领域,机器学习可用于网络和终端安全、内部威胁检测。

库房自动化

电商的发展对库房分拣提出了更高的要求,劳动力和库房空间的稀缺也促使电商采用更多的机器人。零售商在亚马逊收购 kiva 以及对该领域的投资之后做出了反应。

在库房自动化领域,机器学习应用包括机器人、库房管理系统等。

蓝领手工操作

计算机视觉部件成本降低,技术提高,这意味着机器人的价格将会比各种蓝领工人的手工操作成本更低。

机器学习可用于房屋建造、清洁、安保等。

农业:室内和室外农场

2050 年,全球人口将从 76 亿增长值 96 亿,粮食产量需要提高 70% 才能满足需求。农场和温室里配备机器人、控制系统、联网设备成为解决粮食问题的新途径。

机器学习可用于温室控制系统、立体农场、农作物和动物健康监测、农作物收割等。

自动化

在自动化领域,机器学习可用于共享自动驾驶车辆、最后一公里物流自动化、仿真环境、街道地图和软件开发自动化等。

金融

在金融领域,机器学习可用于资产管理、信用贷款、预防诈骗。企业自动化。

机器学习可用于机器人处理自动化、文件数字化、软件开发自动化。

材料科学

在材料科学领域,机器学习与医药行业的应用相似,可用于学习材料科学发现的规律。

第四部分:政策

公众对自动化的态度调研

根据两家美国大型调研机构调查结果显示:

皮尤研究中心

民众越来越意识到自动化对工作的影响,18% 的美国人表示他们知道有人因为自动化失业,薪资或工作时长减少。

年轻人、兼职、西班牙人和美国低收入人群反映受到影响最大

自动化将引起不公正的担忧越来越大

对 AI 的乐观程度

大部分人认为 AI 会改善生活

但 AI 也会牺牲隐私

并且 AI 会消灭一些工作岗位

大部分人认为 AI 是对人类的威胁

应该由政府监管

虽然美国目前仍然是 AI 领头羊

但中国在 AI 领域将在十年内赶超美国

那么,美国的劳动力市场实际上有什么变化呢?调查发现这些变化主要体现在以下几个方面;

美国自动化程度虽然提高,但失业率却达 17 年来最低

常规工作发展停滞

工资水平提高落后于工作岗位增长

劳动产量与每小时报酬不成正比

劳动力所得份额稳步下降

工人收入变动幅度加大

但是,自动化在导致美国劳动力市场现状中起到多大的作用不得而知,关于机器学习对劳动力市场的影响也出现了两极分化的观点:其中一种观点认为无需担心,历史上科技进步总会创造更多的工作,这次也不例外;另一种观点则是忧心忡忡,认为这次革命与以往不同,人类将会创造更多智能,减少薪酬较高的工作,新增的工作岗位数量将少于消失的工作。

AI 国家主义

随着 AI 领域竞争的加强,中国、法国、英国、美国、欧盟等相继制定了国家层面的 AI 发展战略,AI 国家主义倾向越来越明显。

目前,除了在数据获取方面,美国在其他方面均领先于中国。

美国越来越多地通过 CFIUS(美国外国投资委员会)来阻止企业收购美国公司。

原因:虽然中国半导体行业规模比不上美国,但中国半导体年进口额已达 2600 亿美元,并且在不断收购半导体公司。

第五部分:预测

未来 12 个月的 8 个预测:

位于中国的实验室取得重大研究突破。

DeepMind 成功应用 RL 学习在《星际争霸》游戏中取得突破性成果。

深度学习继续仍然是讨论的焦点,重大替代方法不会出现。

使用机器学习发现的第一种治疗药物在试验中产生积极的结果。

总部位于中国和美国的公司收购欧洲机器学习公司的总额超过 50 亿美元。

经合组织国家政府阻止总部位于美国或中国的技术公司收购一家领先的机器学习公司(估值> 1 亿美元)。

争抢***和韩国半导体公司明显成为中美贸易战的一部分

一家大型研究机构因地缘政治原因未公开重大研究成果,因而“走向黑暗”

第六部分:总结

本报告力图将过去一年内机器学习领域所有值得注意的进步做出汇总,我们相信,AI 将成为未来科技发展的强力催化剂,更多地了解该领域的变化可以帮助我们更好地适应未来的变化。感谢大家的阅读!

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分