文 / Jeff Dean,高级研究员,Google AI 团队负责人
2018 年对 Google 的研究团队来说是令人兴奋的一年,我们在很多方面推动了技术的发展,包括基础计算机科学研究成果和出版物。我们的研究成果应用于 Google 新兴领域(如医疗保健和机器人技术),加上我们对开源软件的贡献以及与 Google 产品团队的紧密合作,都旨在提供有用的工具和服务。下面,我们着重介绍我们在 2018 年的一些努力,以及我们对未来的展望。如需更全面的了解,请参阅 2018 年出版物 (https://ai.google/research/pubs/?year=2018)
道德原则与 AI
近几年,我们可以看到 AI 的重大进展以及对我们的产品和亿万用户的日常生活的积极影响。对于身在其中的我们,希望 AI 是造福世界的力量,它的应用应该合乎道德原则,也应该对社会有益。2018年,我们发布了《Google AI 原则》( Google AI Principles ),提出一系列负责任的 AI 实践,并概述了实施的技术建议。总之,它们为我们评估自己的 AI 发展提供了一个框架,我们希望其他组织也可以使用这些原则来帮助塑造自己的思维。值得注意的是,由于这一领域的发展非常迅速,一些原则的最佳实践,如 “ 避免制造或加强不公平的偏见 ” 或 “ 对人类负责 ”,也在不断变化和改进。这些研究反过来会促进我们产品进步,使其具备更多的包容性和更少的偏见,例如我们在 Google 翻译中减少性别偏见 的工作,并允许探索和发布更具包容性的图像数据集和模型,使计算机视觉能够适应全球文化的多样性。
此外,这些工作使我们能够基于 机器学习速成课程 与更广泛的研究团体分享最佳实践(https://developers.google.com/machine-learning/crash-course/)。AI 让社会更美好
AI 对于许多社会领域的影响的潜力非常明显。
洪水预测 就是 AI 帮助解决现实世界的问题的实例。通过与 Google 多个部门的合作,这项研究旨在准确并及时地提供关于洪水可能范围以及细粒度信息,使那些在洪水易发地区的人们能够尽可能地保护他们生命和财产。
另一示例是我们在 地震余震预测 方面的工作,它展示了机器学习模型可以比传统的基于物理的模型更准确地预测余震的位置。更重要的是,由于机器学习模型的设计是可解释的,科学家们对于余震的行为已经有了新的发现,不仅能够得到更准确的预测,而且对余震的理解也达到了更高的水平。
我们还看到大量的外部研究者,与 Google 的研究人员和工程师合作,使用 TensorFlow 等开源软件解决广泛的科学和社会问题,例如 使用卷积神经网络识别座头鲸,检测新的系外行星,识别病变的木薯植物等等。
为了促进这一领域的创意活动,我们与 Google.org 合作成立了 Google AI for Social Impact Challenge,个人和组织可以从总计 2,500 万美元的资金中获得资助,以及 Google 研究科学家的指导和建议。
辅助技术
我们的许多研究,都集中在使用机器学习和计算机科学来帮助我们的用户更快速有效地完成任务。我们通常与不同的产品团队协作,并将研究成果应用于不同的产品特性和设置中。示例之一就是 Google Duplex,一个需要自然语言研究和对话理解、语音识别、文本到语音、用户理解和有效的UI设计的系统。这些系统能够让用户可以说 “Can you book me a haircut at 4 PM today? ”,虚拟代理将通过电话代表您进行交互,以处理必要的细节。
其他的示例如 Gmail 的 Smart Compose 工具,使用预测模型来提供邮件撰写的建议,从而使电子邮件撰写过程更快更容易;以及 Sound Search,一种基于正在播放功能的技术,能够让用户快速、准确地搜索到正在播放的歌曲。另外,Android 中的 Smart Linkify 展示了我们如何利用设备上的机器学习模型,通过理解您选择的文本类型使手机屏幕上显示的各种文本更有用(例如,知道某些内容是地址,从而给我们提供地图等链接的快捷方式)。
我们研究的一个重点是帮助像 Google 智能助理这样的产品 可以支持更多语言,并且可以 更好地理解语义相似性,即使使用了非常不同的表达方式代表相同的概念或想法。
量子计算
量子计算,这是一种新兴的计算范式,我们可以利用量子计算来解决经典计算机无法解决的挑战性问题。近几年里,我们一直积极致力于这一领域的研究,该领域正在展示至少一个问题上的尖端能力 ( 所谓的量子霸权 ),这将是该领域的一个重大里程碑。
在 2018 年,我们取得了很多令人兴奋的新成果,例如开发了一种新的 72-qubi 的量子计算设备:Bristlecone,该设备扩大了量子计算机可解决问题的范围。
研究科学家 Marissa Giustina 在 Santa Barbara 的量子 AI 实验室安装 Bristlecone 芯片
同时我们发布了 面向量子计算机的开源编程框架 Cirq,并探索了如何将量子计算机应用于神经网络。最后,我们把在理解量子处理器性能波动方面的经验和技术以及关于量子计算机作为神经网络的计算基础的想法分享给了大家。
2019 年,我们期待在量子计算领域取得更大的成果!
自然语言理解
非常开心,Google 的自然语言研究在 2018 年取得了令人振奋的成果,其中包含了基础研究和以产品为中心的合作。我们改进了在 2017 年提出的 Transformer 架构,并研发了一个新的并行版本模型,称为 通用变换器,该版本在翻译和语言推理等自然语言任务中表现出了强大的优势。
同时,我们还发布了 BERT,这是第一个深度双向、无监督的语言表示模型。BERT 在 11 个自然语言任务上与之前的最先进的结果对比,有了明显的改进。现在,只利用纯文本语料库就可以进行预训练,然后可以使用迁移学习对各种自然语言任务进行微调。
在挑战性很强的 GLUE 基准测试中,BERT 将最优结果提高了 7.6%
除了与各种研究团队合作以实现 Smart Compose 和 Duplex(之前讨论过)之外,我们还努力使 Google 智能助理能够 更好地处理多语言用例,目标是使其能自然地与所有用户进行交流。
感知研究
感知研究一直在为图像捕获、压缩、处理、创造性表达和增强现实提供更强大的工具,并且解决了计算机理解图像、声音、音乐和视频这一难题。
在过去的这一年里年,我们的技术优化了 Google Photos 中用户最关心的内容组织的能力,例如人和宠物。
Google Lens 帮你了解周围的世界
让用户通过 Google Lens 和 Google Assistant 来了解自然世界,实时回答问题的同时,还能在 Google 图像中使用 Google Lens 做更多事情。Google AI 使命的一个关键方面是让其他人能够从我们的技术中受益,今年我们在改进 Google API 的功能和构建模块方面取得了很大的进展。示例中包括利用 ML Kit 在 Cloud ML API 和面部相关设备构建块中实现视觉和视频的改进以及一些新功能。
2018 年,我们对学术研究的贡献包括基于 3D 场景理解的深度学习技术,例如 stereo magnification。并且我们正在推进能更好地理解图像和视频的研究,使用户能够在 Google 产品中查找,组织,增强和改进图像和视频,例如照片,YouTube,搜索等。
多模态感知成为一个越来越重要的研究课题。我们在音频领域提出了一种无监督学习方法并应用于语义音频表示,其中对包含表达性的类人语音合成有明显改进。
我们用 Looking to Listen 将输入视频中的视觉和听觉线索结合起来,用来隔离和加强视频中所需的扬声器声音。该技术可以支持一系列应用,从语音增强和视频识别,视频会议到改进的助听器,尤其是在多人讲话的情况下。
在有限的计算平台上实现感知变得日益重要。我们发布了 MobileNetV2,它将为下一代移动视觉应用提供支持。我们的 MobileNets 广泛应用于学术界和工业界。MorphNet 为学习深层网络结构提供一种有效的学习方法。在计算资源限制的情况下,在图像和音频模型上实现全面的性能改进。最近的研究也表明,有关自动生成移动网络架构,并获得更高的性能是可能的。
计算摄影
在过去几年中,质量和多功能性的改进一直是手机相机备受关注的方面。原因之一是手机中使用的物理传感器的改进,但最主要的原因是计算摄影这一科学领域的进步。我们发布了最新研究技术,并通过与 Google Android 团队和消费硬件团队的紧密合作,将这项研究实施在最新的 Pixel 和 Android 手机及其他设备。
2014 年,我们发布了 HDR+ 技术,利用该技术,摄像机捕捉到一组帧,并在软件中对齐这些帧,最终将它们与计算软件合并在一起。最初 HDR+ 的工作是为了使图片具有比单次曝光更高的动态范围。通过捕获大量的帧,然后对这些帧进行计算分析逐渐演变成一种通用的方法,并且在 2018 年使相机中的许多进步得以实现。例如,在 Pixel 2 中开发 Motion Photos,并在 Motion Stills 中实现增强现实模式。
Pixel 2 拍摄的运动照片
Motion Stills 的 AR 模式
2018 年,创造了一种名为 Night Sight 的新功能,是我们在计算摄影研究方面的主要工作成果之一。让 Pixel 手机摄像头能够 “在黑暗中看到”,赢得了媒体和用户的赞誉。
左:iPhone XS ( 全分辨率 ) 右:Pixel 3 的夜视能力 ( 全分辨率 )
算法和理论
算法触及了我们所有的产品,从 Google trips 背后的路径 ( routing ) 算法到 Google cloud 的一致性哈希 ( consistent hashing ) ,它是 Google 系统的支柱。
2018 年,我们在算法和理论方面进行研究,其中包含了从理论基础到应用算法,从图挖掘到隐私保护计算的广泛领域。在优化方面的工作,涉及从机器学习的持续优化到分布式组合优化的各个领域。我们研究的用于训练神经网络的随机优化算法的收敛性的工作 ( 获得了 ICLR 2018 最佳论文 ),展示了流行的基于梯度的优化方法 ( 如 ADAM 的一些变体 ) 存在的问题,为新的基于梯度的优化方法提供了坚实的基础。
ADAM 和 AMSGRAD 在一个简单的一维凸问题上的性能比较
在分布式优化中,我们致力于改善组合优化问题中的循环和通信复杂性,例如通过循环压缩 ( round compression ) 和核心集 ( core-sets ) 解决图论中的匹配问题,以及亚模最大化 ( submodular maximization ) 和 k 核分解 ( k-core decomposition )。在偏应用的方面,我们在用 sketching 解大规模集合覆盖,以及在有万亿条边的图中做平衡分割 ( balanced partitioning ) 和层级聚类 ( hierarchical clustering ) 等问题上提出了新的算法技巧。我们关于在线配送服务的工作获得了 WWW'18 的最佳论文提名。最后,我们的开源优化 OR-tools 平台在 2018 年 Minizinc 约束编程 ( constraint programming ) 竞赛中获得了 4 枚金牌。
在算法选择论中,我们提出了新的模型并研究了重建和学习混合多项对数成败比 ( mixture of multinomial logits )。我们还研究了可通过神经网络学习的函数类,以及如何使用机器学得谕示 ( machine-learned oracles ) 来改进经典的在线算法。
了解具有强大隐私保障的机器学习技巧对我们 Google 非常重要。在这种背景下,我们开发了两种新的方法来分析如何通过迭代和改组 ( shuffling ) 来增强差分隐私 ( differential privacy )。我们还应用了差分隐私的技巧设计对博弈鲁棒的激励察觉学习 ( incentive-aware learning ) 方法。这种学习技术在在线市场设计中具有应用。我们在市场算法 ( market algorithm ) 领域的新研究还包括帮助广告客户测试广告竞价的激励兼容性 ( incentive compatibility ) 以及优化应用内的广告刷新。我们还推动了重复拍卖 ( repeated auction ) 下最先进的动态机制 ( dynamic mechanism ) 的边界,并提出了对缺少未来预期、预测含噪、以及异质买方行为鲁棒的动态拍卖机制 ( dynamic auction ),并将我们的结果扩展到动态双向拍卖 ( dynamic double auction )。最后,在在线优化和在线学习的背景下,我们提出了新的针对含有流量高峰的随机输入的在线分配算法,以及新的对腐败数据 ( corrupted data ) 鲁棒的 bandit 算法。
软件系统
Google 在软件系统方面的大部分研究依然与构建机器学习模型有关,尤其是与 TensorFlow 有关。例如,我们发表的 TensorFlow 1.0 动态控制流的设计和实现。
在一些新研究中,我们使用了一个称为 Mesh TensorFlow 的系统,让使用模型并行性来指定大规模分布式计算变得更加简单。例如,我们使用 TensorFlow 发布了 TF-Ranking 库,这是一个专为 Learning-to-Rank 打造的可扩展的 TensorFlow 库。
TF - Ranking 库
我们发布了一个加速器支持的 NumPy 变体 - JAX,它支持自动将 Python 函数区分为任意顺序。尽管 JAX 不是 TensorFlow 的一部分,但它利用了一些相同的底层软件基础架构 ( 例如 XLA ),并且它的一些思想和算法可以为 TensorFlow 项目提供帮助。最后,我们继续研究机器学习的安全性和隐私性,如 CleverHans 和 TensorFlow Privacy。
对我们来说,将机器学习应用于软件系统也是一个非常重要的研究方向。例如,我们继续利用分层模型将计算部署到设备上,并有助于学习内存访问模式。探索如何利用学习的索引来替代数据库系统和存储系统中的传统索引结构。正如我们 2018 年写的那样,我们认为在计算机系统中使用机器学习方面仍然还是停留在表面问题上,有待进一步探索。
在一个 NMT 模型 ( 4 层 ) 中 Hierarchical Planner 的放置
2018 年,感谢 Google Project Zero 团队与外部的合作,我们了解到 Spectre 和 Meltdown,是现代计算机处理器中严重安全漏洞的新类别。这些漏洞将使计算机架构研究人员相当忙碌。在我们继续努力模拟 CPU 行为时,我们的编译器研究团队将测量机器指令延迟和端口压力的工具集成到 LLVM 中,从而可以做出更好的编译决策。
我们的云产品和机器学习模型推理主要取决于为计算,存储和网络提供大规模、可靠、高效的技术基础架构的能力。过去一年的一些研究亮点包括 Google 软件定义网络 WAN 的发展,这是一个独立的联合查询处理平台,可以在许多存储系统中对基于不同文件格式存储的数据执行 SQL 查询(BigTable,Spanner, Google Spreadsheets 等)以及我们广泛使用代码审查的报告,调查 Google 代码审查背后的动机,当前实践以及开发人员的满意度和挑战。
运行内容托管等大型 Web 服务需要在动态环境中实现稳定的负载均衡。我们开发了一致性哈希方案,对每台服务器的最大负载提供了紧的可证明保证,并将其部署到 Google Cloud Pub / Sub 中。基于我们早期版本的论文,Vimeo 的工程师在 haproxy 中实现此功能并开源,并将其用于 Vimeo 的负载均衡项目。结果是戏剧性的:应用这些算法思想帮助他们将缓存带宽减少了近 8 倍,消除了扩大应用规模的瓶颈。
AutoML
AutoML,也可以称为元学习(meta-learning),是利用机器学习来部分自动化机器学习的方法。多年来,我们一直致力于在这个领域进行研究,接下来,我们要长期做的是开发一种学习系统,该系统可以利用先前已经解决的其他问题得出的见解和能力,来学习并解决新的问题。
我们对进化算法的使用也非常感兴趣。在这个领域,我们开展的早期工作主要是使用强化学习。例如,2018 年我们展示了如何使用进化算法自动发现最先进的神经网络架构并用于各种视觉任务。
关于强化学习如何应用于神经网络架构搜索之外的其他问题,我们的探讨结果如下:
它可以自动生成图像变换序列,以提高各种图像模型的准确性
寻找新的符号优化表达式,比常用的优化更新规则更有效
我们在 AdaNet 上的工作展示了如何使用具有学习能力的快速灵活的 AutoML 算法。
AdaNet 自适应地生成神经网络的集合。
在每次迭代中,它都度量每个候选者的集成损失,并选择最佳的一个进行下一次迭代
我们的另一个重点是自动发现计算效率高的神经网络架构,以便它们可以在诸如移动电话或自动驾驶车辆等环境中运行,这些环境对计算资源或推理时间有严格的限制。我们发现,在强化学习架构搜索的奖励函数中将模型的准确性与其推理计算时间相结合,可以找到高度准确的模型,同时满足特定的性能约束。我们还探索了使用机器学习来自动压缩机器学习模型以获得更少的参数并使用更少的计算资源。
TPU
Tensor Processing Units ( TPU ) 是 Google 开发的机器学习硬件加速器,一直以来它为支持大规模的训练和推理提供帮助,并且帮助 Google 在许多方面实现了突破性进展,例如前面讨论过的 BERT,它们还允许世界各地的研究人员能够基于开放源码在 Google 的研究基础上进行构建,并追求自己的新突破。例如,所有人都可以通过 Colab 在 TPU 上免费调优 BERT, TensorFlow Research Cloud 让成千上万的研究人员获益。我们还将 TPU 硬件作为云 TPU 商用。除了在机器学习研究中实现更快的进步之外,TPU 还推动了 Google 的核心产品的重大改进,包括搜索,YouTube,Gmail,Google 智能助理,Google 翻译等等。我们期待,无论是 Google 内部或着其他地方的机器学习团队,通过 TPU 实现前所未有的计算规模。
单个 TPU v3 设备 ( 左 ) 和 TPU v3 Pod 的一部分 ( 右 )
开源软件和数据集
Google 为研究和软件工程社区做出贡献的两种主要方式:发布开源软件和创建新的公共数据集。在这个领域,我们最大的努力之一是 TensorFlow!
TensorFlow 发布于 2015 年 11 月。至今,已经成长为一个非常流行的机器学习计算系统。我们在 2018 年庆祝了 TensorFlow 的 3 岁生日。在此期间,TensorFlow 已经拥有超过 3,000 万 次的下载量,超过 1,700 个 贡献者,总共增加了 4.5 万 次提交。
2018 年,TensorFlow 发布了 8 个主要版本,并增加了一些主要功能,如 eager execution。TensorFlow 生态系统在 2018 年也有了大幅增长,例如 TensorFlow Lite、TensorFlow.js 和 TensorFlow Probability 的相继推出。
我们很高兴 TensorFlow 拥有大量的 Github 用户,成为顶级机器学习和深度学习框架。TensorFlow 团队还致力于更迅速地解决 Github 问题,并为外部贡献者提供顺畅的途径。根据 Google Scholar 的数据,在研究中,我们继续在已发表的论文基础上为世界上大部分的机器学习和深度学习研究提供支持。仅推出一年,全球超过 15 亿的设备支持 TensorFlow Lite。此外,TensorFlow.js 是 JavaScript 的头号机器框架; 在推出后的九个月里,它在 Github 上有超过 200 万的内容分发网络(CDN)点击量,25 万下载量和超过 1 万颗星。
除了继续开发现有的开源生态系统之外,我们在 2018 年引入了 一个新的框架,用于灵活和可重复的强化学习,用于快速理解数据集的特征的新可视化工具 ( 无需编写任何代码 ),一个使用 TensorFlow.js 在浏览器中进行实时 t-SNE 可视化的库,以及用于处理电子医疗数据的 FHIR 工具和软件等。
完整 MNIST 数据集的 tSNE 嵌入的实时演变,该数据集包含 6万个手写数字的图像
公共数据集通常是一个很好的灵感来源,可以在许多领域取得巨大进步,因为它们可以让更广泛的社区获得有趣的数据和问题,以及在各种任务中获得更好的结果。今年,我们很高兴发布 Google 数据集搜索,这是一种从所有网络中查找公共数据集的新工具。多年来,我们还策划并发布了许多新的,新颖的数据集,包括从数百万个通用注释图像或视频到用于语音识别的人群源孟加拉数据集到机器人手臂抓取数据集等等。在 2018 年,我们在该列表中添加了更多数据集。
Open Images V4,这是一个包含 1,540 万个边界框的数据集,包含 600 个类别的 190 万张图像,以及 19,794 个类别的 3,010 万个经过人工检查的图像级标签。我们还通过使用 crowdsource.google.com 添加了来自世界各地的数万名用户提供的 5.5M 生成的注释,扩展了此数据集以添加来自世界各地的更多人和场景。我们发布了原子视觉动作(AVA)数据集,该数据集提供视频的视听注释,以改善理解人类行为和视频语音的现状。我们也宣布更新 YouTube-8M,以及第二届 YouTube-8M 大型视频理解挑战和研讨会。虽然不是数据集发布,但我们探索了一些技术,这些技术可以使用 Fluid Annotation 更快地创建可视化数据集,Fluid Annotation 是一种探索性的机器学习驱动接口,可以更快地进行图像注释。
COCO 数据集图像上的 Fluid Annotation 界面
机器人技术
过去的一年里,Google 在理解机器学习如何教会机器人在现实世界里行动方面,取得了重大进展,该项研究 让机器人学习抓取未没见过的物体,并且相关的论文获得了 CoRL’18 最佳论文。通过结合机器学习和基于采样的方法 ( ICRA'18 最佳论文 ),我们在学习机器人运动方面取得了进展,例如实现了第一次能够在真实机器人上成功地在线训练深度强化学习模型,并且正在寻找新的,理论上的基础方法,来学习机器人控制的稳定方法。
AI 在其他领域的应用
2018 年,在科学领域中,我们将机器学习应用于解决物理和生物科学中的各种问题。利用机器学习为科学家提供相当于数百或数千名研究助理的数据挖掘,不仅为科学家节省了时间和精力,还让他们变得更具有创造力和生产力。
我们与德国马克斯普朗克神经生物学研究所的研究人员合作在 Nature Methods 中发表了一篇关于神经细胞高精度自动重建的论文,展示了一种新型的递归神经网络如何提高自动解析连接组数据的准确性。与先前的深度学习技术相比,将连通组学数据提高了一个数量级。
我们的算法在鸣禽大脑中追踪单个神经突的 3D 过程
将机器学习应用于科学领域的其他示例:
通过数据挖掘恒星的光曲线,并寻找新的太阳系外行星
短 DNA 序列的起源或功能
自动检测离焦显微镜图像
自动将质谱输出映射到肽链
经过预训练的 TensorFlow 模型可以对 Fiji ( ImageJ ) 细胞显微镜图像斑块的蒙太奇进行聚焦质量评估
医疗领域的 AI
在近几年里,我们一直致力于 将机器学习应用于医疗领域。这项研究将会影响我们每一个人,同时我们也坚信利用机器学习增强医疗专业人员的直觉和经验可以产生巨大影响。
在这个领域,我们通常采用与医疗机构合作解决基础研究问题的方式 ( 例如,利用临床专家的反馈让我们的结果更加可靠 ),然后将结果发表在科学和临床杂志上。当该研究得到临床和科学验证时,我们便会进行用户和 HCI 研究,以便于我们掌握如何在现实临床环境中进行部署。在 2018 年,我们已经将计算机辅助诊断的广泛空间扩展到了临床任务预测。
2016 年底,我们发表过一项研究表明,述及我们如何训练的用于评估视网膜眼底图像以 检测糖尿病视网膜病变 迹象的模型,其表现与美国医学委员会认证的眼科医生相当,甚至略胜一筹。
2018 年,我们进一步证明,利用由视网膜专家标记的图像进行训练,模型的表现已经相当于视网膜专家的水平。我们还发现有证据表明,医生可以与模型协同工作,获得比二者单独工作时更高的准确度。借助筛查项目和与 Verily 的合作,在印度的 Aravind 眼科医院和泰国卫生部下属的 Rajavithi 医院等 10 多个地方部署了这个糖尿病视网膜病变检测系统。
机器学习评估糖尿病视网膜病变
我们还发表了一项关于机器学习模型通过视网膜图像评估心血管风险的研究,这项研究得到了医学专家和眼科专家的认可和称赞。这是一种为新的、非侵入性的生物标志物提供了早期有希望的迹象,并且帮助临床医生更好地了解患者的健康状况。
我们在病理学领域的探索中展示了使用机器学习 提高前列腺癌分级的准确度、利用深度学习 检测转移性乳腺癌,还开发了一个 增强现实显微镜,通过来自计算机视觉模型的视觉信息帮助病理学家和其他科学家。
近四年中,Googel 进行了大量的研究工作,围绕使用电子健康记录的深度学习来做出临床相关的预测。2018 年,我们与芝加哥大学、加州大学旧金山分校和斯坦福大学合作,在 Nature Digital Medicine 上发表了一篇论文,展示了将机器学习模型应用于识别电子病历,并且能够对各种临床相关任务做出比当前临床最佳实践准确性更高的预测。作为这项工作的一部分,我们开发了一些工具,让即使在完全不同的任务和完全不同的基础 EHR 数据集上创建这些模型变得非常简单。同时还改进了基于深度学习的变量调用 DeepVariant 的准确性、速度和实用性。该团队在《自然 - 生物技术》杂志上发表了一篇同行评议的论文。
将机器学习应用于历史收集的数据时,了解过去经历过人类和结构偏差的人群以及这些偏见如何在数据中编纂是很重要的。机器学习提供了一个检测和解决偏见的机会。
研究推广
Google 经常用不同的方式和外部研究社区进行交流,比如教师参与和学生支持。我们非常高兴的在本学年招收了数百名本科生、硕士生和博士生作为实习生,同时为北美、欧洲和中东的学生提供多年的博士生奖研金 ( Ph.D. fellowships )。
关于这个奖学金项目,我们还要补充的是 Google AI Residency 项目,这种方式允许想要深入学习研究的人花费一年的时间与Google的研究人员一起工作并接受他们的指导。至今,Google AI Residency 已进入第三个年头,学员们被安排在 Google 全球的各个团队中,从事机器学习、感知、算法和优化、语言理解、医疗保健等领域的研究。
每年,我们通过 Google Faculty Research Awards program 支持一些教师和学生进行研究项目。2018 年,我们还继续在 Google 为特定领域的教师和研究生举办研讨会,包括在印度班加罗尔办事处举办的 AI / 机器学习 研究与实践研讨会,在我们的苏黎世办事处举办的算法和优化研讨会,在美国桑尼维尔举办的机器学习医疗保健应用研讨会和在马萨诸塞州剑桥办事处举办的机器学习公平与偏见研讨会。
我们相信,为更广泛的研究团体做出公开贡献是支持健康和富有成效的研究生态系统的关键部分。除了开源和公开数据集之外,我们的许多研究都在顶级会议和期刊上公开发表,并积极参与、组织和赞助各种不同学科的会议。
新的起点,新的面孔
2018 年,我们很高兴地欢迎许多来自各行各业的新人加入我们的研究组织。我们在非洲组建了 AI 研究办公室。我们扩大了在巴黎、东京和阿姆斯特丹的 AI 研究,并在普林斯顿开设了一个研究实验室。我们将继续在全球范围内聘请有才能的人加入我们。您可以了解更多有关加入我们的信息(https://ai.google/research/join-us/)。
期待 2019 年
本文摘要总结了我们 2018 年的科研的一小部分。回顾 2018 年,我们对所取得成就的深度和广度感到兴奋。
2019 年,我们期待 Google 的研究和产品,能对更广泛的领域产生更有意义的影响!
全部0条评论
快来发表一下你的评论吧 !