SiATL——最新、最简易的迁移学习方法

电子工程师 2019-03-12 4136

电子说

1.4w人已加入

描述

EHR（电子健康记录）数据中的持续AKI（急性肾损伤）预测，全新、简单的迁移学习，提高了图像到图像的翻译，增强视频中主体和行为分割，基于模型的强化学习应用于Atari游戏，几何感知的深度LiDAR测距，基于属性的行人重识别，等等。

新模型可以不断预测EHR数据中住院病人的AKI

一组来自美国的研究人员最近提出了一个模型，可以根据住院患者的EHR数据持续自动预测AKI。AKI是指住院患者在几天内肾功能突然丧失，可导致极为严重的医疗并发症，因此需要立即治疗。好消息是，如果被发现的及时，AKI是可以被预防的。更好的消息是，如果被快速诊断并治疗，AKI或许是可痊愈的。

由于AKI的成功治疗依赖于快速诊断，因此它是预测分析的完美候选。几个机器学习预测模型已经被建立，用于通过EHR数据预知住院病人AKI的情况。但是现有的模型只能在固定的时间范围内预测住院病人AKI，这个时间范围可以是病人入院后24小时、48小时或更长时间。这是一个挑战，因为病人情况在几个小时内就可以显著变化，这使得很多的AKI情况变得难以预测。

模型为住院病人持续预测AKI

在上述挑战的激励下，研究人员开发了一种新的模型，可以在患者住院期间出现AKI之前不断预测AKI。新的模型方法可以在病人的数据每次发生变化时预测AKI，而不需要“等待”特定的时间来做出预测。这个模型被设计成使用EHR数据自动工作，在需要时可以触发警报，因此不需要持续监控。测试结果显示，对比之前的传统预测模型，该模型具有较高的预测精度和实时性。

强化学习

潜在应用与效果

这是医疗诊断里令人印象深刻的研究！由于能够进行连续的AKI预测，新模型可以应用于回避过去的预测模型所面临的诸多缺点，将住院患者从直接肾衰竭引起的众多痛苦中拯救出来，并从根本上降低之后的医疗成本。另外，该框架具有广谱性，也可用于从EHR数据持续预测其他疾和障碍。

原文：

https://arxiv.org/abs/1902.10228v1

SiATL——最新、最简易的迁移学习方法

许多传统的迁移学习方法都是利用预先训练好的语言模型（LMs）来实现的，这些模型已经非常流行，并且具有翻译上下文信息的能力、高级建模语法和语义语言特性，能够在对象识别、机器翻译、文本分类等许多任务中生成高质量的结果。

然而，现有的LMs也面临着一些缺点，包括计算成本高和对特定任务架构的需求。另外，很多模型需要对手头任务进行预训练和参数调整。然而，现在情况不同了，因为研究人员最近发布了一种新的单步迁移学习方法，不需要预训练或参数调整。此外，新方法在所有任务中都优于包括ULMFiT在内的最先进的转移学习方法。

单步辅助损失迁移学习（SiATL）

SiATL是一种简单而有效的迁移学习方法，它解决了灾难性遗忘的问题。SiATL结合了一个特定任务的函数和一个在训练过程中进行调整的、基于预训练的LM的辅助LM损失，并将其权重重新分配给分类器。这项改变使得它能够保存由语言模型捕获的语言规则，同时为解决任务提供足够的适应性。

强化学习

正如在介绍中提到的，SiATL并不要求预训练或参数调整，因此要使用起来真的非常便捷。该模型已经在大量有挑战性的文本分类任务中进行测试，并且产生了相当有竞争力的结果，表现出其优于寻常迁移学习方法的能力。

潜在应用与效果

正如你已经知道的，模型训练不必从零开始。SiATL能够利用为一个任务训练的模型，并以一种相对直接的方式将其应用到另一个领域。在数据不充分的情况下，它也可以派上用场。

对数据科学家和开发人员来说，SiATL提供了一种简单、廉价和实用的方法来加速模型训练，并具有迁移学习能力，从而为各种应用程序（如语音识别、智能视频分析、问题回答系统、医学成像等）提供了更高的性能。

原文：

https://arxiv.org/abs/1902.10547v1

用一个简单的查询分割视频的主体和行为

受CV和NLP对对象检索、对象跟踪、人员搜索等领域的最新进展启发，研究人员新提出了一种算法，能够将视频中的参与者及其动作从自然语言查询输入中分割出来。现存的模型主要是通过主体或成对动作的固定词汇表来学习分割的，而新方法则是从自然语言输入的查询来推断出分割的。不论你的输入是一只飞翔的鸟或者跳跃的人，这一新模型都能结合视频和语言信息来进行高层次的像素级分割。

通过一个句子分割视频中主体和行为

提出的全卷积模型实现了一种针对视频进行优化的编解码器体系结构，主要组件包括文本编码器、视频编码器和解码器。新模型不是在图像分割中，而是在视频分割中对参与者及其行为进行优化，使其能够同时利用流和RGB。

强化学习

研究人员扩展了A2D和J-HMDB标准数据集，其中包含7000多个描述视频内容中出现的角色和动作的文本语句，以展示新模型的潜在能力。结果表明，句子引导的像素级性能明显优于最先进的算法。

潜在效果与效应

实验证明了模型的实用性和鲁棒性，这一成果能够帮助研究人员和实践者理解视频中分割成对的主体和行为。该模型具有泛化特征，是实现在视觉信号处理、高级视频分析与处理、医学成像、三维结构等方面更高效应用的重要资源工具。

原文：

https://arxiv.org/abs/1803.07485v1

针对Atari游戏的基于模型的强化学习

当涉及到学习执行复杂任务的有效策略时（例如玩Atari游戏）无模型的强化学习很合适。然而，虽然人类玩家可以在几分钟内学会如何玩Atari游戏，但为机器开发基于模型的RL模型是复杂的，因为它需要无数的交互和大量的训练时间。

虽然这些方法的复杂性在近年来有了很大的降低，但与人类玩家学习Atari游戏所需的经验相比，它的复杂性仍然要高得多。有一些基于模型的RL成功案例，比如TD-gammon。但是，后来的大多数尝试，包括国际象棋和围棋，都没有这么成功。

针对Atari的模拟策略强化学习（SimPLe）

研究人员专注于探索学习视频模型如何在Atari学习环境（ALE）基准中实现学习，预算限制在10万步（大约2小时游戏时间）。

他们提出了一个完整的基于模型的深度RL算法SimPLe，它在基于模型的强化学习中超越了最先进的模型。经过与现有方法的简单测试和比较，新方法只用10万次交互即可获得有竞争力的结果，相当于两个小时的实时游戏。

强化学习

潜在应用与效果

SimPLe有潜在的随机隐变量并因此可以被应用于随机领域。基于随机预测模型的基于模型的RL是一种很有前途的、高效的替代无模型RL的方法，因为它可以用于生成高保真的模拟环境，以及用于机器人和自动驾驶等高端应用的真实世界数据。

原文：

https://arxiv.org/abs/1903.00374v1

几何感知的深度激光雷达测程法

通常，测程法模块是基于模型的，主要使用RGB-D相机和激光雷达。虽然这样的模块具有很高的性能，但基于模型的方法面临着很多挑战，包括易受环境干扰和参数选择问题等等。也就是说，在使用激光雷达进行基于学习的测距问题上，人们的努力已经达到一定瓶颈了。

基于学习的激光雷达深度学习方法已经在过去的许多研究工作中得到了回顾，研究人员使用一个有监督的学习框架，并面临着将密集点云处理成深度神经网络的挑战。由于以前的方法依赖于有监督的学习，这种学习需要有标记序列的基本事实，因此研究人员现在已经提出了一种无监督的深度激光雷达测程法。

深度学习测程方法

DeepLo是一种新的方法，它代表了LiDAR中第一个无监督的基于学习的测程法。DeepLo将迭代最近点（ICP）技术整合到深度学习框架中，可以使用有监督或无监督的方法进行训练。它还集成了两个损失函数，允许在训练阶段中根据参数将模型在有监督和无监督学习之间切换。为了有效的进行无监督训练和预测，研究人员将顶点和法向图作为输入，并将其用于损失计算。

DeepLo已经使用著名的Kitti和牛津Robotcar标准基准数据集进行了评估。新的方法被证明具有更高的性能和效率。

潜在应用及效果

自主的研究人员和工程师，以及整个人工智能社区，无论配置或硬件类型如何，都可以将DeepLo用于激光雷达点云，以在模型训练期间实现可扩展性和灵活性。

DeepLo还为他们提供了实现有效的同时定位和绘图（SLAM）的能力，可用于各种应用，如自动汽车、机器人、3D绘图等。

原文：

https://arxiv.org/abs/1902.10562v1

统一集成方法提高Q-Learning性能

集成方法通过装袋或增强来减少误差或提高准确性，从而改善机器学习（ML）模型。集成方法也被用于强化学习（RL），即在不同的RL操作上使用聚合机制来实现稳定性，提高收敛速度或改进探索行为。

但是，如果你能使用集成方法来获得更高的性能和准确性呢？新的研究表明，你可以通过社会理论来改善Q-Learning。

组合集成方法有助于提高模型性能

一组研究者已经证明，可以通过平行引入社会选择理论中的委员会投票规则来实现很多集成方法。他们已经将在集成方法中设计动作聚合机制的挑战映射到具有不同投票规则的投票问题中，这些投票规则已经产生了流行的基于集成的RL算法，例如多数投票Q-Learning或自举Q-Learning。

与传统方法不同，新的统一方法允许人工智能设计者创建性能更好的集成RL算法。例如，研究人员将两个以多样性为中心的委员会投票规则（包括单一不可转让投票规则和Chamberlin-Courant规则）映射到全新的RL算法中，这些算法在测试实验中表现出了出色的探索性行为。

潜在应用及效果

由于计算能力不断增强，开发人员可以在合理的时间范围内训练大型集成学习模型，因此其应用潜力会不断增强。

统一集成方法可用于减少训练数据过度拟合的挑战。此外，它们还可用于增强遥感，航拍制图，计算机安全，欺诈检测，人脸识别，基于财务的决策，健康应用，灾害监测中的变更检测等方面。

原文：

https://arxiv.org/abs/1902.10646v1

属性辅助部分检测和人员再识别的改进

近年来，人员的再识别受到了研究界和业界的广泛关注。而且，虽然这一领域已经相对成熟并吸引了许多人工智能研究人员，但视觉视角的变化、被检测者姿态的不确定性仍然给它的应用带来了巨大的挑战。当试图判断两个图像是否具有相同的身份时，这些挑战可能会使结果出现较大偏差。

此外，由于人体目标检测仍然使用传统的方法，边界框可能是不准确的，当这一缺陷结合到人体的姿势变化时，会导致两个图像之间出现空间错位。同样，我们也不能忽视在现实的视频监控场景中经常出现的遮挡问题。

为了解决这些问题，研究人员一直在继续寻找更好的人员再识别模型，包括采用深度学习特征表示。

属性辅助部分检测和改进（APDR）模型

在过去的研究中，人员再识别任务的属性学习已经被研究过了，并且在被视为中级语义特征时显示出了巨大的潜力。

研究人员使用属性学习过程作为定位器来处理偏差问题。这是算法史上首次将属性学习的感知能力公开地运用到人的识别任务中。

他们设计了一个简单但有效的模型来通过属性识别人。为了进行有效的表示，模型会利用融合后的属性信息过滤掉不可用的信息。APDR已经在两个流行的基准上进行了全面的测试，其中包括Market-1501和DukeMTMC-reID。与最先进的模型相比，该模型具有有效性和竞争力。

潜在应用及效果

这一新方法能够促进人员再识别任务的执行。它对正在进行的研究工作、图像检索任务和视频监控应用具有重要意义。

原文：

https://arxiv.org/abs/1902.10528v1

通过转换矢量学习实现图像到图像的转换

过去一段时间里人们对图像到图像的转换越来越感兴趣。这主要是因为基于循环一致性假设的无监督模型成功地推动了这一领域的发展。然而，上述成功仅限于特定的子领域类别，如以样式或纹理差异为标志的领域。

最近，一组研究人员已经解决了这个具有挑战性的问题，并通过一个全新的模型证明了域可以通过样式和纹理来定义，从而包含任何图像混乱和异质性。

转换矢量学习GAN（TraVeLGAN）

TraVeLGAN是研究人员最近发布的一种全新方法，用于实现无监督域映射。还记得传统的GAN网络吗？

它引入了一个鉴别器网络来引导生成器在目标域生成图像。TraVeLGAN在原始的两个网络中添加了第三个网络——一个siamese网络——作为生成器的指导，这样每个原始图像都可以与其相应的生成版本共享语义。

因此，这三个网络系统使得生成器网络不必受到当前周期一致性限制的约束。最终的结果是，生成器模型可以学习复杂域之间的映射，这些复杂域之间的映射在样式和纹理方面有所不同。

潜在应用及效果

TraVeLGAN无疑将图像和对象操作提升到了另一个层次。人工智能社区可以应用这一方法在一个图像集合中捕获特殊特征，并将它们转换为完全不同的图像集合。

其他应用还包括绘画中的图片生成、一般图像处理、图像增强、图像中的颜色和纹理变化、对象变形、自动驾驶场景的翻译、采集样式转换等。

打开APP阅读更多精彩内容