基于生成对抗网络的模仿学习研究综述-电子发烧友网

　　模仿学习硏究如何从专家的决策数据中进行学习，以得到接近专家水准的决策模型。同样学习如何决策的强化学习往往只根据环境的评价式反馈进行学习，与之相比，模仿学习能从决策数据中获得更为直接的反馈。它可以分为行为克隆、基于逆向强化学习的模仿学习两类方法。基于逆向强化学习的模仿学习把模仿学习的过程分解成逆向强化学习和强化学习两个子过程，并反复迭代。逆向强化学习用于推导符合专家决策数据的奖赏函数，而强化学习基于该奖赏函数来学习策略。基于生成对抗网络的模仿学习方法从基于逆向强化学习的模仿学习发展而来，其中最早出现且最具代表性的是生成对抗模仿学习方法（ Generative Adversarial Imitation Learning，简称GAIL）。生成对抗网络由两个相对抗的神经网络构成，分别为判别器和生成器.GAL的特点是用生成对抗网络框架求解模仿学习问题，其中，判别器的训练过程可类比奖赏函数的学习过程，生成器的训练过程可类比策略的学习过程。与传统模仿学习方法相比，GA具有更好的鲁棒性、表征能力和计算效率。因此，它能够处理复杂的大规模问题，并可拓展到实际应用中然而，GA存在着模态崩塌、环境交互样本利用效率低等问题。最近，新的研究工作利用生成对抗网络技术和强化学习技术等分别对这些问题进行改进，并在观察机制、多智能体系统等方面对GAI进行了拓展。本文先介绍了GAL的主要思想及其优缺点，然后对GAIL的改进算法进行了归类、分析和对比，最后总结全文并探讨了可能的未来趋势。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

基于生成对抗网络的模仿学习研究综述

PyTorch教程20.2之深度卷积生成对抗网络

基于像素级生成对抗网络的图像彩色化模型

基于残差生成对抗网络的人脸图像复原方法

融合生成对抗网络等的皮肤病诊断技术

生成式对抗网络应用及研究综述

基于生成对抗网络的双循环迁移排序学习方法

基于结构保持生成对抗网络的图像去噪

基于辅助分类器生成对抗网络的图像识别

基于深度卷积生成对抗网络的花朵图像识别分类

基于生成式对抗网络的图像补全方法

注塑瓶检测的半监督深度卷积生成对抗网络模型

基于生成对抗网络的语音信号分离方法

基于密集卷积生成对抗网络的图像修复方法

梯度惩罚优化的图像循环生成对抗网络模型

基于生成对抗网络的深度伪造视频综述

GAN图像对抗样本生成方法研究综述

基于时空生成对抗网络的视频修复方法

基于自注意力机制的条件生成对抗网络模型

基于生成式对抗网络的端到端图像去雾模型

基于生成对抗网络的单图像超分辨率重建方法

手语识别、翻译及生成研究综述

基于生成器的图像分类对抗样本生成模型

基于生成对抗网络GAN模型的陆空通话文本生成系统设计

基于谱归一化条件生成对抗网络的图像修复算法

新型生成对抗式分层网络表示学习算法

如何使用深度残差生成对抗网络设计医学影像超分辨率算法

如何使用双鉴别网络进行生成对抗网络图像修复方法的说明

如何使用生成对抗网络进行信息隐藏方案资料说明

生成对抗网络在计算机视觉领域有什么应用

生成对抗网络模型综述

生成对抗网络(GANs)的原理与应用案例

深度学习中的无监督学习方法综述

神经网络架构有哪些

深度学习生成对抗网络（GAN）全解析

图像分类的主流深度神经网络模型有哪些 深度神经网络搜索方法总结

PyTorch教程-20.2. 深度卷积生成对抗网络

生成对抗网络GAN的七大开放性问题

GAN：生成对抗网络 Generative Adversarial Networks

「自行科技」一文了解生成式对抗网络GAN

基于生成对抗网络的异常检测方法

一种基于生成对抗网络的无人机图像去雾算法

一种基于生成对抗网络的无人机图像去雾算法

深度学习在轨迹数据挖掘中的应用研究综述

基于深度学习的目标检测研究综述

条件生成对抗模型生成数字图片的教程

PWIL：不依赖对抗性的新型模拟学习

NVIDIA研究人员使用AI再现初代《吃豆人》

AI生成的假新闻难以识别，那就用神经网络来对抗吧

生成对抗网络与其他生成模型之间的权衡取舍是什么?

生成对抗网络之父伊恩·古德费洛正式宣布加盟苹果

必读！生成对抗网络GAN论文TOP 10

RAIL：风险厌恶模仿学习算法方案

浅析生成式对抗网络发展的内在逻辑

关于对生成式对抗网络的研究

生成对抗网络GAN，正在成为新的“深度学习”

用生成对抗网络大规模定制医疗产品

随着生成对抗网络的发展，可能让网络上到处都是个性化定制的内容？

生成式对抗网络基础知识直观解读

基于生成对抗网络（GAN）的框架

生成式对抗系统最为惊艳世界的10大应用

下载排行榜

UC3842/3/4/5电源管理芯片中文手册

华瑞昇CR216芯片数字万用表规格书附原理图及校正流程方法

DMT0660数字万用表产品说明书

3314A函数发生器维修手册

TPS54202H降压转换器评估模块用户指南

HY12P65/HY12P66数字万用表芯片规格书

图像分类的主流深度神经网络模型有哪些深度神经网络搜索方法总结