基于函数逼近协同更新的DQN算法

消耗积分:0 | 格式:pdf | 大小:3.14 MB | 2021-06-16

分享资料个

　　针对经典深度Q网络（DepΩ Network，DQN）算法在训练初期收敛速度慢的问题，文中提岀一种新的基于函数逼近协同更新的DQN算法。该算法在经典的DQN算法的基础上融合了线性函数方法，在训练的初期利用线性函数逼近器来代替神经网络中的行为值函数网络，并提出一种离策略值函数更新规则，与DQN协同更新值函数参数，加快神经网络的参数优化，进而加快算法的收敛速度。将改进后的算法与DQN算法用于 Cartpole和 Mountain car问题，实验结果表明，改进后的算法具有更快的收敛速度。

下载并关注上传者

开通VIP，低至0.08元下载/次

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

STM32国内外发展现状
2024-04-08 18次下载

下载
传感芯片选型指南
2024-04-17 12次下载

下载
储能电源市场分析
2024-04-22 11次下载

下载
ATmega8芯片中文手册
2024-04-14 8次下载

下载
TDK电容器产品指南
2024-04-09 7次下载

下载
2A多电池高效开关充电器AN_SY6912A中文资料规格书
2024-04-14 7次下载

下载

全部0条评论

快来发表一下你的评论吧 !

基于函数逼近协同更新的DQN算法

一种新型的自适应混合协同过滤推荐算法

结合本体语义和用户属性的改进协同过滤算法

基于DDPG算法的智能车汇流模型

基于光华逼近函数的求解凸二次规划方法

基于NSGA2算法的ZDT1函数相关测试案例下载

基于状态信息的动态更新蚁群优化算法

基于显式反馈的改进协同过滤算法研究

针对NOMA系统的用户关联与功率控制协同优化

结合云计算与边缘计算的云边协同综述

一种融合多种类型上下文信息的协同过滤算法

基于协同过滤推荐模型的评分函数研究综述

一种针对函数的新型群智能优化算法PDO-DLAS

基于随机森林与转换算法实现海洋数据的协同转换

基于规范化函数的深度金字塔模型算法

基于布谷鸟搜索算法与多目标函数的多文档摘要方法

针对协同过滤推荐算法的相似度计算方法

针对高维稀疏数据的可重叠子空间K-Means聚类算法

增量式约简最小二乘孪生攴持向量回归机算法

结合搜索与Double DQN的非完备信息博弈算法

一种改进的基于半自动编码器的协同过滤推荐算法

基于双序列函数的web服务端防御方案

一种节约内存的增量更新算法

一种融合知识图谱和协同过滤的混合推荐模型

基于SVDPP算法的新型协同过滤推荐算法

如何使用标签权重进行协同过滤推荐算法的资料说明

C++的实验教程之函数的递归算法资料免费下载

如何解决协同过滤算法的项目分类不准确问题

pade逼近方法的介绍与泰勒级数展开式相匹配的详细资料概述

ExpDSP的投诉算法如何访问函数算法和框架如何使用回调函数概述

基于容积约束Power图的图像分片逼近

深度解析CORDIC算法原理

模数转换器：并行比较型和逐次逼近型

硬件算法协同设计

关于高斯滤波器的响应和逼近

7个流行的强化学习算法及代码实现

7个流行的强化学习算法及代码实现

嵌入式的单向散列算法

usdt区块遨游的函数单双和函数

如何利用Python实现正割算法呢

哈希算法函数的定义描述及其特征介绍

使用Verilog HDL设计实现Cordic算法

我们为什么需要回调函数？

机器学习的范围和算法

什么是机器学习问题 普适逼近定理介绍

介绍网络压缩算法，知识蒸馏

用PyTorch实现了基本的RL算法

逐次逼近型ADC的基本原理分析与讲解

一个基于TF2.0的强化学习训练工具

基于协同过滤算法的推荐

区块链共识算法为什么要被不断地更新

基于CORDIC算法的反正切函数计算模块的设计

激活函数中sigmoid、ReLU等函数的一些性质

adaboost运行函数的算法怎么来的？基本程序代码实现详细

一个神经元的ResNet就是一个通用的函数逼近器

逐次逼近型ADC的原理

蚁群算法解决tsp问题

基于新阈值函数的小波阈值去噪算法

一文看懂常用的梯度下降算法

利用Cordic算法来计算三角函数的值

Sigmoid函数的拟合法分析及其高效处理

下载排行榜

STM32国内外发展现状

传感芯片选型指南

储能电源市场分析

ATmega8芯片中文手册

TDK电容器产品指南

2A多电池高效开关充电器AN_SY6912A中文资料规格书

什么是机器学习问题普适逼近定理介绍