结合搜索与Double DQN的非完备信息博弈算法

消耗积分:0 | 格式:pdf | 大小:1.73 MB | 2021-03-24

分享资料个

　　麻将作为典型的非完备信息博弈游戏主要通过传统 Expectimax搜索算法实现，其剪枝策略与估值函数基于人工先验知识设计，存在假设不合理等问题。提出一种结合 Expectimax搜索与 Double DQN强化学习算法的非完备信息博弈算法。在 Expectimax搜索树扩展过程中，采用 Double DQN输出的估值设计估值函数并在限定搜索层数內获得分支估值，同时设计剪枝策略对打牌动作进行排序与部分扩展实现搜索树剪枝。在 Double DQN模型训练过程中，将麻将信息编码为特征数据输入神经网络获得估值，使用巸 xpectimax搜索算法得到最优动作以改进探索策略。实验结果表明，与 Expectimax搜索算法、 Double DQN算法等监督学习算法相比，该算法在麻将游戏上胜率与得分更高，具有更优异的博弈性能。

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

UC3842/3/4/5电源管理芯片中文手册
2024-12-02 20次下载

下载
华瑞昇CR216芯片数字万用表规格书附原理图及校正流程方法
2024-12-03 14次下载

下载
DMT0660数字万用表产品说明书
2024-12-03 13次下载

下载
3314A函数发生器维修手册
2024-12-19 13次下载

下载
TPS54202H降压转换器评估模块用户指南
2024-12-04 9次下载

下载
STM32F101x8/STM32F101xB手册
2024-12-06 8次下载

下载

结合搜索与Double DQN的非完备信息博弈算法

基于函数逼近协同更新的DQN算法

无线传感器网络的非均匀拓扑控制算法

基于聚类质量的改进非负矩阵分解算法

结合带权质子图的网络表示学习算法

基于Stacklberg博弈的5G网络缓存优化算法

基于DDPG算法的智能车汇流模型

基于改进和声搜索算法的深度置信网络模型

一种带权重的改进跳点搜索路径规划算法

基于滑动窗口的宽度优先搜索算法

求解动态优化问题的邻域搜索差分进化算法

基于博弈论的复杂网络符号社团发现算法

结合深度与演化算法的群竞争合作优化算法

移动目标信号博弈防御模型MTSGDM

基于关系图谱词频的实体搜索与定位算法

基于MapReduce和加权网络信息熵的DBWGIE-MR算法

一种基于博弈论的移动边缘计算功率分配算法

基于布谷鸟搜索算法与多目标函数的多文档摘要方法

基于智能合约的三方博弈理性委托计算协议

基于深度信念网络的实体识别算法

一种双层Stackelberg博弈功率控制算法

以进化算法为搜索策略实现神经架构搜索的方法

基于模糊自适应谐振理论的邻域搜索快速决策算法

基于布谷鸟搜索算法的PID拥塞控制模型

一种结合AKAZE和RANSAC的图像拼接算法

基于单点多步博弈的功防网络防御模型

如何使用优化算法和powell算法提高医学图像配准精度

基于概率信息不完备的群决策模型介绍

基于分层路径计算单元与双矩阵博弈的多域光网络静态组播专用保护算法

网络搜索-填补信息断层的详细中文资料免费下载

基于攻防信号博弈模型的防御策略选取方法

构建高效搜索解决方案，Elasticsearch &amp; Kibana 的完美结合

OpenAI推出ChatGPT搜索功能

机器人基于搜索和基于采样的路径规划算法

自动驾驶 RRT算法原理解析

一种完全由LLM + 启发式搜索算法结合的TOT算法

7个流行的强化学习算法及代码实现

7个流行的强化学习算法及代码实现

什么是完备静态分析？

介绍当前比较常见的几种近邻搜索算法

基于嵌入向量的全新设备端搜索库

二分搜索算法运用的框架套路

自动驾驶中基于图搜索的常用路径规划算法介绍

混合算法(GA+TS)求解作业车间调度问题—禁忌搜索部分

避免大数据杀熟，先做好算法推荐

如何打破“信息茧房”？让算法推荐更好服务网络用户

中国搜索引擎增速放缓，移动搜索成为搜索企业未来新的增长点

新方法可自动搜索新算法，仅利用基本的数学公式

关于讯飞智能搜索解决方案的分析和介绍

区块链能否带来不同的搜索体验？

MIT研发“神经架构搜索”算法,将AI优化的AI设计过程加速240倍或更多

神经架构搜索的算法，可以使被AI优化过的AI设计过程加速240多倍

一个基于TF2.0的强化学习训练工具

语音识别和语言理解或将是未来搜索和信息的核心

运用菱形十字搜索算法提高快速运动估计算法的性能

谷歌搜索算法究竟是怎么工作的？为什么谷歌不做搜索结果个性化？

谷歌在一场小型发布会上宣布了对其搜索引擎的改版

基于肤色与人脸运动相结合的自动表情，对其识别算法进行了研究

Key推出微信零件搜索功能 获取信息更加快速便捷

Valossa推出一个由AI算法驱动的智能电影搜索引擎

垂直搜索引擎是什么_垂直搜索引擎有哪些

下载排行榜

UC3842/3/4/5电源管理芯片中文手册

华瑞昇CR216芯片数字万用表规格书附原理图及校正流程方法

DMT0660数字万用表产品说明书

3314A函数发生器维修手册

TPS54202H降压转换器评估模块用户指南

STM32F101x8/STM32F101xB手册

构建高效搜索解决方案，Elasticsearch & Kibana 的完美结合

Key推出微信零件搜索功能获取信息更加快速便捷