×

基于Takagi-Sugeno的再励学习模糊神经网络控制

消耗积分:2 | 格式:rar | 大小:139 | 2009-09-01

王伟

分享资料个

基于动作的评价值函数的再励学习方法主要有三种:Q-学习、R-学习和优胜学习。一般地,这些学习方法只能接受离散化的状态输入,产生离散值的控制动作。但是,智能体所处的环境通常是空间连续的,对连续的状态空间和动作空间进行离散化,会导致维数灾难问题。另一方面,经典的模糊推理系统,能够完成简单的学习任务;但是,当学习任务涉及复杂的多变量环境时,这些方法就失去了效力。为完成具有离散时间和连续空间的复杂学习任务,本文将基于动作的评价值函数的再励学习方法与Takagi-Sugeno模糊逻辑系统进行了有机结合,提出了一种新的再励学习网络结构,即竞争式T-S 模糊再励学习网络(以下简称CTSFRLN)。CTSFRLN
采用T-S 模糊神经网络表达智能体的结构,由于T-S 模糊推理系统只需少量的模糊规则,就能充分逼近多变量非线性函数。因此CTSFRLN 能够利用这一优势处理多变量的复杂学习问题。针对CTSFRLN 结构,文中提出了一种高效的学习算法,即竞争式T-S 模糊Q-学习算法。
学习结束之后,CTSFRLN 从功能上将变为一种T-S 模糊变结构控制器,能够较大地改善系统的控制性能。本文对上述学习方法在倒立摆控制系统中的应用进行了仿真,结果令人满意。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !