作者:侯艳丽 单位:华北计算技术研究所 出版:《计算机工程与应用》2011年第23期 页数:4页  (PDF与DOC格式可能不同) PDF编号:PDFJSGG2011230700 DOC编号:DOCJSGG2011230709 下载格式:PDF + Word/doc 文字可复制、可编辑
  • 基于神经网络的连续状态空间Q学习已应用在机器人导航领域。针对神经网络易陷入局部极小,提出了将支持向量机与Q学习相结合的移动机器人导航方法。首先以研制的CASIA-I移动机器人和它的工作环境为实验平台,确定出Q学习的回报函数;然后利用支持向量机对Q学习的状态——动作对的Q值进行在线估计,同时,为了提高估计速度,引入滚动时间窗机制;最后对所提方法进行了实验,实验结果表明所提方法能够使机器人无碰撞的到达目的地。

    提示:百度云已更名为百度网盘(百度盘),天翼云盘、微盘下载地址……暂未提供。