DDPG自动驾驶横向控制项目调参过程

DDPG自动驾驶横向控制项目调参过程

news/2024/5/19 1:12:24 标签: 人工智能, 强化学习, 自动驾驶, python, 算法

DDPG自动驾驶横向控制项目调参过程

- actor和critic网络的学习率
- OU噪声参数设置
- 整体参数设置
- 结果

我做的一个DDPG的自动驾驶横向控制的项目，用的模拟器是Torcs。
在调参过程中遇到了很多问题，在这里记录一下。

actor和critic网络的学习率

一开始我按照大部分资料中说的，学习率设计的越小越好。将学习率设为actor和critic分别为1e-6和1e-5。
结果出现了loss震荡的情况以及reward最终收敛到最低值，学到了坏的结果的情况。
在这里插入图片描述

根据多次实验的结果，我选取的学习率为演员网络和评论家网络分别为 1e-4 和 1e-3，并引入在训练神经网络时，学习率随轮数衰减。
分析：
虽然很多资料说学习率越小越好，但是也很可能导致实际上没有学到东西。另外在设置参数的时候最好critic比actor的参数设置大一些。

OU噪声参数设置

由于我的智能体始终无法学会转弯，我认为是OU噪声设置过小的缘故。
一开始OU噪声我设置成DDPG论文中的一样： $\sigma$ 为0.15， $\theta$ 为0.2。最终陷入了局部最优。
在这里插入图片描述
因此我调整参数为：

整体参数设置

• Actor network learning rate: 1e-4;
• Critic network learning rate: 1e-3
• Soft target update rate $\tau$ : 1e-3
• Batch size: 128;
• Experience playback pool size: 38700;
• Episode steps limit: 183337
• Warmup steps: 1000
• Simulation frequency: 20 Hz.

备注：

Batch size越大越好；
经验池大小最好是batch size的300倍；

结果

在这里插入图片描述

http://www.niftyadmin.cn/n/1399160.html

相关文章

Ubuntu16.04 安装ROS Kinetic

Ubuntu16.04 安装ROS Kinetic

参考网址：https://blog.csdn.net/qq_40936141/article/details/86241910 记录一下安装过程 Ubuntu16.04 安装ROS Kinetic一、安装ROS1、添加ROS软件源2、添加密钥3、更新软件包4、安装ROS Kinetic5、初始化ROSrosdep init ROS安装问题解决方案6、安装rosinstall二…

阅读更多...

安装和使用 mpi4py

安装和使用 mpi4py

安装和使用 mpi4py参考文章：https://www.jianshu.com/p/ba6f7c9415a0测试那里print需要改成括号

阅读更多...

【强化学习文献阅读】DRN：新闻推荐的深度强化学习框架

【强化学习文献阅读】DRN：新闻推荐的深度强化学习框架

Article 作者：Guanjie Zheng, Fuzheng Zhang, Zihan Zheng, Yang Xiang, Nicholas Jing Yuan, Xing Xie, Zhenhui Li文献题目：DRN：新闻推荐的深度强化学习框架文献时间：2018文献链接：http://www.personal.psu.edu/~gj…

阅读更多...

【推荐系统论文阅读】基于强化学习的推荐模拟用户反馈

【推荐系统论文阅读】基于强化学习的推荐模拟用户反馈

Article 作者：Xiangyu Zhao, Long Xia, Lixin Zou, Dawei Yin, Jiliang Tang文献题目：基于强化学习的推荐模拟用户反馈文献时间：2019文献链接：https://arxiv.org/abs/1906.11462 摘要随着强化学习 (RL) 的最新进展&#xff0c…

阅读更多...

【强化学习-医疗】用于临床决策支持的深度强化学习：简要综述

【强化学习-医疗】用于临床决策支持的深度强化学习：简要综述

Article 作者：Siqi Liu, Kee Yuan Ngiam, Mengling Feng文献题目：用于临床决策支持的深度强化学习：简要综述文献时间：2019文献链接：https://arxiv.org/abs/1907.09475 摘要由于人工智能尤其是深度学习的最新进展&a…

阅读更多...

【强化学习-医疗】医疗保健中的强化学习：综述

【强化学习-医疗】医疗保健中的强化学习：综述

Article 作者：Chao Yu, Jiming Liu, Shamim Nemati文献题目：医疗保健中的强化学习：综述文献时间：2020文献链接：https://arxiv.org/abs/1908.08796 摘要作为机器学习的一个子领域，强化学习 (RL) 旨在通过…

阅读更多...

基于知识引导的强化学习相关算法介绍

基于知识引导的强化学习相关算法介绍

伏羲课堂学习笔记 absorbing states：一旦进入了state就不会出来了。

阅读更多...

【Transformer系列论文】TransFuser：端到端自动驾驶的多模态融合Transformer

【Transformer系列论文】TransFuser：端到端自动驾驶的多模态融合Transformer

Article 作者：Aditya Prakash, Kashyap Chitta, Andreas Geiger文献题目：TransFuser：端到端自动驾驶的多模态融合Transformer文献时间：2021文献链接：https://arxiv.org/abs/2104.09224 摘要互补传感器的表征应该如…

阅读更多...

最新文章