【强化学习入门】深度强化学习DRL入门学习资料

news/2024/5/19 0:31:51 标签: 人工智能, 深度学习, 强化学习, 神经网络

文章目录

  • 1.顶会目录
  • 2.视频教程
  • 3.交流社区
  • 4.开源项目

1.顶会目录

  • AAAI(AAAI Conference on Artificial Intelligence, AAAI),地址:http://dblp.uni-trier.de/db/conf/aaai/

  • IJCAI(International Joint Conference on Artificial Intelligence, IJCAI),地址: http://dblp.uni-trier.de/db/conf/ijcai/

  • ICML(International Conference on Machine Learning, ICML),地址: http://dblp.uni-trier.de/db/conf/icml/

  • NeurIPS(Annual Conference on Neural Information Processing Systems),地址: http://dblp.uni-trier.de/db/conf/nips/

  • AAMAS(International Joint Conference on Autonomous Agents and Multi-agent Systems), 地址: http://dblp.uni-trier.de/db/conf/atal/index.html

  • ICLR( International Conference on Learning Representations, ICRA),地址: https://iclr.cc/

  • ICRA(IEEE International Conference on Robotics and Automation),地址:http://dblp.uni-trier.de/db/conf/icra/

2.视频教程

  • 《深度强化学习 | 王树森,地址:https://www.bilibili.com/video/BV12o4y197US

  • 《Deep Reinforcement Learning》 | 李宏毅, 地址:https://www.bilibili.com/video/BV1UE411G78S

  • 《世界冠军带你从零实践强化学习 | 百度飞桨团队, 地址: https://www.bilibili.com/video/BV1yv411i7xd

  • 强化学习白板推导》地址:https://space.bilibili.com/97068901/channel/seriesdetail?sid=594040

  • 《蘑菇书EasyRL》 | 王琦等,地址:https://github.com/datawhalechina/easy-rl

  • 《动手学强化学习 | 张伟楠等, 地址:http://hrl.boyuai.com/

3.交流社区

  • RLChina强化学习社区地址:http://rlchina.org/
  • 智源社区强化学习专栏地址:https://hub.baai.ac.cn/?tag_id=74
  • 智源社区强化学习周刊地址:https://hub.baai.ac.cn/users/18447

4.开源项目

  • PFRL:基于Pytorch的深度强化学习地址:https://github.com/pfnet/pfrl
  • 莫烦强化学习TensorFlow代码地址:https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflow
  • 百度飞桨PaddlePaddle强化学习代码地址:https://github.com/PaddlePaddle/PARL
  • Github强大的强化学习地址: https://github.com/wwxFromTju/awesome-reinforcement-learning-lib
  • 优达学城(在线教育平台)强化学习地址:https://github.com/udacity/deep-reinforcement-learning

http://www.niftyadmin.cn/n/23901.html

相关文章

# 分布式理论协议与算法 第二弹 ACID原则

ACID 原则是在 1970年 被 Jim Gray 定义,用以表示事务操作:一个事务是指对数据库状态进行改变的一系列操作变成一个单个序列逻辑元操作,数据库一般在启动时会提供事务机制,包括事务启动 停止 取消或回滚。 但是上述事务机制并不真…

网络编程套接字----TCP协议

文章目录前言一、简单TCP网络程序二、TCP socket API 详解socket()bind()listen()accept()connect()三、TCP网络编程头文件日志文件客户端服务器单进程版本多进程版本多线程版本四、线程池版的TCP更改提供的服务五、理论铺垫总结前言 接着上节课我们讲了udp套接字网络编程,这节…

第一章 R语言介绍

1.为何使用R 与起源于贝尔实验室的S语言类似,R也是一种为统计计算和绘图而生的语言和环境,它是一套开源的数据分析解决方案,由一个庞大且活跃的全球性研究型社区维护。但是,市面上也有许多其他流行的统计和制图软件,如…

牛客网C++项目-Linux高并发服务器开发之第一章:Linux系统编程入门 学习笔记

1.1 Linux 开发环境搭建 由于仅是开发环境的搭建,所以只简单记述一下步骤 必备软件: Ubuntu 18.04 XShell-用于远程登录,使用SSH协议,TCP连接,端口号22 XFtp,本次实验中尚未用到 Visual studio code&a…

scikit-learn线性模型之线性回归

scikit-learn线性模型之线性回归线性回归参考文献线性回归 有监督学习中主要解决两个问题,一个是分类,另一个是回归。 在回归问题中,我们需要利用我们已知的特征 x1,x2,...,xpx_1,x_2,...,x_px1​,x2​,...,xp​ 去预测我们的目标变量 yyy 。…

sklearn预测评估指标计算详解:准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1score

目录 前言 一、准确率 二、精确率 三、召回率 四、F1-score 点关注,防走丢,如有纰漏之处,请留言指教,非常感谢 前言 很多时候需要对自己模型进行性能评估,对于一些理论上面的知识我想基本不用说明太多&#xff0…

内核解读之内存管理(2)内存管理三级架构之内存结点node

文章目录0、概述1、内存节点node0、概述 结合NUMA的架构,Linux抽象出了三级内存管理架构:内存节点node、内存区域zone和物理页框page。 在NUMA模型中,每个CPU都有自己的本地内存节点(memory node),而且还…

【linux】三种权限的使用和更改、粘滞位和yum的使用

目录 1.权限问题 ①什么是权限? ②小问题 ③默认权限 ④如何更改“人”的权限呢? ⑤更改权限的八进制方案 ⑥强制改权限里的“人”(权限人文件属性) 2.粘滞位 2.yum的使用 1.权限问题 ①什么是权限? 权限人&a…