【论文阅读】基于鲁棒强化学习的无人机能量采集可重构智能表面

  • 只做学习记录,侵删原文链接

@article{peng2023energy,
title={Energy Harvesting Reconfigurable Intelligent Surface for UAV Based on Robust Deep Reinforcement Learning},
author={Peng, Haoran and Wang, Li-Chun},
journal={IEEE Transactions on Wireless Communications},
year={2023},
publisher={IEEE}
}

《Energy Harvesting Reconfigurable Intelligent Surface for UAV Based on Robust Deep Reinforcement Learning》基于鲁棒强化学习无人机能量采集可重构智能表面 IEEE Transactions on Wireless Communications一区

    • 论文背景
      • 研究目标
    • 系统模型
      • 通信模型
      • 优化函数
    • 算法设计

论文背景

研究目标

  • RIS每一个反射单元都由无源器件电容、电阻等构成,能耗小、成本低,能单独对信号进行反射。
  • UAV在动态密集的户外活动,如马拉松、音乐会等,提供按需通信服务有巨大潜力。
    • 缺点:
  • RIS:静态部署,当服务覆盖范围中只有少量用户终端(UT)时,使用所有反射阵列进行信号传输可能导致资源浪费。
  • UAV:临时基站(BS)、辅助物联网(IoT),增强热点覆盖,但电池容量限制。
    • 目标 :这项工作是使无人机智能反射面结合,旨在在有限的时间范围内最大限度地提高UAV–RIS的总能量收集效率,同时满足用户所需的最小吞吐量约束

系统模型

在这里插入图片描述
在这里插入图片描述

  • 两个维度
    1. 只考虑时间:分为两个阶段
      (1)能量传输阶段(2)信号传递阶段
    2. 考虑时间和空间
      (1)能量传输阶段(2)信号传递阶段:在该阶段还考虑智能反射面哪些反射元件用于能量收集。

通信模型

在这里插入图片描述

优化函数

下图中只写出了时空两个维度的,单一时间维度的类似。
在这里插入图片描述
在这里插入图片描述

算法设计

本文使用到强化学习的SD3算法,该算法是TD3算法的优化(求Q值引入Softmax),下图对比了TD3算法和DDPG算法,并简单列出了SD3算法的推导过程。
在这里插入图片描述

  1. TD3改善DDPG高估的问题。
    在这里插入图片描述
  2. SD3算法改善TD3算法的低估问题。推导过程如下(其中为便于计算机求解原算法将积分问题使用了重要性采样):
    在这里插入图片描述
  3. 马尔科夫元组个元素。
    在这里插入图片描述
    实验部分不在此是赘述,感兴趣可以阅读原文。

http://www.niftyadmin.cn/n/333157.html

相关文章

试用阿里云云拨测对Web网站的网页性能进行测试并分析

目录 前言 云拨测操作步骤 1.开通应用实时监控服务ARMS 2.成功登录后,在产品类别下选择中间件>应用实时监控服务,在云拨测卡片上单击立即试用。 3.登录ARMS控制台,在左侧导航栏中选择云拨测>定时拨测,在定时拨测页面右上…

Ada语言学习(1)Basic Knowledge

文章目录 说在前头命名注释数字变量变量类型signed integersEnumerationsFloating Points 类型重用(继承)类型转换 运算符属性(Attributes)练习 说在前头 本系列教程将会通过提问的方式来完成整个学习过程,因为当你能…

Day2 排序子序列、倒置字符串

✨个人主页: 北 海 🎉所属专栏: C/C相关题解 🎃操作环境: Visual Studio 2019 版本 16.11.17 文章目录 选择题1.字符串/C指针2.计算机组成原理 编程题1.排序子序列2.倒置字符串 选择题 1.字符串/C指针 题目&#xff…

技术面试的终极指南:助你取得成功的关键步骤

背景 技术面试是许多求职者最关键的一环,因为它评估了你在特定领域的知识和技能。无论你是刚毕业的大学应届生,还是有多年工作经验的职场老兵,准备充分是成功面试的关键。 这篇文章将提供一系列关键步骤,帮助你充分准备和展现自己…

使用thrift进行RPC通信(附c程序示例)

前言 为了实现不同语言的程序跨进程、跨主机通信,一般可以采用mq或rpc框架来实现。 对于异步通知的场景可以使用mq,如zeroMQ。 但对于某些实时性较强且同步的应用场景,使用成熟的rpc框架来实现也是一种比较更好的选择。 开源的rpc框架有很…

【EfficientDet】《EfficientDet:Scalable and Efficient Object Detection》

CVPR-2020 文章目录 1 Background and Motivation2 Related Work3 Advantages / Contributions4 Method4.1 BiFPN4.2 EfficientDet 5 Experiments5.1 Datasets5.2 EfficientDet for Object Detection5.3 EfficientDet for Semantic Segmentation5.4 Ablation Study 6 Conclusio…

chatgpt赋能Python-openpyxl_批注

Openpyxl 批注简介 Openpyxl 是一个用于操作 Microsoft Excel 文件的 Python 库,它提供了许多方便的功能来读取、写入和修改 Excel 文件。其中一个功能是批注,可以在单元格中添加注释或提醒。 Openpyxl 批注的具体用途 Openpyxl 批注在 Excel 工作表中…

DPDK之l3fwd-power源码解析

DPDK之l3fwd-power源码解析 引言1 源码概述1.1 关键变量1.2 数据结构 2 源码解析2.1 LEGACY模式2.2 EMPTY_POLL模式2.3 TELEMETRY模式2.4 INTERRUPT模式2.5 PMD_MGMT模式 3 主要API3.1 CPU调频接口3.2 empty_poll电源管理接口3.3 pmd电源管理接口3.4 中断接口3.5 ip路由接口 引…