You are on page 1of 3

2021.10.

25-30 周报

陈保罗

摘要
看了第一篇论文

I. 上周工作计划回顾
学习…

II. 本周工作内容
A. 工作内容
看了老师的那篇Deep Reinforcement Learning for Online Computation Offloading in
Wireless Powered Mobile-Edge Computing Networks。学习了一些看论文的方法与重
点。了解的一些名词。
B. 学习收获
问题:在无线移动边缘计算网络里,在一个时变的信道的条件下,如何高效的
作出对于每一个无线设备应该在本地计算或是卸载到AP的决策。
贡献:1不需要计算MIP问题,计算复杂度不会随网络规模变大而变大。2将问题
划分成了不同的子问题 3卸载动作的可选项也不会随着网络规模扩大而极具变大 4
有一个自适应的过程,在运算中可以不断调整降低计算复杂度。
然后模型是先AP给WDs充能,再做出决策,在本地计算的就直接开始本地计算
而需要卸载到AP的会依次卸载到AP进行计算,然后似乎AP的计算能力视为足够大,
以及计算的结果下载回WD的时间也视作0。这样的话整个时隙的时间就被划分为
了充能的时间和各个需要卸载的WDs的数据传输的时间。
然后对于卸载决策的生成与更新如下图所示

蓝色的ht(向量)就是当前第i个时隙时的无线信道,将他输入一个DNN之后会得
到一个向量x,它由k个不同的xi组成,通过取最大的一个 得 到 一 个 xt*
作为这个时隙要选择的动作,并且将最初的ht与xt*成对送进缓存区,作为网络训练
集的来源,这样可以逐渐更新DNN使得一个一个h进来之后可以逐渐输出较好的x。
再后面就是结果的展示,跟已有的算法的一些比较,不附上了。

一些名词解释
MIP问题:我最直观的理解类似于高中数学x与y满足一些不等式,然后求极值或
最值,但它可以限于只有两个变量,当变量数上升之后计算的难度也就随之上升了。
瑞利衰落:这是朱博在提到为什么会是一个wireless fading environment 时讲
到的东西。信道衰落可以分大尺度衰落和小尺度衰落,大尺度衰落大致因为路径
损耗而小尺度衰落可能是因为信号会经过不同的路径传播至同一个接收端,而信
号是一种波因此有波峰波谷且会进行叠加之类的会造成信号极大的波动。而瑞利
分布是一种概率分布。在本文中,假定一个时隙里的信道是不变的,但是在不同
的时隙间信道是会时变的(所以知道这个分布也没什么用…)。

C. 关键问题
因为第一次看论文会比较慢,然后很多不理解的名词和方法也要去查阅资料了解
所以过程会比较不连贯,以及一开始是从头开始一点一点看过去,没有一开始就对
论文有一个比较概要性的了解,有时候会看的有点不知所云,是后来朱博带着我和
几个本科生一起把论文过了一遍才稍微清晰一些。之后看论文要有随手就开始写周
报的习惯。
D. 其他想法(可选)

III. 下周工作计划
好好上课,看那篇An Integrated Optimization-Learning Framework for Online
Combinatorial Computation Offloading in MEC Networks
然后继续听朱博讲论文。

You might also like