陈保罗20220327

Uploaded by

反弹

0% found this document useful (0 votes)

2 views3 pages

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

2 views3 pages

陈保罗20220327

Uploaded by

反弹

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 3

Search inside document

2022.03.21-2022.03.

26 周报

陈保罗

摘要
疯狂模拟

I. 上周工作计划回顾
应该会有我不知道的新任务，如果没有的话，我稍微看点边缘计算的论文吧（觉
得别人的周报都很扎实，我可以从他们周报里看看先）

II. 本周工作内容
A. 工作内容
1 模拟更多的轮次看两者差距 p设成0.3和0.6
2 记录两者在不同情况下运行时间的差距
3.fast在当客观状态改变时其决策的适应速度
B. 学习收获
1. 上周的周报只对比了Selecting_one_of_multiple_projects这个场景下的两种方法在
前200轮的结果对比，如图1所示。在不同的p的情况下，两者的差距大体上都呈
下降趋势，在75轮后差距逐渐稳定小于0.1。

图1 两种迭代法模拟500次的平均结果的差值
我继续以p=0.6为例子，将轮次提升至2000轮，对比两者效果，如图2所示。当
迭代轮次继续变多之后，两种迭代法之间的差距继续减小，在1500轮之后两者
的差距逐渐稳定小于0.01，但以历史平均值作为theta进行选择的平均收益始终
要优于fast learning里提出的方法。

图2 p=0.6/0.3_多选一_2000轮差距

2. 上次没有跑的其他场景，我也按照200轮/5000次取平均进行计算了,结果如下表
所示。

结果大致符合预期。对比相同场景，相同条件下的两种算法，其计算时间并没有
数量级上的差距。需要指出的是，因为即使是用fast learning里的方法更新theta，
在记录数据时，依旧要计算历史平均的收益，所以fl的时间总会大于exy的时间，
如果单纯比较两者做决策的时间，fl的时间会略小，但是同样拉不开差距。

3. 在《Dynamic Optimization and Learning for Renewal Systems》里面对于算法的描

述是“For systems that make only a single decision on each frame, both algorithms are
shown to learn efficient behavior without a-priori statistical knowledge.”而在《Fast
Learning for Renewal Optimization in Online Task Scheduling》里对以历史平均收
益为theta的算法的描述为“The algorithm in (Neely, 2013) requires knowledge of the
probability distribution for S[k].”。所以对于因某些客观原因无法记录历史数据的
场景中，(Neely, 2013)里主要使用的算法是不可行，但fast Learning里的迭代法却
没有这个问题。从另一个角度来看，若是场景的条件发生改变(Neely, 2013)的方
法因为是对历史取平均，会经过较多的轮次才能变成一个较合理的theta，而fast
learning的方法可以通过较少次数的迭代就将theta更新至符合当下场景的结果。
比如，在Selecting one of multiple projects这个场景里，将前150轮的p设置为0.0，
第150轮到第200轮的p=0.9。那么经过五十次实验取平均，两种方法的结果的差
值如图3所示。

图2 多选一，先0.0后0.9，150轮改变，两者差值

如上图所示，起先两者的差距在不断迭代之后确实在减小，但大致保持在0以上
（60轮那里为什么会那么接近甚至达到0我还没理解，但数据跑出来确实是这样）。
在150轮之后两者差距继续减小，fl的值甚至超过了exy（也就是fast learning的方
法的平均收益要高于13年那篇的方法了），在到170轮左右，(Neely, 2013)的theta
也更新到了一个合理的值，两者的效果又接近于一致。

关键问题
无
C. 其他想法(可选)
无

III. 下周工作计划
很期待师兄的组会，他好像打算做一个边缘计算方向的现况的总结，跟他的ppt学
一学

Untitled
Document28 pages
Untitled
chinrei
No ratings yet
陈保罗20220320
Document3 pages
陈保罗20220320
反弹
No ratings yet
课后作业 #2
Document5 pages
课后作业 #2
rdfzkanakol
No ratings yet
03 事务隔离：为什么你改了我还看不见？
Document14 pages
03 事务隔离：为什么你改了我还看不见？
wang mingli
No ratings yet
陈保罗20220313
Document2 pages
陈保罗20220313
反弹
No ratings yet
National Cheng Kung University of Engineering Practicum of Engineering Science
Document11 pages
National Cheng Kung University of Engineering Practicum of Engineering Science
api-620508522
No ratings yet
QGM.A011.S 2016项目估算表
Document53 pages
QGM.A011.S 2016项目估算表
yanrubin2010
No ratings yet
F5 文字题及重要考点整理
Document50 pages
F5 文字题及重要考点整理
su cheong
No ratings yet
02丨日志系统：一条SQL更新语句是如何执行的？
Document18 pages
02丨日志系统：一条SQL更新语句是如何执行的？
15005176312sk
No ratings yet
02 日志系统：一条SQL更新语句是如何执行的？
Document18 pages
02 日志系统：一条SQL更新语句是如何执行的？
wang mingli
No ratings yet
C 07 Ced 62 F 6 C 378 C 87 Ef 2
Document9 pages
C 07 Ced 62 F 6 C 378 C 87 Ef 2
api-620508522
No ratings yet
第7章
Document58 pages
第7章
Sean Usos
No ratings yet
隐式与显式分析的区别
Document7 pages
隐式与显式分析的区别
flcwk
No ratings yet
第二讲第二周
Document12 pages
第二讲第二周
1029115369
No ratings yet
07丨行锁功过：怎么减少行锁对性能的影响？
Document16 pages
07丨行锁功过：怎么减少行锁对性能的影响？
15005176312sk
No ratings yet
10805050A 03平時proii作業繳交
Document3 pages
10805050A 03平時proii作業繳交
蔡珮暄
No ratings yet
计量经济学复习资料（4页）
Document4 pages
计量经济学复习资料（4页）
hxy2321548628
No ratings yet
PMP計算題學習
Document62 pages
PMP計算題學習
KuoYuLiang
No ratings yet
Stata - 各类全要素生产率 TFP 估算方法
Document8 pages
Stata - 各类全要素生产率 TFP 估算方法
Kai Wang
No ratings yet
Hive调优及优化的12种方式 - 知乎
Document5 pages
Hive调优及优化的12种方式 - 知乎
zhao.tang
No ratings yet
Ch14-Dealing With Uncertainty
Document36 pages
Ch14-Dealing With Uncertainty
Ricardo Canales
No ratings yet
简明预积分推导 - 知乎
Document13 pages
简明预积分推导 - 知乎
李金良
No ratings yet
03丨事务隔离：为什么你改了我还看不见？
Document14 pages
03丨事务隔离：为什么你改了我还看不见？
15005176312sk
No ratings yet
Ch9 遞迴副函式
Document14 pages
Ch9 遞迴副函式
林秉勳
No ratings yet
602 e 55546 Cbe 8 Caa 9894
Document10 pages
602 e 55546 Cbe 8 Caa 9894
api-620508522
No ratings yet
(6 - 21小更新) 使用VBA解決 excel web 查詢無法匯入、匯入太慢的股市資料 (第25頁) - 文書處理 - 電腦討論區 - Mobile01
Document15 pages
(6 - 21小更新) 使用VBA解決 excel web 查詢無法匯入、匯入太慢的股市資料 (第25頁) - 文書處理 - 電腦討論區 - Mobile01
Flint W
No ratings yet
06讲递归（下）：分而治之，从归并排序到MapReduce
Document24 pages
06讲递归（下）：分而治之，从归并排序到MapReduce
yunlong yu
No ratings yet
ML Final
Document18 pages
ML Final
hugo
No ratings yet
6. 近似值與估算 (Approximate values & estimation) » 齊齊溫
Document6 pages
6. 近似值與估算 (Approximate values & estimation) » 齊齊溫
屈機
No ratings yet
6. 近似值與估算 (Approximate values & estimation) » 齊齊溫
Document8 pages
6. 近似值與估算 (Approximate values & estimation) » 齊齊溫
屈機
No ratings yet
凯哥讲义合集
Document438 pages
凯哥讲义合集
jialong ji
100% (1)
30 Meta Learning
Document20 pages
30 Meta Learning
yeqing3766808
No ratings yet
4 資料整理1
Document19 pages
4 資料整理1
莫秋萍F3F12
No ratings yet
20200222 光大证券机器学习系列报告之五：锦上添花，机器学习算法助力组合优化
Document24 pages
20200222 光大证券机器学习系列报告之五：锦上添花，机器学习算法助力组合优化
吴员福
No ratings yet
吴恩达倾情推荐！这28张图全解深度学习知识真棒！ - 知乎
Document32 pages
吴恩达倾情推荐！这28张图全解深度学习知识真棒！ - 知乎
Yang Cao
No ratings yet
決策樹分析
Document61 pages
決策樹分析
api-26693386
No ratings yet
CLAD Sample Exam-2
Document24 pages
CLAD Sample Exam-2
Xiang Liu
No ratings yet
离散作业
Document6 pages
离散作业
h67x0hck
No ratings yet
齐鑫搜索方法中的剪枝优化
Document29 pages
齐鑫搜索方法中的剪枝优化
visitworld
No ratings yet
abaqus系列教程 09显式非线性动态分析
Document34 pages
abaqus系列教程 09显式非线性动态分析
xiaoyud
No ratings yet
第二讲第三周
Document14 pages
第二讲第三周
1029115369
No ratings yet
1016
Document6 pages
1016
Hao Suen
No ratings yet
Psih Stat 2 Spss
Document4 pages
Psih Stat 2 Spss
ivavukoja
No ratings yet
P6入门初学配套资料
Document166 pages
P6入门初学配套资料
张小飞
No ratings yet
02 FRM Þ Ò× Íìâ À - ÊÐ ¡ çÏÕ - Ð Ì ÌÓý
Document17 pages
02 FRM Þ Ò× Íìâ À - ÊÐ ¡ çÏÕ - Ð Ì ÌÓý
Stacey Liu
No ratings yet
2017科学二3
Document8 pages
2017科学二3
Cheong Weng Choy
No ratings yet
Flexible Link Courseware Sample For MATLAB Users
Document11 pages
Flexible Link Courseware Sample For MATLAB Users
my Zhang
No ratings yet
陈保罗20211114
Document2 pages
陈保罗20211114
反弹
No ratings yet
CH 6
Document13 pages
CH 6
哲哲啊
No ratings yet
陈保罗20211107 LYDROO (QIAN)
Document3 pages
陈保罗20211107 LYDROO (QIAN)
反弹
No ratings yet
HPC解决方案调优指南鲲鹏解决方案鲲鹏论坛-华为云论坛
Document16 pages
HPC解决方案调优指南鲲鹏解决方案鲲鹏论坛-华为云论坛
hellodd
No ratings yet
43619434张亦弛数学实验报告
Document11 pages
43619434张亦弛数学实验报告
Yichi Zhang
No ratings yet
Brownian Motion Report
Document16 pages
Brownian Motion Report
Snooker King
No ratings yet
1emp Introduction 2021 Fall
Document24 pages
1emp Introduction 2021 Fall
陈新
No ratings yet
01丨可见性、原子性和有序性问题：并发编程Bug的源头
Document18 pages
01丨可见性、原子性和有序性问题：并发编程Bug的源头
蘑菇点点
No ratings yet
VASP计算的理论及实践总结
Document18 pages
VASP计算的理论及实践总结
Qi LIU
No ratings yet
海通证券选股因子系列研究（八十八）：多颗粒度特征的深度学习模型，探索和对比
Document19 pages
海通证券选股因子系列研究（八十八）：多颗粒度特征的深度学习模型，探索和对比
zhaoqc418
No ratings yet
01科学技能
Document5 pages
01科学技能
Wai Yee
No ratings yet
来煜坤把握本质，灵活运用动态规划的深入探讨
Document37 pages
来煜坤把握本质，灵活运用动态规划的深入探讨
visitworld
No ratings yet