Welcome to Scribd!

Skip carousel

Recitation 13 Slides - DP

Uploaded by

ptkien

0% found this document useful (0 votes)

11 views16 pages

Recitation 13 Slides -DP

Original Title

Recitation 13 Slides -DP

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Recitation 13 Slides -DP

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

11 views16 pages

Recitation 13 Slides - DP

Uploaded by

ptkien

Recitation 13 Slides -DP

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 16

Search inside document

Dynamic Programming and Optimal

Control
Final Recitation

Dario Brescianini, Robin Ritz | 17.12.2014 |

Outline

Overview
Dynamic Programming Algorithm (DPA)
Deterministic Systems and the Shortest Path (SP)
Infinite Horizon Problems, Stochastic SP
Deterministic Continuous-Time Optimal Control

Dario Brescianini, Robin Ritz | 17.12.2014 |

Overview

Dario Brescianini, Robin Ritz | 17.12.2014 |

Dynamic Programming Algorithm (DPA)

Basic Problem

Alternative Problem Formulation

Reformulations
Time lag, correlated disturbances, forecasts,

Dario Brescianini, Robin Ritz | 17.12.2014 |

Dynamic Programming Algorithm (DPA)

Basic idea: Principle of Optimality
Algorithm:

Minimizing the recursion equation for each

us the optimal policy:

and

gives

Dario Brescianini, Robin Ritz | 17.12.2014 |

Deterministic Systems and the Shortest Path

Consider now problems where

is a finite set,
No disturbance
.

Convert DP to SP (and vice versa)

DP:

SP:

Viterbi Algorithm
Dario Brescianini, Robin Ritz | 17.12.2014 |

Deterministic Systems and the Shortest Path

DP finds all optimal paths to end node. Sometimes not
needed.
Exploit structure of these problems to come up with
efficient algorithms for solving shortest path problems:
Label Correcting Algorithm
Step 1: Remove a node i from OPEN and for each child j of i,
execute step 2.
Step 2: If di + aij < min{dj,UPPER}, set dj = di + aij and set i to be the
parent of j. In addition, if jt, place j in OPEN if it is not already in
OPEN, while if j=t, set UPPER to the new value di+ait of dt.

Step 3: If OPEN is empty, terminate; else go to step 1.

Dario Brescianini, Robin Ritz | 17.12.2014 |

Infinite Horizon Problems

Consider time-invariant system with infinite horizon:

Optimal policy is stationary:

Optimal cost solves Bellmans equation:

Dario Brescianini, Robin Ritz | 17.12.2014 |

Infinite Horizon Problems: Stochastic Shortest Path

Stochastic Shortest Path problems:

Cost-free termination state :

a policy and an integer
such that:

Dario Brescianini, Robin Ritz | 17.12.2014 |

Infinite Horizon Problems: Stochastic Shortest Path

Value iteration:
Step 1: Choose an initial guess
.
Step 2: Update cost values with the value iteration formula:

Step 3: If

converged for all , terminate. Else go to step 2.

Dario Brescianini, Robin Ritz | 17.12.2014 | 10

Infinite Horizon Problems: Stochastic Shortest Path

Policy iteration:
Step 1: Choose an initial stationary policy .
Step 2: Policy evaluation (compute cost of current policy):
(lin. sys. of eq.)

Step 3: Policy improvement (find a better policy):

Step 4: If

for all , terminate. Else go to step 2.

Dario Brescianini, Robin Ritz | 17.12.2014 | 11

Infinite Horizon Problems: Stochastic Shortest Path

Linear programming:
Optimal cost

For each admissible pair

solves the following linear program:

we get one linear constraint

Dario Brescianini, Robin Ritz | 17.12.2014 | 12

Infinite Horizon Problems: Discounted Problems

Discounted problems:

Discounted cost:

Dario Brescianini, Robin Ritz | 17.12.2014 | 13

Deterministic Continuous-Time Optimal Control

Basic Problem

No noise: deterministic.
Goal: Find an admissible control trajectory
,
,
and corresponding state trajectory
which minimize
the cost.
Solution is found by HJB or Minimum Principle.

Dario Brescianini, Robin Ritz | 17.12.2014 | 14

Deterministic Continuous-Time Optimal Control

Hamilton-Jacobi-Bellman Equation (cont.-time analog to DPA)

Derived by discretizing and taking limits of DPA.

Partial differential equation. Very hard to solve!
Usually guess a solution and proof that is satisfies HJB.

Sufficient condition.
Optimal policy:

that minimize RHS of HJB.

Dario Brescianini, Robin Ritz | 17.12.2014 | 15

Deterministic Continuous-Time Optimal Control

Minimum Principle (Only finds optimal solution for a specific initial condition
Define Hamiltonian:
Then:

Only necessary conditions.

Various extensions (e.g. fixed terminal state, ).
Dario Brescianini, Robin Ritz | 17.12.2014 | 16

Numerical Computing With Python (En)
Document676 pages
Numerical Computing With Python (En)
tsalmy
100% (1)
Deep Reinforcement Learning Python Distributional 2nd
Document761 pages
Deep Reinforcement Learning Python Distributional 2nd
Fajar Maulana
80% (5)
Presentations on the Critical Path Method
From Everand
Presentations on the Critical Path Method
Robert Perrine
Rating: 1 out of 5 stars
1/5 (2)
Machine Learning in Finance: Matthew F. Dixon Igor Halperin Paul Bilokon
Document565 pages
Machine Learning in Finance: Matthew F. Dixon Igor Halperin Paul Bilokon
Kumar Manoj
67% (6)
Linear Programming - Graphical Solution
Document17 pages
Linear Programming - Graphical Solution
Tunisha Bhadauria
100% (1)
Practical Reinforcement Learning
Document270 pages
Practical Reinforcement Learning
sravan
100% (2)
BOOK - Heuristics, Probability and Causality - A Tribute To Judea Pearl
Document573 pages
BOOK - Heuristics, Probability and Causality - A Tribute To Judea Pearl
Bruno Brito
No ratings yet
High-Performance PIC24 Microcontroller Family: 16-Bit Microcontrollers
Document6 pages
High-Performance PIC24 Microcontroller Family: 16-Bit Microcontrollers
ptkien
No ratings yet
Finite Difference Methods in Financial Engineering: A Partial Differential Equation Approach
From Everand
Finite Difference Methods in Financial Engineering: A Partial Differential Equation Approach
Daniel J. Duffy
No ratings yet
Introduction to Stochastic Dynamic Programming
From Everand
Introduction to Stochastic Dynamic Programming
Sheldon M. Ross
No ratings yet
Integer
Document54 pages
Integer
Dhruti Gadhiya
No ratings yet
Ch11Integer Goal Programming
Document54 pages
Ch11Integer Goal Programming
Angelina Wattss
No ratings yet
Theory: Assignment Problems
Document5 pages
Theory: Assignment Problems
nilkanth bhatt
No ratings yet
Rejinpaul Question Bank: Cs6704 - Resource Management Techniques Question Bank Vii Semester
Document27 pages
Rejinpaul Question Bank: Cs6704 - Resource Management Techniques Question Bank Vii Semester
Siva M
No ratings yet
Linear Programming Basic Concepts and Graphical Solutions
Document7 pages
Linear Programming Basic Concepts and Graphical Solutions
gtmani123
No ratings yet
CS6704 - RESOURCE OPTIMIZATION
Document31 pages
CS6704 - RESOURCE OPTIMIZATION
Jayaprakash Jayaraman
No ratings yet
Lecture 8 Dynamic Programming
Document32 pages
Lecture 8 Dynamic Programming
chalie molla
No ratings yet
OR Quiz
Document5 pages
OR Quiz
abhik789
75% (4)
Unit 2
Document21 pages
Unit 2
Rebecca Sanchez
No ratings yet
Linear Programing: Simplex Method Through Case Study: by Group No. 16
Document30 pages
Linear Programing: Simplex Method Through Case Study: by Group No. 16
Minhajur Rahman Joy
No ratings yet
HND in Computing and Software Engineering: Lesson 04 - Algorithmic Paradigms
Document16 pages
HND in Computing and Software Engineering: Lesson 04 - Algorithmic Paradigms
silly pei
No ratings yet
Riset Operasional Chapter 2
Document28 pages
Riset Operasional Chapter 2
Annisa Rahmawaty
No ratings yet
DMOP Gyan Kosh
Document24 pages
DMOP Gyan Kosh
*Maverick*
No ratings yet
LPP, MCDM, and OR identification quiz
Document5 pages
LPP, MCDM, and OR identification quiz
KANCHANAPALLI KARTHIKEYA
No ratings yet
Violations of LP Conditions
Document28 pages
Violations of LP Conditions
WANJIRUKAMAU
No ratings yet
Module - 7 Lecture Notes - 1 Integer Linear Programming
Document7 pages
Module - 7 Lecture Notes - 1 Integer Linear Programming
swapna44
No ratings yet
All Integer Linear Programming
Document17 pages
All Integer Linear Programming
slv_prasaad
100% (1)
3.1. LPM + Graphic Approach
Document44 pages
3.1. LPM + Graphic Approach
Endashaw Debru
No ratings yet
08 Uc2
Document18 pages
08 Uc2
ali
No ratings yet
The Design and Analysis of Approximation Algorithms: Facility Location As A Case Study
Document13 pages
The Design and Analysis of Approximation Algorithms: Facility Location As A Case Study
Vaibhav Acharya
No ratings yet
Ske Ada
Document46 pages
Ske Ada
sid
No ratings yet
Optimization Techniques
Document67 pages
Optimization Techniques
Istabnul Branch
No ratings yet
Branch and cut - optimization
Document6 pages
Branch and cut - optimization
codevalley.67
No ratings yet
Integer Programming, Goal Programming, and Nonlinear Programming
Document54 pages
Integer Programming, Goal Programming, and Nonlinear Programming
Aashrith Parvathaneni
No ratings yet
DAAImp Questions
Document6 pages
DAAImp Questions
harini
No ratings yet
Simplex Method Microsoft Office PowerPoint Presentation
Document5 pages
Simplex Method Microsoft Office PowerPoint Presentation
Chetanhar singh
No ratings yet
Integer Programming and Goal Programming: To Accompany
Document79 pages
Integer Programming and Goal Programming: To Accompany
Felix Budi Santosa
No ratings yet
New Multiobjective Optimization Algorithm Using NB
Document6 pages
New Multiobjective Optimization Algorithm Using NB
azeroil nabil
No ratings yet
Greedy & Dynamic Programming Techniques
Document217 pages
Greedy & Dynamic Programming Techniques
DEEPANSHU LAMBA (RA2111003011239)
No ratings yet
Chapter 14
Document86 pages
Chapter 14
Raymond Honggo
No ratings yet
STEPS TO SOLVE LINEAR PROGRAMMING
Document3 pages
STEPS TO SOLVE LINEAR PROGRAMMING
Kushal Dey
No ratings yet
What Is Dynamic Programming?
Document2 pages
What Is Dynamic Programming?
Hitesh Sangwan
No ratings yet
Parallel Algo Techniques
Document2 pages
Parallel Algo Techniques
Rajinder Sanwal
No ratings yet
Linear Programming Nonnegative Variables
Document5 pages
Linear Programming Nonnegative Variables
chxrlttx
No ratings yet
Solved - An Investigator Has Reported The Data Tabulated Below. ...
Document3 pages
Solved - An Investigator Has Reported The Data Tabulated Below. ...
a
No ratings yet
Simplex Method
Document13 pages
Simplex Method
Shikha Bhotika
No ratings yet
Linear Programming (I) : DR Arnold Yuan MON305, Ext. 6463 Arnold - Yuan@ryerson - Ca
Document21 pages
Linear Programming (I) : DR Arnold Yuan MON305, Ext. 6463 Arnold - Yuan@ryerson - Ca
Kifayat Ullah Khalil
No ratings yet
Sadasdsadsadsad
Document25 pages
Sadasdsadsadsad
saurav Nepal
No ratings yet
Unit I: Operations Research Formulation, Graphicaland Simplex Methods
Document21 pages
Unit I: Operations Research Formulation, Graphicaland Simplex Methods
JITIN01007
No ratings yet
1 Introduction
Document24 pages
1 Introduction
tenpointer
No ratings yet
Unit - 4 PDF
Document25 pages
Unit - 4 PDF
Nivitha
No ratings yet
Online Text Editor PDF
Document2 pages
Online Text Editor PDF
Shreyash Ekbote
No ratings yet
Operations Research: Chapter 3 (I)
Document39 pages
Operations Research: Chapter 3 (I)
Ashish Banstola
No ratings yet
Gyaan Kosh Term 2: Decision Models and Optimization
Document15 pages
Gyaan Kosh Term 2: Decision Models and Optimization
U KUNAL
No ratings yet
Design and Analysis of Algorithms-5
Document26 pages
Design and Analysis of Algorithms-5
Tejas Dhage
No ratings yet
Dynamic Programming: Briana B. Morrison With Thanks To Dr. Hung
Document52 pages
Dynamic Programming: Briana B. Morrison With Thanks To Dr. Hung
shivdas_kanade
No ratings yet
Comparing algorithm design approaches
Document4 pages
Comparing algorithm design approaches
Gulsher Naeem
No ratings yet
DAA Assignment 1
Document4 pages
DAA Assignment 1
Gulsher Naeem
No ratings yet
Vijay Maths Project
Document54 pages
Vijay Maths Project
Vijay M
No ratings yet
Dynamic Programming
Document14 pages
Dynamic Programming
eric_whore
No ratings yet
Linear Programming
Document1 page
Linear Programming
Dipesh Yadav
No ratings yet
Linear Programming Chapter Summary
Document7 pages
Linear Programming Chapter Summary
Amaia Martinicorena
No ratings yet
Step 1
Document3 pages
Step 1
dheerajgulati_31
No ratings yet
Dynamic Programming
Document2 pages
Dynamic Programming
jeganvishnu22
No ratings yet
Random Optimization: Fundamentals and Applications
From Everand
Random Optimization: Fundamentals and Applications
Fouad Sabry
No ratings yet
Mathematical Optimization: Fundamentals and Applications
From Everand
Mathematical Optimization: Fundamentals and Applications
Fouad Sabry
No ratings yet
Dynamic Programming and Optimal Control: Third Edition Dimitri P. Bertsekas
Document54 pages
Dynamic Programming and Optimal Control: Third Edition Dimitri P. Bertsekas
Rachit Shah
No ratings yet
DP Slides 2012
Document282 pages
DP Slides 2012
ptkien
No ratings yet
G191 e
Document28 pages
G191 e
ptkien
No ratings yet
Ocosii On Dspic
Document32 pages
Ocosii On Dspic
ptkien
No ratings yet
Spectrum Dynamic Range5968-4545E
Document16 pages
Spectrum Dynamic Range5968-4545E
heliper
No ratings yet
Multivariable Feedback Control - Analysis and Design
Document585 pages
Multivariable Feedback Control - Analysis and Design
Israel Gutierrez
No ratings yet
Momentum Theory
Document14 pages
Momentum Theory
ptkien
No ratings yet
Multi-Agent Deep Reinforcement Learning: Maxim Egorov Stanford University
Document8 pages
Multi-Agent Deep Reinforcement Learning: Maxim Egorov Stanford University
Creativ Pinoy
No ratings yet
A Concise Introduction To Reinforcement Learning: February 2018
Document12 pages
A Concise Introduction To Reinforcement Learning: February 2018
NirajDhotre
No ratings yet
3 Markov Decision Processes
Document70 pages
3 Markov Decision Processes
yilvas
No ratings yet
Precept 9
Document24 pages
Precept 9
Julia Hines
No ratings yet
Losse Strak
Document40 pages
Losse Strak
rosa sousa
No ratings yet
Energy Allocation and Utilization For Wirelessly Powered Iot Networks
Document11 pages
Energy Allocation and Utilization For Wirelessly Powered Iot Networks
Fritz Fatiga
No ratings yet
Textbook Solutions Expert Q&A Practice: Find Solutions For Your Homework
Document4 pages
Textbook Solutions Expert Q&A Practice: Find Solutions For Your Homework
Malik Asad
0% (1)
Super Important ML
Document16 pages
Super Important ML
read4free
No ratings yet
Artificial Intelligence CS188 Midterm1 Solutions
Document28 pages
Artificial Intelligence CS188 Midterm1 Solutions
potpouri
No ratings yet
RL and control algorithms
Document7 pages
RL and control algorithms
ShubhamKhodiyar
No ratings yet
CSD311: Artificial Intelligence
Document11 pages
CSD311: Artificial Intelligence
Ayaan Khan
No ratings yet
Optimizing A Dynamic Order-Picking Process: Yossi Bukchin, Eugene Khmelnitsky, Pini Yakuel
Document26 pages
Optimizing A Dynamic Order-Picking Process: Yossi Bukchin, Eugene Khmelnitsky, Pini Yakuel
Arief Setiawan
No ratings yet
Artificial Intelligence For Managers: Certificate Programme in
Document12 pages
Artificial Intelligence For Managers: Certificate Programme in
Satyabala Hariharan
No ratings yet
Machine Learning Assignment
Document55 pages
Machine Learning Assignment
Akash
No ratings yet
Optimal strategy for dice game minimax
Document15 pages
Optimal strategy for dice game minimax
Anton Max
No ratings yet
Automated (AI) Planning: Autonomous Systems
Document53 pages
Automated (AI) Planning: Autonomous Systems
Azeddine Boughmar
No ratings yet
Real-Time Bidding by Reinforcement Learning in Display Advertising
Document10 pages
Real-Time Bidding by Reinforcement Learning in Display Advertising
mevasacomerlapolla
No ratings yet
Exam Prep 4 Solutions: Q1. MDPS: Dice Bonanza
Document4 pages
Exam Prep 4 Solutions: Q1. MDPS: Dice Bonanza
AskIIT Ian
No ratings yet
Static and Dynamic Appointment Scheduling To Improve Patient Access Time
Document13 pages
Static and Dynamic Appointment Scheduling To Improve Patient Access Time
Ben Sghaier Sayda
No ratings yet
2pageresume Shambhavi
Document2 pages
2pageresume Shambhavi
Saiprakash Bandi
No ratings yet
Risk-Constrained Markov Decision Processes
Document6 pages
Risk-Constrained Markov Decision Processes
Sruthiy
No ratings yet
CS229 Problem Set #4 Neural Networks, EM Algorithm, and Convergence
Document10 pages
CS229 Problem Set #4 Neural Networks, EM Algorithm, and Convergence
nxp He
No ratings yet
Reinforcement Learning-Based Routing Protocols in
Document60 pages
Reinforcement Learning-Based Routing Protocols in
Norsyasya MN
No ratings yet
Ass1 Merged Merged
Document19 pages
Ass1 Merged Merged
Akash Sahu
No ratings yet
Youssef Hamadi, Eric Monfroy, Frédéric Saubion (Auth.), Youssef Hamadi, Eric Monfroy, Frédéric Saubion (Eds.) - Autonomous Search-Springer-Verlag Berlin Heidelberg (2012)
Document307 pages
Youssef Hamadi, Eric Monfroy, Frédéric Saubion (Auth.), Youssef Hamadi, Eric Monfroy, Frédéric Saubion (Eds.) - Autonomous Search-Springer-Verlag Berlin Heidelberg (2012)
Alvaro Gómez Rubio
No ratings yet