Professional Documents
Culture Documents
u (t ) y (t )
Đối tượng
điều khiển y * (t ) min y (t ) r (t )
u * (t ) u (t )
Xác định công thức học lặp: u k 1 (t ) f l u k ( ), y k ( ), t với 0,T , k 0,1, , N
để có: y (t ) r (t )
N
1
Các bước xây dựng bộ điều khiển học lặp (ILCler)
Gán k 0 u0 (t ), t 0,T
đúng
Ghi nhận N k
u N (t ) f l uN 1 ( ), y N 1 ( ), t
Kết thúc quá trình học. Đưa u j (t ), j N vào điều khiển đối tượng
2
Đặc điểm của bộ điều khiển học lặp (ILCler)
uk
lần thử thứ k
ek
u k 1
lần thử thứ k 1
e k 1
t 1 t t 1 T
3
Đặc điểm của bộ điều khiển học lặp (ILCler) – tiếp
Học lặp bậc cao
r (t ) Bộ nhớ + Học y k (t )
u k (t )
u k 1 ( ), e k 1 ( ), Đối tượng
điều khiển
0 T , k N
Chất lượng điều khiển phụ thuộc vào công thức học lặp:
u k 1 (t ) f u k ( ),e k ( ), t , 0 T
l
4
Đặc điểm của bộ điều khiển học lặp (ILCler) – tiếp
Khả năng tồn tại của hàm học
Nhiệm vụ của quá trình học là xác định được u N (t ) để với nó đầu ra y N (t ) tương ứng của hệ
thỏa mãn:
y (t ) r (t ) với mọi 0
N
trong đó r (t ) là tín hiệu đặt trước mà hệ cần phải bám theo. Như vậy, câu hỏi đặt ra là hệ phải
có tính chất gì thì với mọi tín hiệu đặt r (t ) sẽ luôn tồn tại dãy u k (t ) để có y (t ) r (t ) . Câu
k
trả lời trước mắt đã có cho hệ tuyến tính, như sau. Nếu hệ tuyến tính:
x Ax Bu 1
y C x với ma trận hàm truyền G (s ) C sI A B
là thực dương chặt (strict positive real), thì luôn tồn tại hai ma trận đối xứng xác định dương Q
và P để có:
AT P PA Q và PB C T
Khi đó với mọi hàm r (t ) khả vi cho trước luôn tồn tại u d (t ) để có y d (t ) r (t ) . Những hệ này
được gọi là “khả nghịch”. Điều kiện cần cho nó là hệ phải ổn định.
5
Đặc điểm của bộ điều khiển học lặp (ILCler) – tiếp
Tổng kết
1. Là bộ điều khiển thông minh, vì không sử dụng mô hình toán của đối tượng.
2.
Tính hội tụ của quá trình học phụ thuộc hàm học u k 1 (t ) f l u k ( ), y k ( ), t được chọn
và tất nhiên còn phụ thuộc vào bản thân đặc tính động học của đối tượng điều khiển.
3. Mỗi khi thay đổi lại tín hiệu đặt r (t ) hoặc trạng thái đầu thì phải thực hiện lại quá trình học.
4. Áp dụng cho những đối tượng có quá trình làm việc lặp lại theo thời gian trong khoảng thời
gian cố định nT t (n 1)T
5. Tên gọi “learning” vì tín hiệu đầu vào u k (t ) được hiệu chỉnh lại thông qua các dữ liệu quá
khứ trước đó u k 1 ( ), y ( ), 0 T
k 1
6. Tên gọi “iterative” vì quá trình học là một quá trình lặp và chỉ kết quả cuối cùng của quá
trình học là u j (t ), j N mới sử dụng được (khác biệt so với “recursive”).
7. ILCler áp dụng cho đối tượng ổn định. Với đối tượng không ổn định người ta ổn định hóa
nó trước nhờ bộ truyền thống rồi mới áp dụng ILCler dưới dạng feedforward.
8. Khi xét tính hội tụ của quá trình học, thông thường xem u k (t ) u (k , t ) là hàm trong không
gian 2 chiều rồi sử dụng lý thuyết hệ thống 2 chiều (two dimensional system theory).
6
Một số hàm học cơ bản
1. u k 1 (t ) u k (t ) Ke k (t ) với e k (t ) r (t ) y (t )
k
2. u k 1 (t ) u k (t ) Ke k (t 1) 3. u k 1 (t ) K1u k (t ) K 2 e k (t )
4. u k 1 (t ) u k (t ) k (t )Ke k (t ) 5. u k 1 (t ) K1u k (t ) K 2 e k (t 1) K 3e k 1 (t )
Hệ liên tục
d i e k (t )
1. u k 1 (t ) u k (t ) Kek (t ) 2. u k 1 (t ) u k (t ) K
dt i
3. u k 1 (t ) K1u k (t ) K 2e k (t ) 4. u k 1 (t ) u k (t ) k (t )Ke k (t )
t
5. u k 1 (t ) u k (t ) K p ek (t ) K D ek (t ) K I ek ( )d
0
6. U k 1 (s ) L (s ) U k (s ) K E k (s )
7
Tính hội tụ của thuật học
Để xét tính hội tụ của thuật học, tức là của các hàm học:
u k 1 (t ) f u k ( ),ek ( ), t , 0 T
l
u k 1 (t ) f l u k i ( ),ek i ( ), , u k ( ),ek ( ), t , i 1, 2,
*
u k (t ) u (t ) arg min r (t ) y k (t )
u
người ta cần tới mô hình toán của đối tượng điều khiển. Ở một số trường hợp có khi họ còn
xét thêm cả T
u k uk (0), , uk (N 1)
T
8
Tính hội tụ của thuật học – tiếp
Kết luận: Luôn tồn tại dãy các giá trị k 0 , , kN 1 để với ma trận:
k0r0 0 0
kr k 0r0 0
K 2 1
kN 1rN 1 kN 1rN 1 k0r0
2. Mô hình toán
x (t 1) Ax (t ) Bu (t )
y (t ) C x (t )
9
Tính hội tụ của thuật học – tiếp
x Ax Bu d i e k (t )
và u k 1 (t ) u k (t ) K
dt i
y C x
i 1
Sẽ có tính hội tụ nếu I CA BK 1
Kết luận: Sẽ có được tính hội tụ nếu như tồn tại 0 1 thỏa mãn:
f l u k ( ), r ( ) F (u k ( ), ), t f l k ( ), r ( ) F ( k ( ), ), t u k ( ) k ( )
10
Tính hội tụ của thuật học – tiếp
Kết luận: Sẽ có được tính hội tụ nếu với mọi x và t luôn có:
I L (y )G (x ,t )B (x , t ) 1, y G (x ,t )x
Xác định tham số công thức học theo tiêu chuẩn tối ưu
Công thức hàm học:
11
ILCler cho đối tượng không ổn định
ILCer
ek ( ) u k 1 (t ) u k ( )
r (t ) y (t )
Bộ điều khiển Đối tượng
truyền thống điều khiển
u (t )
Để có được chất lượng học tốt, hệ cần ổn định. Bởi vậy ở những hệ không ổn định người ta
phải ổn định hóa nó trước và thường là nhờ một bộ điều khiển truyền thống.
Những phương pháp ổn định hóa thích hợp cho ILCler sau này thường là:
─ Bậc 2:
─ Bậc cao:
12
Cài đặt ILCer
2.5 2.5
2 2
1.5 1.5
1
1
0.5
0.5
reference Sau 1 lần học reference Sau 10 lần học
0
output 0 output
-0.5
0 20 40 60 80 100 120 0 20 40 60 80 100 120
13
Cài đặt ILCer – tiếp
Chương trình minh họa ví dụ 1 (ILCer_1)
clc
N=60;K=0.5;r=[];t=[];y=[];u=[];e=[];con=1; %T=2*N
for i=1:N
r(i)=min((i-1)*0.1,2.5);r(2*N+1-i)=r(i); %create the reference
t(i)=i-1;t(N+i)=N+i-1; %control time interval
e(i)=0;e(N+i)=0; %tracking error
end
u=r;
while con==1
for i=1:2*N-1
u(i)=u(i)+K*e(i+1);
end
u(2*N)=u(2*N)+K*e(2*N);
y(1)=1;y(2)=1; %initial values
for i=3:2*N
y(i)=u(i-1)+0.5*u(i-2)-0.7*y(i-1)-0.1*y(i-2);
end
e=r-y;
con=input('Press 1 to continue or 2 to stop: ');
end
plot(t,r,t,y);legend('reference','output');
14
Cài đặt ILCer – tiếp
2.5 2.5
2 2
1.5 1.5
1 1
15
Cài đặt ILCer – tiếp
Chương trình minh họa ví dụ 2 (ILCer_2)
clc;
N=60;K1=0.1;K2=0.15;r=[];t=[];y=[];u=[];e=[];
M=20; %number of learning steps
for i=1:N
r(i)=min((i-1)*0.1,2.5);r(2*N+1-i)=r(i); %create the reference
t(i)=i-1;t(N+i)=N+i-1; %control time interval
e(i)=0;e(N+i)=0; %tracking error
end
u=r;
for j=1:M
for i=1:2*N-1
u(i)=u(i)+K1*e(i)+K2*e(i+1); %learning function
end
u(2*N)=u(2*N)+(K1+K2)*e(2*N); %at the end time instant
y(1)=1;y(2)=0;
for i=3:2*N
y(i)=u(i-1)+0.2*u(i-2)-1.3*y(i-1)-0.4*y(i-2);
end
e=r-y;
end
plot(t,r,t,y);legend('reference','output');
16
Cài đặt ILCer – tiếp
Ví dụ 3: Kiểm chứng khả năng kháng nhiễu
z 0.2
Xét lại hệ có hàm truyền G (z ) , nhưng bây giờ có thêm nhiễu d (t ) tác động
2
ở đầu ra.
z 1.3z 0.4
Ta sẽ kiểm chứng khả năng kháng nhiễu của hai thuật học gồm:
Khi đó với K1 0.1, K 2 =K 3 0.3 sẽ có các kết quả sau 5 và 15 lần học như sau:
17
Cài đặt ILCer – tiếp
Chương trình minh họa ví dụ 3 (ILCer_3)
clc
N=100;K1=0.1;K2=0.3;K3=0.3;r=[];t=[];d=[];
y1=[];u1=[];e1=[];y2=[];u2=[];e2=[];
M=5; %number of learning steps
for i=1:N
r(i)=min((i-1)*0.1,2.5);r(2*N+1-i)=r(i); %create the reference
d(i)=0.1*random('poisson',2);d(2*N+1-i)=d(i); %external disturbance
t(i)=i-1;t(N+i)=N+i-1; %control time interval
e1(i)=0;e1(N+i)=0;e2(i)=0;e2(N+i)=0; %tracking error
end
u1=r;u2=r;
for j=1:M
u1(1)=u1(1)+(K1+K2)*e1(1)+K3*e1(2);
u2(1)=u2(1)+K1*e1(1)+K2*e1(2);
for i=2:2*N-1
u1(i)=u1(i)+K1*e1(i-1)+K2*e1(i)+K3*e1(i+1); %PID learning function
u2(i)=u2(i)+K1*e2(i)+K2*e2(i+1); %PD learning function
end
%(còn nữa)
18
Cài đặt ILCer – tiếp
19
Cài đặt ILCer – tiếp
Tổng kết
20
Những hạn chế của ILCer
21
Lịch sử và xu hướng phát triển của ILC
[1] Uchiyama,M. “Formation of high speed motion pattern of mechanical arm by trial”.
Transactions of Society of Instrumentation and Control engineer, 19(5), pp. 706-712, May
1978
[2] Arimoto,S. et.al. “Bettering operation of robot by learning”. Journal of robotic system, 1(2),
pp.123-140, March 1984
[3] Furuta,K. et.al. “The design of learning control system for multivariable systems”.
Proceedings of IEEE int. Symposium on Intelligent control”. pp.371-376, Pennsylvania,
January 1987
[4] Mitta,T. et.al. “Iterative control and its application to motion control of robot arm – A direct
approach to servo problems”. Proceedings of 24th Conference on Decision and Control, pp.
1393-1398, Florida, December 1985
[5] Moore,K.L. “Iterative learning control for deterministic systems”. London, Springer Verlag,
1993
[6] Xu,J.X. and Tan,Y. “Linear and nonlinear iterative learning control”. Springer Verlag, 2003
[7] Norrloef,M. “Iterative learning control: Analysis, Design and Experiment”. Diss., No.653,
Linkoepings University, Sweden 2000
[8] Bristow,D.A. et.al. "A Survey of Iterative Learning Control: A learning-based method for
high-performance tracking control". IEEE control systems magazine. Vol. 26. pp. 96-114.,
2006
22
Lịch sử và xu hướng phát triển của ILC – tiếp
Phân hóa thành những dạng khác nhau:
─ Repetitive:
─ Run to run:
─ Reinforcement:
23
Kết luận
24