3.2 Bài toán điều khiển tối ưu dạng tuyến tính toàn phương
3.2.3 Đánh giá sai số
Các định lý trong Mục này được chứng minh chi tiết trong [5], chúng tôi đưa vào phần này nhằm cung cấp đầy đủ các kết quả đạt được khi sử dụng phương pháp trực tiếp để giải một bài toán điều khiển dạng tuyến tính toàn phương chịu nhiễu kì dị và cung cấp sơ lược ý tưởng chứng minh.
Đặt
Zn(t, ε) =
n
X
k=0
εk(zk(t) + Πkz(τ0) +Qkz(τ1)),
Un(t, ε) =
n
X
k=0
εk(uk(t) + Πku(τ0) +Qku(τ1)).
Định lý 3.2.6. Với mọi t ∈ [0, T] và tham số ε đủ nhỏ, xấp xỉ tiệm cận bậc n của bài toán Pε: Zn(t, ε), Un(t, ε) thỏa mãn tính chất
∥Zn(t, ε)−z∗(t, ε)∥ ≤ cεn+1, ∥Un(t, ε)−u∗(t, ε)∥ ≤ cεn+1,
Jε(Un)−Jε(u∗)≤ cε2(n+2),
(3.52)
trong đó z∗(t, ε) là nghiệm tối ưu của bài toán Pε ứng với biến điều khiển tối ưu u∗(t, ε).
Nhận xét: Dễ dàng nhận thấy các hệ số của (3.17) xác định từ các bài toán tối ưu thành phần thu được bằng phương pháp trực tiếp sẽ trùng với các bài toán biên thu được từ phân tích trực tiếp bài toán biên hai điểm (3.2)-(3.6) thu được từ điều kiện tối ưu của bài toán Pε. Do vậy quy trình đánh giá sai số của nghiệm tiệm cận thu được từ phương pháp trực tiếp cũng sẽ tương tự như đánh giá sai số của bài toán biên chịu nhiễu kì dị trong Mục 2.2. Do vậy hai bất đẳng thức đầu tiên của Định lý 3.2.6 được thỏa mãn.
Gọi Ze là nghiệm của Pε khi u = Un. Khi đó ta có thể biểu diễn z∗ =
Ze+δz và u∗ = Un+ ∆u. Thế các biểu diễn này vào (3.2), (3.3) suy ra δz là nghiệm của bài toán
δx˙ = A1(t, ε)δx +A2(t, ε)δy+B1(t, ε)∆u, εδy˙ = A3(t, ε)δx+A4(t, ε)δy+B2(t, ε)∆u,
(3.53)
với điều kiện ban đầu
δx(0, ε) = 0, δy(0, ε) = 0. (3.54)
Với ∆u = u∗ −Un thỏa mãn đánh giá thứ hai trong (3.52), bài toán đánh giá nghiệm δz của (3.53), (3.54) tương tự như bài toán đánh giá sai số của bài toán ban đầu chịu nhiễu kì dị trong Mục 2.1.3. Với ε đủ nhỏ, từ điều kiện 1 cuối Mục 3.2.2, ta có các giá trị riêng của ma trận A4(t, ε) đều có phần thực âm. Do vậy nghiệm δz của (3.53), (3.54) thỏa mãn
∥δz(t, ε)∥ ≤cεn+1. (3.55)
Với u∗ là nghiệm tối ưu của bài toán Pε và Un là một biến điều khiển chấp nhận được bất kì, theo chứng minh điều kiện đủ của Định lý 3.2.1 Mục 3.2.1, tương tự (3.7) ta có
Jε(Un)−Jε(u∗) = 1
2 Z T
0
(⟨δz,W(t, ε)δz⟩+⟨∆u, R(t, ε)∆u⟩)dt. (3.56)
Do ∆u= u∗−Un thỏa mãn đánh giá thứ hai trong (3.52), kết hợp với đánh giá (3.55) ta thu được bất đẳng thức thứ ba trong (3.52).
Một ưu điểm của phương pháp trực tiếp giúp ta đưa ra được kết luận rằng giá trị của phiếm hàm Jε(u) sẽ không tăng khi các xấp xỉ bậc cao hơn của điều khiển tối ưu được sử dụng.
Định lý 3.2.7. Với ε đủ nhỏ ta có
Jε(Un−1) ≥ Jε(Un−1+εnun) ≥ Jε(Un).
Chứng minh xem [5]
3.2.4 Ví dụ minh họa Xét bài toán cực tiểu hóa phiếm hàm
Jε(u) = 1
2 Z 1
0
(x2+ 2xy+ 3y2+u2)dt, (3.57) trên quỹ đạo nghiệm của hệ
˙ x= (1 +ε)x, εy˙ = −y+u, (3.58) với điều kiện ban đầu
x(0, ε) = −1, y(0, ε) = 1. (3.59)
Nghiệm chính xác của bài toán được xác định từ hệ sau
˙ x= (1 +ε)x, εy˙ = −y +u,
˙ φ = −(1 +ε)φ+x+y, εψ˙ = ψ +x+ 3y,
ψ =u, x(0, ε) = −1, y(0, ε) = 1, φ(1, ε) = 0, ψ(1, ε) = 0.
(3.60)
Có Π0x(τ0) ≡ 0, Q0x(τ1) ≡ 0.
Các hàm chính quy bậc không là nghiệm của bài toán
J0(u0) = 1
2 Z 1
0
(x20+ 2x0y0+ 3y20+u20)dt →min
u0
, x˙0 =x0, 0 = −y0+u0, x0(0) = −1.
(3.61)
Nghiệm của (3.61) được tìm từ hệ sau
x˙0 = x0, 0 = −y0+u0
φ˙0 = −φ0+x0+y0, 0 =ψ0+x0+ 3y0 ψ0 = u0, x0(0) = −1, φ0(1) = 0.
(3.62)
Giải hệ (3.62) ta thu được
x0(t) = −et, φ0(t) =−3
8et + 3
8e2−t,
y0(t) = u0(t) =ψ0(t) = 1
4et.
Dựa trên (3.38), các hàm số biên bậc không trong lân cận của t = 0 được xác định từ bài toán
Π0J = 1
2 Z ∞
0
((Π0x)2+ 2Π0xΠ0y + 3(Π0y)2+ (Π0u)2)dτ0 →min
Π0u, dΠ0x
dτ0 = 0, dΠ0y
dτ0 = −Π0y + Π0u,
Π0x(∞) = 0, Π0y(0) = 1−y0(0) = 3
4.
(3.63)
Nghiệm của bài toán (3.63) theo Định lý 3.2.3 được tìm từ việc giải hệ
dΠ0x dτ0 = 0, dΠ0y
dτ0 = −Π0y+ Π0u, dΠ0φ
dτ0
= Π0x+ Π0y, dΠ0ψ
dτ0
= Π0ψ+ Π0x+ 3Π0y,
Π0ψ = Π0u, Π0x(∞) = 0, Π0y(0) = 3
4, Π0φ(∞) = 0, Π0ψ(∞) = 0.
Nghiệm của hệ này là
Π0x(τ0) = 0, Π0φ(τ0) = −3
8e−2τ0,
Π0y(τ0) = 3
4e−2τ0, Π0u(τ0) = Π0ψ(τ0) = −3
4e−2τ0. Dựa trên (3.39), các hàm số biên bậc không trong lân cận của t = T được xác định từ bài toán
Q0J = 1
4eQ0y(0) + 1
2 Z ∞
0
((Q0x)2+ 2Q0xQ0y
+ 3(Q0y)2+ (Q0u)2)dτ1 → min
Q0u, dQ0x
dτ1
= 0, dQ0y
dτ1
= −Q0y +Q0u, Q0x(−∞) = 0, Q0y(−∞) = 0.
(3.64)
Nghiệm của bài toán (3.64) theo Định lý 3.2.4 được giải từ hệ sau
dQ0x dτ1 = 0, dQ0y
dτ1 = −Q0y+Q0u, dQ0φ
dτ1 = Q0x+Q0y, dQ0ψ
dτ1 =Q0ψ +Q0x+ 3Q0y,
Q0ψ = Q0u,
Q0x(−∞) = 0, Q0y(−∞) = 0, Q0φ(−∞) = 0, Q0ψ(0) =−1
4e.
Giải hệ này ta thu được nghiệm là
Q0x(τ1) = 0, Q0φ(τ1) = − 1
24e1+2τ1,
Q0y(τ1) =− 1
12e1+2τ1, Q0u(τ1) =Q0ψ(τ1) =−1
4e1+2τ1. Như vậy ta đã xác định được tất cả các hệ số của xấp xỉ tiệm cận bậc không của nghiệm của bài toán gốc.
Nghiệm chính xác của bài toán gốc (được xác định bằng thủ tục giải
Hình 3.1 - 3.2, trong đó nghiệm chính xác được vẽ bằng nét liền, nghiệm suy biến được vẽ bằng nét đứt, xấp xỉ bậc không được vẽ bằng đường gồm các điểm hình tròn.
Hình 3.1: Đồ thị của x(t, ε) và các xấp xỉ Hình 3.2: Đồ thị của y(t, ε) và các xấp xỉ
Hình 3.3: Đồ thị của u(t, ε) và các xấp xỉ
Kết luận
Luận văn được hoàn thành tại Khoa Toán - Cơ - Tin học trường Đại học KHTN, ĐHQGHN trên cơ sở của sách chuyên khảo [9] và bài báo [5]
về việc sử dụng phương pháp hàm lớp biên để tìm nghiệm tiệm cận cho bài toán chịu nhiễu kì dị với giá trị ban đầu và bài toán giá trị biên, và sử dụng phương pháp này trong sơ đồ trực tiếp để tìm nghiệm tiệm cận của bài toán điều khiển tối ưu dạng tuyến tính toàn phương. Kết quả chính của luận văn là
- Trình bày lại quy trình xây dựng nghiệm tiệm cận cho các bài toán chịu nhiễu kì dị với giá trị ban đầu và giá trị biên.
- Chứng minh lại điều kiện cần và đủ, cũng như sự tồn tại duy nhất nghiệm của bài toán điều khiển tối ưu chịu nhiễu kì dị dạng tuyến tính - toàn phương. Sử dụng phương pháp sơ đồ trực tiếp để xây dựng nghiệm tiệm cận của bài toán.
- Bổ sung các giải thích cho một số tính chất xuất hiện trong luận văn, đưa thêm các ví dụ bao gồm hình minh họa cho mỗi nghiệm tiệm cận thu được của các bài toán cụ thể.
Các kết quả thu được còn khá khiêm tốn, các ví dụ minh họa còn đơn giản (chủ yếu là hệ số hằng). Tuy nhiên nội dung chính của luận văn là cơ sở để có thể áp dụng với một lớp rộng các bài toán dạng khác như: phương trình sai phân, phương trình vi tích phân, các bài toán dạng tới hạn, ....
Tài liệu tham khảo
[1] S. V. Belokopytov, M. G. Dmitriev (1986), “Direct Scheme in Optimal Control Problems with Fast and Slow Motions”, Syst. Contr. Lett., 8 (2), pp. 129—135.
[2] S. V. Belokopytov, M. G. Dmitriev (1989), “Solution of the Classic Optimal Control Problems with a Boundary Layer”, Avtom. Tele- mekh., 7, pp. 71—82.
[3] M. G. Dmitriev and G. A. Kurina (2006), “Singular Perturbations in Control Problems”, Avtom. Telemekh., 1, pp. 3-–51.
[4] G. A. Kurina (1993), “Singular pertubations of control problems with equation of state not solved for the derivative (a survey)”,J. Comput.
Syst. Int., 31(6), pp. 17–45.
[5] G. A. Kurina, T. H. Nguyen (2012), “Asymptotic Solution of Sin- gularly Perturbed Linear-Quadratic Optimal Control Problems with Discontinuous Coefficients”, Comput. Math. Math. Phys., 52(4), pp.
524–547.
[6] A. Tikhonov (1948), “On the dependence of the solutions of differen- tial equations on a small parameter”, Mat. Sbornik, 22, pp. 193–204.
[7] A. Tikhonov (1950), “On a system of differential equations containing parameters”, Mat. Sbornik, 27, pp. 147–156.
[8] A. Tikhonov (1952), “Systems of differential equations containing small parameters in the derivatives”, Mat. Sbornik, 31, pp. 575–586.