Đánh giá sai số

3.2 Bài toán điều khiển tối ưu dạng tuyến tính toàn phương

3.2.3 Đánh giá sai số

Các định lý trong Mục này được chứng minh chi tiết trong [5], chúng tôi đưa vào phần này nhằm cung cấp đầy đủ các kết quả đạt được khi sử dụng phương pháp trực tiếp để giải một bài toán điều khiển dạng tuyến tính toàn phương chịu nhiễu kì dị và cung cấp sơ lược ý tưởng chứng minh.

Đặt

Zn(t, ε) =

k=0

εk(zk(t) + Πkz(τ0) +Qkz(τ1)),

Un(t, ε) =

k=0

εk(uk(t) + Πku(τ0) +Qku(τ1)).

Định lý 3.2.6. Với mọi t ∈ [0, T] và tham số ε đủ nhỏ, xấp xỉ tiệm cận bậc n của bài toán Pε: Zn(t, ε), Un(t, ε) thỏa mãn tính chất

∥Zn(t, ε)−z∗(t, ε)∥ ≤ cεn+1, ∥Un(t, ε)−u∗(t, ε)∥ ≤ cεn+1,

Jε(Un)−Jε(u∗)≤ cε2(n+2),

(3.52)

trong đó z∗(t, ε) là nghiệm tối ưu của bài toán Pε ứng với biến điều khiển tối ưu u∗(t, ε).

Nhận xét: Dễ dàng nhận thấy các hệ số của (3.17) xác định từ các bài toán tối ưu thành phần thu được bằng phương pháp trực tiếp sẽ trùng với các bài toán biên thu được từ phân tích trực tiếp bài toán biên hai điểm (3.2)-(3.6) thu được từ điều kiện tối ưu của bài toán Pε. Do vậy quy trình đánh giá sai số của nghiệm tiệm cận thu được từ phương pháp trực tiếp cũng sẽ tương tự như đánh giá sai số của bài toán biên chịu nhiễu kì dị trong Mục 2.2. Do vậy hai bất đẳng thức đầu tiên của Định lý 3.2.6 được thỏa mãn.

Gọi Ze là nghiệm của Pε khi u = Un. Khi đó ta có thể biểu diễn z∗ =

Ze+δz và u∗ = Un+ ∆u. Thế các biểu diễn này vào (3.2), (3.3) suy ra δz là nghiệm của bài toán

δx˙ = A1(t, ε)δx +A2(t, ε)δy+B1(t, ε)∆u, εδy˙ = A3(t, ε)δx+A4(t, ε)δy+B2(t, ε)∆u,

(3.53)

với điều kiện ban đầu

δx(0, ε) = 0, δy(0, ε) = 0. (3.54)

Với ∆u = u∗ −Un thỏa mãn đánh giá thứ hai trong (3.52), bài toán đánh giá nghiệm δz của (3.53), (3.54) tương tự như bài toán đánh giá sai số của bài toán ban đầu chịu nhiễu kì dị trong Mục 2.1.3. Với ε đủ nhỏ, từ điều kiện 1 cuối Mục 3.2.2, ta có các giá trị riêng của ma trận A4(t, ε) đều có phần thực âm. Do vậy nghiệm δz của (3.53), (3.54) thỏa mãn

∥δz(t, ε)∥ ≤cεn+1. (3.55)

Với u∗ là nghiệm tối ưu của bài toán Pε và Un là một biến điều khiển chấp nhận được bất kì, theo chứng minh điều kiện đủ của Định lý 3.2.1 Mục 3.2.1, tương tự (3.7) ta có

Jε(Un)−Jε(u∗) = 1

2 Z T

(⟨δz,W(t, ε)δz⟩+⟨∆u, R(t, ε)∆u⟩)dt. (3.56)

Do ∆u= u∗−Un thỏa mãn đánh giá thứ hai trong (3.52), kết hợp với đánh giá (3.55) ta thu được bất đẳng thức thứ ba trong (3.52).

Một ưu điểm của phương pháp trực tiếp giúp ta đưa ra được kết luận rằng giá trị của phiếm hàm Jε(u) sẽ không tăng khi các xấp xỉ bậc cao hơn của điều khiển tối ưu được sử dụng.

Định lý 3.2.7. Với ε đủ nhỏ ta có

Jε(Un−1) ≥ Jε(Un−1+εnun) ≥ Jε(Un).

Chứng minh xem [5]

3.2.4 Ví dụ minh họa Xét bài toán cực tiểu hóa phiếm hàm

Jε(u) = 1

2 Z 1

(x2+ 2xy+ 3y2+u2)dt, (3.57) trên quỹ đạo nghiệm của hệ

˙ x= (1 +ε)x, εy˙ = −y+u, (3.58) với điều kiện ban đầu

x(0, ε) = −1, y(0, ε) = 1. (3.59)

Nghiệm chính xác của bài toán được xác định từ hệ sau

˙ x= (1 +ε)x, εy˙ = −y +u,

˙ φ = −(1 +ε)φ+x+y, εψ˙ = ψ +x+ 3y,

ψ =u, x(0, ε) = −1, y(0, ε) = 1, φ(1, ε) = 0, ψ(1, ε) = 0.

(3.60)

Có Π0x(τ0) ≡ 0, Q0x(τ1) ≡ 0.

Các hàm chính quy bậc không là nghiệm của bài toán

J0(u0) = 1

2 Z 1

(x20+ 2x0y0+ 3y20+u20)dt →min

, x˙0 =x0, 0 = −y0+u0, x0(0) = −1.

(3.61)

Nghiệm của (3.61) được tìm từ hệ sau

x˙0 = x0, 0 = −y0+u0

φ˙0 = −φ0+x0+y0, 0 =ψ0+x0+ 3y0 ψ0 = u0, x0(0) = −1, φ0(1) = 0.

(3.62)

Giải hệ (3.62) ta thu được

x0(t) = −et, φ0(t) =−3

8et + 3

8e2−t,

y0(t) = u0(t) =ψ0(t) = 1

4et.

Dựa trên (3.38), các hàm số biên bậc không trong lân cận của t = 0 được xác định từ bài toán

Π0J = 1

2 Z ∞

((Π0x)2+ 2Π0xΠ0y + 3(Π0y)2+ (Π0u)2)dτ0 →min

Π0u, dΠ0x

dτ0 = 0, dΠ0y

dτ0 = −Π0y + Π0u,

Π0x(∞) = 0, Π0y(0) = 1−y0(0) = 3

(3.63)

Nghiệm của bài toán (3.63) theo Định lý 3.2.3 được tìm từ việc giải hệ

dΠ0x dτ0 = 0, dΠ0y

dτ0 = −Π0y+ Π0u, dΠ0φ

dτ0

= Π0x+ Π0y, dΠ0ψ

dτ0

= Π0ψ+ Π0x+ 3Π0y,

Π0ψ = Π0u, Π0x(∞) = 0, Π0y(0) = 3

4, Π0φ(∞) = 0, Π0ψ(∞) = 0.

Nghiệm của hệ này là

Π0x(τ0) = 0, Π0φ(τ0) = −3

8e−2τ0,

Π0y(τ0) = 3

4e−2τ0, Π0u(τ0) = Π0ψ(τ0) = −3

4e−2τ0. Dựa trên (3.39), các hàm số biên bậc không trong lân cận của t = T được xác định từ bài toán

Q0J = 1

4eQ0y(0) + 1

2 Z ∞

((Q0x)2+ 2Q0xQ0y

+ 3(Q0y)2+ (Q0u)2)dτ1 → min

Q0u, dQ0x

dτ1

= 0, dQ0y

dτ1

= −Q0y +Q0u, Q0x(−∞) = 0, Q0y(−∞) = 0.

(3.64)

Nghiệm của bài toán (3.64) theo Định lý 3.2.4 được giải từ hệ sau

dQ0x dτ1 = 0, dQ0y

dτ1 = −Q0y+Q0u, dQ0φ

dτ1 = Q0x+Q0y, dQ0ψ

dτ1 =Q0ψ +Q0x+ 3Q0y,

Q0ψ = Q0u,

Q0x(−∞) = 0, Q0y(−∞) = 0, Q0φ(−∞) = 0, Q0ψ(0) =−1

4e.

Giải hệ này ta thu được nghiệm là

Q0x(τ1) = 0, Q0φ(τ1) = − 1

24e1+2τ1,

Q0y(τ1) =− 1

12e1+2τ1, Q0u(τ1) =Q0ψ(τ1) =−1

4e1+2τ1. Như vậy ta đã xác định được tất cả các hệ số của xấp xỉ tiệm cận bậc không của nghiệm của bài toán gốc.

Nghiệm chính xác của bài toán gốc (được xác định bằng thủ tục giải

Hình 3.1 - 3.2, trong đó nghiệm chính xác được vẽ bằng nét liền, nghiệm suy biến được vẽ bằng nét đứt, xấp xỉ bậc không được vẽ bằng đường gồm các điểm hình tròn.

Hình 3.1: Đồ thị của x(t, ε) và các xấp xỉ Hình 3.2: Đồ thị của y(t, ε) và các xấp xỉ

Hình 3.3: Đồ thị của u(t, ε) và các xấp xỉ

Kết luận

Luận văn được hoàn thành tại Khoa Toán - Cơ - Tin học trường Đại học KHTN, ĐHQGHN trên cơ sở của sách chuyên khảo [9] và bài báo [5]

về việc sử dụng phương pháp hàm lớp biên để tìm nghiệm tiệm cận cho bài toán chịu nhiễu kì dị với giá trị ban đầu và bài toán giá trị biên, và sử dụng phương pháp này trong sơ đồ trực tiếp để tìm nghiệm tiệm cận của bài toán điều khiển tối ưu dạng tuyến tính toàn phương. Kết quả chính của luận văn là

- Trình bày lại quy trình xây dựng nghiệm tiệm cận cho các bài toán chịu nhiễu kì dị với giá trị ban đầu và giá trị biên.

- Chứng minh lại điều kiện cần và đủ, cũng như sự tồn tại duy nhất nghiệm của bài toán điều khiển tối ưu chịu nhiễu kì dị dạng tuyến tính - toàn phương. Sử dụng phương pháp sơ đồ trực tiếp để xây dựng nghiệm tiệm cận của bài toán.

- Bổ sung các giải thích cho một số tính chất xuất hiện trong luận văn, đưa thêm các ví dụ bao gồm hình minh họa cho mỗi nghiệm tiệm cận thu được của các bài toán cụ thể.

Các kết quả thu được còn khá khiêm tốn, các ví dụ minh họa còn đơn giản (chủ yếu là hệ số hằng). Tuy nhiên nội dung chính của luận văn là cơ sở để có thể áp dụng với một lớp rộng các bài toán dạng khác như: phương trình sai phân, phương trình vi tích phân, các bài toán dạng tới hạn, ....

Tài liệu tham khảo

[1] S. V. Belokopytov, M. G. Dmitriev (1986), “Direct Scheme in Optimal Control Problems with Fast and Slow Motions”, Syst. Contr. Lett., 8 (2), pp. 129—135.

[2] S. V. Belokopytov, M. G. Dmitriev (1989), “Solution of the Classic Optimal Control Problems with a Boundary Layer”, Avtom. Tele- mekh., 7, pp. 71—82.

[3] M. G. Dmitriev and G. A. Kurina (2006), “Singular Perturbations in Control Problems”, Avtom. Telemekh., 1, pp. 3-–51.

[4] G. A. Kurina (1993), “Singular pertubations of control problems with equation of state not solved for the derivative (a survey)”,J. Comput.

Syst. Int., 31(6), pp. 17–45.

[5] G. A. Kurina, T. H. Nguyen (2012), “Asymptotic Solution of Sin- gularly Perturbed Linear-Quadratic Optimal Control Problems with Discontinuous Coefficients”, Comput. Math. Math. Phys., 52(4), pp.

524–547.

[6] A. Tikhonov (1948), “On the dependence of the solutions of differential equations on a small parameter”, Mat. Sbornik, 22, pp. 193–204.

[7] A. Tikhonov (1950), “On a system of differential equations containing parameters”, Mat. Sbornik, 27, pp. 147–156.

[8] A. Tikhonov (1952), “Systems of differential equations containing small parameters in the derivatives”, Mat. Sbornik, 31, pp. 575–586.

Bài toán nhiễu kì dị

Định lý về chuyển qua giới hạn