Tổng kết chương Sau khi học xong chương 3, sinh viên phải có khả năng: Giải bài toán tối ưu động không ràng buộc và có ràng buộc Thành Thà h lậ lập các á bài ttoán á điề điều khiể kh[r]
(1)Môn học LÝ THUYẾT ĐIỀU KHIỂN NÂNG CAO Giảng viên: Giả iê PGS PGS TS TS Huỳnh H ỳ h Thái Hoàng H à Bộ môn Điều Khiển Tự Động Khoa Điện – Điện Tử Đại học Bách Khoa TP TP.HCM HCM Email: hthoang@hcmut.edu.vn Homepage: http://www4.hcmut.edu.vn/~hthoang/ 15 January 2014 © H T Hoàng - HCMUT (2) Chương ĐIỀU Ề KHIỂN Ể TỐI Ố ƯU 15 January 2014 © H T Hoàng - HCMUT (3) Nội dung chương Giới thiệu Tối ưu hóa tĩnh Tối ưu hóa động và phương pháp biến phân Điều khiển tối ưu liên tục dùng phương pháp biến phân Phương pháp qui hoạch động Bellman Điều khiển tối ưu toàn phương tuyến tính LQR Ước lượng trạng thái tối ưu (lọc Kalman) Điều khiển tối ưu LQG 15 January 2014 © H T Hoàng - HCMUT (4) GIỚI THIỆU 15 January 2014 © H T Hoàng - HCMUT (5) Giới thiệu Điều khiển tối ưu : xác định luật ĐK cho hệ thống động cho trước cho tối thiểu hóa tiêu chất lượng ĐK tối ưu phát triển trên sở toán học: phương pháp biến phân (Bernoulli, Euler, Lagrange, Weiertrass,…) Từ năm 1950, ĐK tối ưu phát triển mạnh mẽ và trở thành lĩnh vực độc lập Phương pháp quy hoạch động Richard Bellman đưa t thập thậ niên1950 iê 1950 Nguyên lý cực tiểu Pontryagin Lev Pontryagin và các đồng đưa thập niên 1950 1950 Bài toán điều chỉnh toàn phương tuyến tính và lọc Kalman Rudolf Kalman đưa g g năm1960 15 January 2014 © H T Hoàng - HCMUT (6) Phân loại bài toán điều khiển tối ưu Có nhiều hiề bài ttoán á điều điề khiển khiể tối ưu, tù tùy th theo: Loại đối tượng điều khiển Miền thời gian liên tục hay rời rạc Chỉ tiêu chất lượng Bài toán tối ưu có ràng buộc hay không ĐK tối ưu tĩnh: tiêu chất lượng không phụ thuộc thời gian ĐK tối ưu động: tiêu chất lượng phụ thuộc thời gian Bài toán chỉnh toàn phương tuyến tính (Linear Quadractic Regulator – LQR) Bài toán điều khiển tối ưu H2 … 15 January 2014 © H T Hoàng - HCMUT (7) Ứng dụng Trước máy tính số đời, đời có thể giải số ít bài toán điều khiển tối ưu đơn giản Máy y tính số đời cho phép p p ứng g dụng ụ g lý ý thuyết y điều khiển tối ưu vào nhiều bài toán phức tạp Ngày nay, điều khiển tối ưu ứng dụng nhiều ề lĩnh vực: Không gian (aerospace) Điều khiển quá trình (proccess control) Robot Kỹ thuật sinh học (bioengineering) Kinh tế Tài chính … 15 January 2014 © H T Hoàng - HCMUT (8) TỐI Ố ƯU HÓA Ó TĨNH Ĩ 15 January 2014 © H T Hoàng - HCMUT (9) Tối ưu hóa tĩnh không ràng buộc Bài toán tối ưu tĩnh không ràng buộc: tìm m thông số thực (hay phức) u1, u2,…, um cho hàm L( 1, u2,…, um) đạt L(u đ t cực tiể tiểu: L(u)=L(u1, u2,…, um) đó u=[u [ 1, u2,…, um]T Điểm u* gọi là điểm cực tiểu cục L(u)L(u*) với u nằm lân cận u* Điểm u* gọi là điểm cực tiểu toàn cục L(u)L(u*) với u 15 January 2014 © H T Hoàng - HCMUT (10) Điều kiện cực trị không ràng buộc Giả sử L(u) khả đạo hàm theo u, u thì điều kiện cần và đủ để u* là điểm cực tiểu cục là: đó: Lu (u* ) * L ( u uu ) L u1 L u L 2 Lu u L um 2 L u u L u u L u1um 1 2 L Luu u L umu1 L umu2 L umum 15 January 2014 © H T Hoàng - HCMUT 10 (11) Tìm cực trị không ràng buộc – Thí dụ Tìm cực trị hàm: L(u) 5u12 2u22 2u1u2 8u1 3u2 Giải: Điều kiện ệ cần có cực ự trị: ị L L u1 0 Lu u L u2 10u1 2u2 2u1 4u u1* 0.7222 * u2 0.3889 Xét vi phân bậc hai: 2L u Luu L u u 2L u1 u 2L u 22 * * ( u , u ) (0.7222;0.3889) 15 January 2014 10 2 Luu Luu là điểm cực tiểu © H T Hoàng - HCMUT 11 (12) Tìm cực trị không ràng buộc – Thí dụ u* (0.7222;0.3889) 250 200 150 L 100 50 -50 u* u2 15 January 2014 -2 -4 -6 -4 © H T Hoàng - HCMUT -2 u1 12 (13) Tối ưu hóa tĩnh có ràng buộc Bài toán tối ưu tĩnh có ràng buộc: tìm vector thông số u cho hàm L(x,u) đạt cực tiểu, đồng thời thỏa điều kiện f(x,u) f(x u)=0 L(x,u) f(x u)=0 f(x,u)=0 đó x=[x1, x2,…, xn]T u=[u1, u2,…, um]T L : n m : hàm đánh giá điề kiệ kiện ràng à b buộc ộ f : n m p : điều 15 January 2014 © H T Hoàng - HCMUT 13 (14) Hàm Hamilton Định nghĩa hàm Hamilton: H ( x , u) L ( x , u) T f ( x , u) đó là vector số số, gọi là thừa số Larrange p Do ràng buộc f(x,u) = nên cực tiểu L(x,u) chính hí h là cực tiểu tiể ủ H(x,u) H( ) Biến đổi bài toán tìm cực tiểu hàm L(x,u) với ràng buộc f(x,u) = thành bài toán tìm cực tiểu ể không ràng buộc hàm Hamilton H(x,u) Vi phân hàm Hamilton: H ( x, u) H ( x, u) dH ( x , u) dx du x u 15 January 2014 © H T Hoàng - HCMUT 14 (15) Thừa số Lagrange Do ta cần tìm cực trị theo u nên có thể tự chọn thừa số Lagrange cho: H ( x , u) L( x, u) T f ( x , u) H x ( x , u) 0 x x x L( x, u) f ( x , u) x x 1 T Viết gọ gọn lại: Lx f x T 15 January 2014 1 © H T Hoàng - HCMUT 15 (16) Độ dốc hàm mục tiêu với điều kiện ràng buộc L( x , u) L( x , u) dL( x , u) dx du x u f ( x, u) f ( x , u) Do f(x,u) ( , ) = nên: df ( x, u) dx du x u 1 f ( x , u ) f ( x , u) du dx u x Thay (2) vào (1), ta được: Vi phân hâ hà hàm mục tiê tiêu: 1 L( x , u) L( x, u) f ( x, u) f ( x, u) dL( x , u) du du u u x x H ( x , u) f ( x, u) L( x , u) dL( x, u) T dL( x , u) du du u u u Với ĐK f(x,u)=0, độ dốc L(x,u) theo u chính Hu(x,u) Điều kiện để L(x,u) L(x u) đạt cực trị với ràng buộc f(x,u)=0 f(x u)=0 là: H u ( x , u) 15 January 2014 © H T Hoàng - HCMUT 16 (17) Điều kiện cần cực trị có ràng buộc Kết hợp với điều kiện xác định số Lagrange Lagrange, điều kiện cần để L(x,u) đạt cực trị có ràng buộc f ( x , u) là: H x ( x , u) Lx ( x, u) T f x ( x , u) T H u ( x, u) Lu ( x, u) f u ( x , u) H ( x , u) f ( x , u) đó: 15 January 2014 H ( x , u) L( x , u) T f ( x, u) © H T Hoàng - HCMUT 17 (18) Tìm cực trị có ràng buộc – Thí dụ Tì cực trị Tìm t ị hàm: hà L(u) 5u12 2u22 2u1u 8u1 3u2 Với điều kiện ràng buộc: f (u) u1 6u2 Giải: Hàm Hà H Hamilton: il H ( u) L ( u ) f ( u) T 2 H (u) 5u1 2u 2u1u 8u1 3u (u1 6u 2) 15 January 2014 © H T Hoàng - HCMUT 18 (19) Tìm cực trị có ràng buộc – Thí dụ Điều kiện cần để có cực trị: H x ( u) H u ( u) f (u) H (u) 100u1 2u2 u1 H (u) 2u1 4u2 6 u2 f (u) u1 6u2 Giải hệ phương trình, ta được: u 0.8412 0.4735 * T 0.5353 H (u) 5u12 2u22 2u1u2 8u1 3u2 (u1 6u2 2) 15 January 2014 © H T Hoàng - HCMUT 19 (20) Tìm cực trị có ràng buộc – Thí dụ u* 0.8412 0.4735 T 250 200 150 L 100 50 -50 u* u2 15 January 2014 -2 -4 -6 -4 © H T Hoàng - HCMUT -2 u1 20 (21) Tìm cực trị có ràng buộc – Thí dụ Tì cực trị Tìm t ị hàm: hà L( x, u ) ( x 2) (u 2) 2 Với điều kiện ràng buộc: u x x Giải: Viết lại điều kiện ràng buộc: u x 3x x 3x u Hà Hamilton: Hàm H ilt H ( x, u ) L( x, u ) T f ( x, u ) H ( x, u ) ( x 2) (u 2) ( x x u ) 15 January 2014 © H T Hoàng - HCMUT 21 (22) Tìm cực trị có ràng buộc – Thí dụ Điều kiện cần để có cực trị: H x ( x, u ) H u ( x, u ) f ( x, u ) H ( x, u ) 2( x 2) 2x 3 x H ( x, u ) 2(u 2) u f ( x, u ) x x u Giải hệ phương h trình, ì h ta đ b ba nghiệm: hiệ ( x, u ) (4.53;0.92), (1.71;2.04), (1.68;8.22) 2 Thay nghiệm trên vào L( x , u ) ( x 2) (u 2) , ta các giá trị tương ứng là: 43.78; 0.087; 117.94 * 2* ) (1.71 Kết ế luận: cực trị cần ầ Htìm là ( x , u ( x, u ) ( x 2) (u 2) ;2.04 ( x 2) 3x u ) 15 January 2014 © H T Hoàng - HCMUT 22 (23) Tìm cực trị có ràng buộc – Thí dụ Tì cực trị Tìm t ị hàm: hà L( x , u ) x x u 2 2 Với các điều kiện ràng buộc: f1 ( x , u ) 2 x1 x2 4 0 f ( x, u ) f ( x , u ) x1 u Giải: Hàm Hamilton: H ( x , u ) L( x , u ) f ( x , u ) T H ( x , u ) x12 x22 u 1 (2 x1 x2 4) 2 ( x1 u 2) 15 January 2014 © H T Hoàng - HCMUT 23 (24) Tìm cực trị có ràng buộc – Thí dụ ĐK cần để có cực trị: H x ( x, u ) H u ( x, u ) f ( x, u ) H ( x, u ) / x1 x1 21 2 H ( x, u ) / x x2 1 H ( x, u ) / u 2u 2 f1 ( x, u ) x1 x2 f ( x, u ) x1 u Giải hệ phương trình, ta được: x * 1.5714 0.8514 u * 3.5714 5.1429 7.1429T T Do L( x , u ) x x u là hàm toàn p phương g nên 2 H ( x , u )ở xtrên x u 1 (2 x1 là xcực 2 ( x1 u 2) cực trị tìm chính 2 4)tiểu 15 January 2014 2 2 © H T Hoàng - HCMUT 24 (25) TỐI ƯU HÓA ĐỘNG VÀ PHƯƠNG PHÁP BIẾN PHÂN 15 January 2014 © H T Hoàng - HCMUT 25 (26) Tối ưu hóa động không ràng buộc Bài toán tối ưu động không ràng buộc: tìm vector hàm x(t) cho phiếm hàm J(x) đạt cực tiểu: tf J ( x ) L( x, x , t )dt t0 đó đó: x (t ) x1 (t ) x2 (t ) xn (t ) n T L : n n Chú ý: Phiếm hàm là hàm hàm (functional = function of function) * Phiếm hàm J ( x ) có cực tiểu cục x (t ) * J ( x (t )) J ( x (t )) * x (t ) x với hàm nằm lân cận (t ) x (t ) x * (t ) 15 January 2014 © H T Hoàng - HCMUT 26 (27) Tìm cực trị phiếm hàm? Nhắc lại cực trị hàm: Điều kiện cần: đạo hàm bậc hàm cần tìm cực trị điểm dừng Điểm dừng g có đạo hàm bậc ậ xác định ị dương g điểm cực tiểu Cực trị phiếm hàm? Khái niệm biến phân (variation): có thể hiểu là “đạo hàm p phiếm hàm” Phương pháp biến phân (Calculus of Variation): dựa vào khái niệm biến phân đưa điều kiện cực trị phiếm ế hàm tương tự điều ề kiện cực trị hàm 15 January 2014 © H T Hoàng - HCMUT 27 (28) Khái niệm biến phân L Lượng gia i ủ phiếm hiế hà hàm: J ( x ) J ( x x ) J ( x ) g đó x ((t ) là biến phân p hàm x (t ) x (t ) x (t ) x (t ) t Minh họa biến phân hàm x (t ) Biến phân phiếm hàm: J ( x ) lim J ( x ) lim [ J ( x x ) J ( x )] x 0 15 January 2014 x 0 © H T Hoàng - HCMUT 28 (29) Thí dụ tính biến phân phiếm hàm Cho phiếm ế hàm: J ( x) x (t )dt Biến phân phiếm hàm tính sau: 1 J [ x(t )] J ( x x) J ( x) ( x x) dt ( x) dt 1 0 [ x xx (x) ]dt ( x) dt [2 xx (x) ]dt J ( x) lim J ( x) lim [2 xx (x) ]dt x 0 x 0 J ( x) [2 xx]dt 15 January 2014 © H T Hoàng - HCMUT 29 (30) Công thức tính biến phân phiếm hàm dạng tích phân Ch phiếm Cho hiế hà hàm dạng d tích í h phân hâ tổng ổ quát: á tf J ( x ) L( x )dt t0 Biến phân phiếm hàm dạng tích phân tính sau: tf L( x ) J ( x ) x dt x t0 15 January 2014 © H T Hoàng - HCMUT 30 (31) Biến phân phiếm hàm bài toán tối ưu động không ràng buộc tf J ( x ) L( x, x , t )dt d Phiế hà Phiếm hàm: Biến phân phiếm hàm: t f L( x , x , t) L( x, x , t ) J x x dt t0 x x t0 t Chú ý rằng: x (t ) x ( )d x (t0 ) t0 x (t0 ) x (t f ) Thực biến đổi tích phân, phân suy ra: tf L( x, x , t ) d L( x, x , t ) J xdt x dt x t0 15 January 2014 © H T Hoàng - HCMUT 31 (32) Điều kiện cần để phiếm hàm đạt cực trị cục Điều kiện cần để phiếm hàm J ( x ) đạt cực trị cục x * (t ) là biến phân J ( x ) phải x * (t ) J ( x ) x x * ĐK cần để bài toán tối ưu động không ràng buộc có cực trị: L( x, x , t ) d L( x, x , t ) L d L 0 0 x x x dt x dt (phương trình Euler-Lagrange) Trường hợp đặc biệt L không phụ thuộc tường minh vào t, dạng đơn giản pt Euler-Lagrange là: t L J L( x, x , t ) d L( x, x , t ) xdt số) L x c (c là hằng x dt x t x f 15 January 2014 © H T Hoàng - HCMUT 32 (33) Tối ưu hóa động không ràng buộc – Thí dụ Tìm hàm x(t) cho : J ( x) /2 [ x (t ) x (t )]dt Vớii điều điề kiện ki biên: bi x(0) 1, x( / 2) Giải: Theo đề ề bài, ta có: L x x Phương trình Euler-Lagrange: L d L d x x x x x dt x dt Lời giải tổng ổ quát: x(t ) C1 sin t C2 cos t Thay điều kiện biên, suy ra: C1 3,C Kết luận: x * (t ) sin t cos t 15 January 2014 © H T Hoàng - HCMUT 33 (34) Tối ưu hóa động không ràng buộc – Thí dụ Tìm hàm x(t) cho phiếm hàm đây đạt cực tiểu: J ( x) x (t )dt với ĐK biên: x(0) 1, x(2) 0 Giải: L d L Phương trình Euler-Lagrange: 0 x dt d x d x dt x x x x x 0 x Lời g giải tổng g qquát: x(t ) C1t C2 Thay điều kiện biên, suy ra: C1 ,C Kết ế luận: x* (t ) t 15 January 2014 © H T Hoàng - HCMUT xx 0 x L x 34 (35) Tối ưu hóa động có ràng buộc Bài toán tối ưu động có ràng buộc: b ộc: tìm vector ector hàm x(t) xác ác định trên đoạn [t0, tf] cho phiếm hàm J(x) đạt cực tiểu: tf J ( x ) L( x, x , t )dt t0 với điều kiện ràng buộc f ( x, x , t ) và điều kiện biên: x(t0)=x0, x(tf)=xf đó: x (t ) x1 (t ) x2 (t ) xn (t ) T n L : n n f : n n p 15 January 2014 © H T Hoàng - HCMUT 35 (36) Hàm Hamilton và điều kiện cần để có cực trị Định nghĩa hàm Hamilton: H ( x , x , , t ) L( x, x , t ) T f ( x , x , t ) t đó (t ) p là vector t hàm, hà gọii là thừa thừ số ốL Larrange t1 Do f ( x , x , t ) nên cực tiểu J ( x ) L( x, x , t )dt t1 t0 chính là cực tiểu J ( x ) H ( x , x , , t )dt t0 tìm cực tiểu iể không kh ràng buộc b phiếm hiế hhàm J ( x ) Điều kiện cần để phiếm hàm J ( x ) có cực trị là: H ( x, x , , t ) d H ( x, x , , t ) 0 x x dt (PT Euler-Lagrange bài toán tối ưu động có ràng buộc) 15 January 2014 © H T Hoàng - HCMUT 36 (37) Tối ưu hóa động có ràng buộc dạng tích phân Bài toán tối ưu động có ràng buộc: tìm vector hàm x(t) xác định trên đoạn [t0, tf] cho phiếm hàm J(x) đạt cực tiểu: tf J ( x ) L( x, x , t )dt t0 với điều kiện ràng buộc tf t0 f ( x, x , t )dt q và điều kiện biên: x(t0)=x0, x(tf)=xf Hàm Hamilton và pphươngg trình Euler-Lagrange g g g trường hợp ràng buộc tích phân sau: , , t ) L( x, x , t ) T f ( x , x , t ) Hàm Hamilton: H ( x , x Phương trình Euler-Lagrange: H ( x, x , , t ) d H ( x, x , , t ) 0 x dt x 15 January 2014 © H T Hoàng - HCMUT 37 (38) Trình tự giải bài toán tối ưu động có ràng buộc Bước 1: Xác định hàm mục tiêu, tiêu đđ.kiện kiện ràng buộc và điều tf kiện biên: J ( x ) L( x, x , t )dt t0 tf Đ.kiện ràng buộc f ( x, x , t ) t f ( x, x , t )dt q Điều kiện biên x (t0 ) x0 và x (t f ) x f Bước 2: Thành lập hàm Hamilton: H ( x , x , , t ) L( x , x , t ) T f ( x , x , t ) Bước 3: Viết phương trình Euler-Lagrange: H ( x, x , , t ) d H ( x, x , , t ) 0 x dt x Bước 4: Tìm nghiệm PT Euler-Lagrange Euler Lagrange thỏa điều kiện ràng buộc và điều kiện biên 15 January 2014 © H T Hoàng - HCMUT 38 (39) Tối ưu hóa động có ràng buộc – Thí dụ Tìm hàm x(t) cho phiếm hàm đây đạt cực tiểu: J ( x) x (t )dt với điều kiện ràng buộc: x(t )dt và điều kiện biên: x(0) 0, x(4) Giải: Hàm Hamilton: H ( x, x , , t ) L( x, x , t ) f ( x, x , t ) H ( x, x , , t ) x (t ) x(t ) 15 January 2014 © H T Hoàng - HCMUT 39 (40) Tối ưu hóa động có ràng buộc – Thí dụ Phương trình Euler Euler-Lagrange: Lagrange: H ( x, x , , t ) d H ( x, x , , t ) 0 x dt x d 2 x (t ) d dt x(t ) ((1)) Tìm nghiệm phương trình Euler-Lagrange: (1) x(t ) x(t ) 15 January 2014 t c1t c2 x (t ) t c1 H ( x, x , , t ) x (t ) x(t ) © H T Hoàng - HCMUT 40 (41) Tối ưu hóa động có ràng buộc – Thí dụ Xác định các số dựa vào điều kiện ràng buộc và điều kiện biên: x(0) .0 c1.0 c2 c2 x(4) 4 4c1 c1 16 0 x(t )dt 12 t t 8c1 9 Kết luận: x (t ) t t 32 * 15 January 2014 © H T Hoàng - HCMUT c1 x(t ) t c1t c2 41 (42) Tối ưu hóa động có ràng buộc – Thí dụ Tìm vector hàm x (t ) x1 (t ) đây đạt cực tiểu: x2 (t ) cho phiếm hàm T J ( x ) 5( x1 1) x22 dt d i với điều kiện ràng buộc: f ( x, x , t ) x1 x1 x2 và điều kiện biên: x1 (0) 0; x1 (2) Giải: Hàm Hamilton: H ( x, x , , t ) L( x, x , t ) f ( x, x , t ) H ( x, x , , t ) [5( x1 1) x22 ] ( x1 x1 x2 ) 15 January 2014 © H T Hoàng - HCMUT 42 (43) Tối ưu hóa động có ràng buộc – Thí dụ Phương trình Euler Euler-Lagrange: Lagrange: H d H (1) 10( x1 1) 2 0 x1 dt x1 H d H 0 x2 (2) x2 dt x2 Tìm nghiệm phương trình Euler-Lagrange thỏa điều ề kiện ràng buộc: x2 (3) (2) x2 2x 10( x1 1) x2 x x2 x1 22xx1 Từ điều ề kiện ràng buộc, suy ra: x2 x1 x1 Thay (3) vào (1): (4) (5) y ((5)) vào ((4): ) 10( x1 1) 4( x1 x1 ) 2( x1 x1 ) Thay ( xx, x, 10 , t )0[5( x1 1) x22 ] ( x1 x1 (6) x2 ) x1 H18 15 January 2014 © H T Hoàng - HCMUT 43 (44) Tối ưu hóa động có ràng buộc – Thí dụ N hiệ tổ Nghiệm tổng quát át ủ phương hươ ttrình ì h (6) x1 (t ) C1e 3t C e 3t 0.556 Thay điều ề kiện biên x1 (0) 0; x1 (2) C1 C 0.556 0.0025C1 403.42C 0.556 x1 (t ) 0.5549e 3t 0.0011e 3t 0.556 C1 0.5549 C 0.0011 (7) Thay (7) vào (5): x2 x1 2x1 x2 (t ) 0.5549e 3t 0.0055e 3t 1.112 15 January 2014 © H T Hoàng - HCMUT 44 (45) ĐIỀU KHIỂN TỐI ƯU LIÊN TỤC DÙNG PHƯƠNG PHÁP BIẾN PHÂN 15 January 2014 © H T Hoàng - HCMUT 45 (46) Bài toán điều khiển tối ưu liên tục Cho đối tượng: x (t ) f ( x (t ), ) u(t )) ((*)) đó: x (t ) [ x1 (t ), x2 (t ), , xn (t )]T : vector trạng thái u(t ) [u1 (t ), u2 (t ), , um (t )]T : vector tín hiệu ĐK Trạng thái đầu: x (0) x0 , trạng thái cuối: x (t f ) x f Bài toán điều khiển tối ưu: tìm tín hiệu ĐK u(t) cho: tf J (u) ( x (t f )) L( x (t ), u(t ), t )dt t0 Nghiệm x*(t) phương trình vi phân (*) ứng với tín hiệu điều ề khiển ể tối ố ưu u*(t) gọi là quỹ đạo trạng thái tối ố ưu 15 January 2014 © H T Hoàng - HCMUT 46 (47) Phân loại bài toán điều khiển tối ưu Khoảng thời gian xảy quá trình tối ưu là tf , có thể phân loại: Bài toán tối ưu có tf cố định, ví dụ: Điều Điề khiển đoàn tàu tà hỏa ga với ới lịch trình xác ác định cho lượng đoàn tàu tiêu thụ là thấp nhất; Điều khiển quá trình chuyển đổi hóa học thời gian cho trước với chi phí thấp Bài toán tối ưu có tf không cố định, ví dụ: Điều khiển tên lửa lên độ cao xác định với thời gian nhanh Điều khiển tàu biển xa với nguồn lượng cố định cho trước 15 January 2014 © H T Hoàng - HCMUT 47 (48) Phân loại bài toán điều khiển tối ưu (tt) Các bài toán điều điề khiển tối ưu động có trạng thái đầu đầ x0 cho trước Trạng thái cuối quá trình tối ưu là xf =x(tf), có thể phân loại: Điểm cuối tự do, ví dụ: Điều khiển tên lửa lên độ cao lớn nhất; Điều khiển tàu biển xa với nguồn lượng cố định cho trước Điểm Điể cuối ối bị ràng à buộc, b ộ víí dụ: d Điều khiển tên lửa vào quỹ đạo với thời gian nhanh nhất Điểm cuối cố định cho trước, ví dụ: Điều khiển gghépp nối các tàu Điều khiển hệ thống trạng thái cân 15 January 2014 © H T Hoàng - HCMUT 48 (49) Giải bài toán ĐK toán tối ưu dùng PP biến phân Bài toán ĐK tối ưu liên tục có thể phát biểu lại sau: tf J (u) ( x (t f )) L( x (t ), u(t ), t )dt u(t ) với điều kiện x (t ) f ( x (t ), u(t ), t ) đó t0, tf, và x (t0 ) x0 cho trước Kết hhợp điều Kế điề kiện kiệ ràng à buộc b ộ vào à hàm hà mục tiêu iê dùng dù hàm hà Lagrange: tf J (u) ( x (t f )) L( x (t ), u(t ), t ) T (t ) f ( x (t ), u(t )) x (t )dt 15 January 2014 © H T Hoàng - HCMUT 49 (50) Giải bài toán ĐK toán tối ưu dùng PP biến phân Định nghĩa hàm Hamilton: H ( x , u, t , ) L( x , u, t ) T (t ) f ( x , u, t ) tf J ( u) ( x (t f )) [ H ( x, u, t , ) T (t ) x ]dt t0 Cần tìm u*(t) cho: J (u) u u* u Biến phân phiếm hàm mục tiêu: T x T x t t f x J 15 January 2014 tf t t H T H (t ) x u dt x u t © H T Hoàng - HCMUT 50 (51) Điều kiện cần để có lời giải bài toán điều khiển tối ưu Chú ý là x (t0 ) điều kiện đầu cố định; x (t f ) điểm cuối ràng buộc, x (t f ) điểm cuối tự Để J (u) với ới mọii u cần ầ cóó các á điều điề kiện: kiệ H 0 u Lưu ý: H (t) x (t f ) (t f ) x ((tt f ) Điều kiện (t f ) cần bài toán điểm x cuối tự (t ) gọi là đồng trạng thái hệ thống t H Jh(u) (trình xì(t fh))đồ [ Htrạng (t ) Tthái (t ) x ]dt d (t)) đ gọii là phương đồng hái x f 15 January 2014 © H T Hoàng - HCMUT 51 (52) Trình tự giải bài toán điều khiển tối ưu x (t ) f ( x (t ), ) u(t ), ) t) B 11: Viết PTTT môô tả đối tượng: Bước t Bước 2: Viết hàm mục tiêu và ĐK biên từ yêu cầu thiết kế Bài toán điểm cuối tự do: tf J ( u) ( x (t f )) L( x (t ), ) u(t ), ) t )dt u( t ) Điều kiện đầu: x (t0 ) x0 t0 Bài toán điểm cuối ràng buộc: tf J ( u) L( x (t ), u(t ), t )dt u( t ) t0 Điều kiện đầu x (t0 ) x0 và điều kiện cuối x (t f ) x f 15 January 2014 © H T Hoàng - HCMUT 52 (53) Trình tự giải bài toán điều khiển tối ưu Bước 3: Thành lập hàm Hamilton: H (t ) L( x, u, t ) T (t ) f ( x , u, t ) Bước 4: Viết điều kiện cần để có lời giải tối ưu: PT trạng thái: x (t ) f ( x (t ), ) u(t ), ) t) H PT đồng trạng thái: (t) x Điều kiện đầu: H 0 u x (t0 ) x0 ệ cuối: Điều kiện x (t f ) x f Điều kiện dừng: (t f ) (Bài toán điểm cuối cố định) (t f ) x (Bài toán điểm cuối tự do) Bước 5: Giải hệ phương trình trên tìm u*(t) và x*(t) 15 January 2014 © H T Hoàng - HCMUT 53 (54) Điều khiển tối ưu – Thí dụ Đặc tính động học nhiệt độ lò sấy cho phương trình: y (t ) 2( y (t ) ya ) u (t ) đó y(t) là nhiệt độ lò sấy và ya = 250C là nhiệt độ môi trường; u(t) là cường độ dòng nhiệt cấp lò sấy và t là thời gian (giờ) Yêu cầu: Thiết kế luật điều khiển u(t) điều khiển nhiệt độ nhiệt độ lò sấy ấ cho sau đạt đến ế càng gần ầ nhiệt độ đặt yd = 750C càng tốt và tối thiểu lượng tiêu tốn Giải: Bước 1: Thành lập phương trình trạng thái: Đặt biến trạng thái: x(t ) y (t ) ya Phương trình trạng thái lò sấy là: x (t ) 2 x(t ) u (t ) Trạng thái cuối ố mong muốn: ố x f x(1) y (1) ya yd ya 50 15 January 2014 © H T Hoàng - HCMUT 54 (55) Điều khiển tối ưu – Thí dụ (tt) Bước 2: Xác định hàm mục tiêu và điều kiện biên: Theo yêu cầu thiết kế là trạng thái cuối x(tf ) càng gần xf =50 càng tốt, đồng thời tối thiểu lượng tiêu tốn, suy hàm mục tiêu: tf 2 J (u ) [ x(t f ) x f ] u (t )dt 20 (Đây là bài toán tối ố ưu điểm ể cuối ố tự do) đó là trọng số tùy chọn (muốn trạng thái cuối càng gần xf thì chọn càng lớn) Điều kiện đầu: x0 0; t f Bước 3: Định nghĩa hàm Hamilton: 15 January 2014 H ( x, u, , t ) L( x, u, t ) (t ) f ( x , u, t ) H ( x , u, , t ) u (t ) (t )[2 x(t ) u (t )] © H T Hoàng - HCMUT 55 (56) Điều khiển tối ưu – Thí dụ (tt) Bước 4: Điều kiện cần để có nghiệm tối ưu PT trạng thái: x (t ) 2 x(t ) u (t ) H PT đồng trạng thái: (t ) x H H Điề kiệ Điều kiện dừ dừng: 0 u Điề kiệ Điều kiện đầ đầu: Điều kiện cuối: (1) (t ) 2 (t ) u (t ) (t ) x(t0 ) x0 (t f ) (t f ) x (2) (3) (4) (1) ( x(1) 50) ((5)) H ( x , u, , t ) u (t ) (t )[2 x(t ) u (t )] 15 January 2014 © H T Hoàng - HCMUT 56 (57) Điều khiển tối ưu – Thí dụ (tt) Bước 5: Giải phương trình vi phân Nghiệm phương trình (2): (6) (t ) C1e 2t Thay (6) vào (3): u (t ) C1e 2t (7) Thay (7) vào (1) (1), ta được: x (t ) 2 x(t ) C1e 2t x(t ) (8) C1 2t e C2 e 2t x (tu)((tt)) 22x(t()t ) u0(t ) 15 January 2014 © H T Hoàng - HCMUT (1) (3) (2) 57 (58) Điều khiển tối ưu – Thí dụ (tt) Xác định các số dựa vào điều kiện biên: x ( 0) (1) x(1) 50 C1 C2 C1 C1e e C2 e 50 50 C1 e (e e ) / 12.5 C2 e ( e e ) / 15 January 2014 © H T Hoàng - HCMUT 58 (59) Điều khiển tối ưu – Thí dụ (tt) Kết ế luận: Tín hiệu điều ề khiển ể và quỹ đạo trạng thái tối ố ưu là: u (t ) C1e 2t C1 2t x(t ) e C2 e 2t 15 January 2014 © H T Hoàng - HCMUT 59 (60) Điều khiển tối ưu – Thí dụ Cho hệ thống xe hình vẽ vẽ Quan hệ vào hệ thống mô tả phương trình vi phân: y(t)) y( M u(t) My(t ) u(t ) g đó u(t) ( ) là tín hiệu ệ vào (lực ( ự điều khiển); ); y( y(t)) là tín hiệu ệ ((vịị trí xe); m = 0.5kg là khối lượng xe Bài toán đặt là thiết kế luật điều khiển u(t) để điều khiển xe từ trạng thái hái đứ đứng yên ê tạii gốc ố tọa độ đế đến trạng thái hái đứ đứng yên ê tạii vịị tríí cách gốc tọa độ 10cm khoảng thời gian giây, đồng thời tối g lượng g tiêu tốn thiểu Yêu cầu: Hãy y thành lập ập bài toán tối ưu cho yyêu cầu thiết kế trên Giải bài toán tìm tín hiệu điều khiển tối ưu 15 January 2014 © H T Hoàng - HCMUT 60 (61) Điều khiển tối ưu – Thí dụ Giải Giải: Bước 1: Viết phương trình trạng thái đối tượng ) x2 (t ) y (t ) Đặt các biến ế trạng thái x1 (t ) y (t ), Phương trình trạng thái mô tả đối tượng x1 (t ) x (t ) x (t ) u(t ) M x1 (t ) x2 (t ) x (t ) 2u(t ) 15 January 2014 © H T Hoàng - HCMUT 61 (62) Điều khiển tối ưu – Thí dụ Bước 2: Xác định hàm mục tiêu và điều kiện biên: Yêu cầu thiết kế là trạng thái xe thời điểm tf = đứng yên vị trí 10cm (điểm cuối ràng buộc) đồng thời tối thiểu lượng tiêu tốn, ố suy hàm mục tiêu: 1 (Bài toán tối ưu J (u ) u (t )dt điểm cuối ràng buộc) 20 Từ kiện đề bài, có thể xác định điều kiện biên: Điều kiện đầu: x1 (0) y (0) 0, x2 (0) y (0) Điều kiện cuối: x1 (1) y (1) 10, x2 (1) y (1) Bước 3: Thành lập hàm Hamilton: H ( x , u, , t ) L( x , u, t ) T (t ) f ( x , u, t ) H ( x, u, , t ) u (t ) 1 x (t ) 2 2u(t ) 15 January 2014 © H T Hoàng - HCMUT 62 (63) Điều khiển tối ưu – Thí dụ (tt) Bước 4: Điều kiện cần để có nghiệm tối ưu PT trạng thái: x1 (t ) x2 (t ) x (t ) 2u(t ) (1) H ( t ) 0 x1 PT đồng trạng thái: 2 (t ) H 1 x Điều kiện dừng: H 0 u u Điều kiện đầu: x (0) 0;0 Điều kiện cuối: x (1) 10;0 15 January 2014 u ( t ) 2 ( t ) T (2) (3) (4) T © H T Hoàng - HCMUT (5) 63 (64) Điều khiển tối ưu – Thí dụ (tt) Bước 5: Giải phương trình vi phân 1 (t ) C1 Nghiệm g ệ pphương g trình ((2): ) 2 (t ) C1t C Nghiệm phương trình (3): u(t ) 22 (t ) 2C1t 2C (6) (7) Thay (7) vào (1), ta được: x1 (t ) x (t ) x (t ) 2u (t ) 4C1t 4C x1 (t ) 23 C1t 2C t C3t C x ( t ) C t 4C t C3 15 January 2014 © H T Hoàng - HCMUT (9) 64 (65) Điều khiển tối ưu – Thí dụ (tt) Thay điều kiện biên: x1 (0) C x (0) C3 x (1) C 2C 10 x (1) 2C1 4C C C C1 30 C 15 Kết ế luận: Tín hiệu điều ề khiển ể tối ố ưu là u (t ) 60t 30 * 15 January 2014 © H T Hoàng - HCMUT (7) 65 (66) PHƯƠNG PHÁP QUI HOẠCH ĐỘNG 15 January 2014 © H T Hoàng - HCMUT 66 (67) Nguyên lý tối ưu Bellman Phương pháp qui hoạch động (DP – Dynamic Programing) Bellman đề xuất (1957) Phương pháp qui hoạch động là thuật toán xác định dãy giá trị {u(k)} tối ưu để tối thiểu tiêu chất lượng J Nguyên g y lý ý tối ưu: Mỗi đoạn cuối q quỹ ỹ đạo trạng g thái tối ưu là quỹ đạo trạng thái tối ưu x2 Đoạn xN Đoạn xk Đoạn x0 x1 15 January 2014 © H T Hoàng - HCMUT 67 (68) Thí dụ tìm đường ngắn dùng DP Tìm đường ngắn từ A đến J, J cho biết mạng lưới đường hình vẽ Nguyên lý tối ưu Bellman: tìm đường ngắn ngược từ nút đích đến nút đầu 15 January 2014 © H T Hoàng - HCMUT 68 (69) Thí dụ tìm đường ngắn dùng DP Phân bài toán tìm đường thành các bước từ đến Ký hiệu Nki là nút thứ i bước k N21 N31 N41 N11 N22 N32 N51 N42 N33 N23 Bước 15 January 2014 Bước Bước © H T Hoàng - HCMUT Bước Bước 69 (70) Thí dụ tìm đường ngắn dùng DP Ký hiệu: * J k ( N ki ) là khoảng cách ngắn từ nút N ki đến nút đích J d ( N ki , N k 1, j ) là khoảng g cách từ nút N ki đến nút N k 1, j Phương trình Bellman: J k* ( N ki ) d ( N ki , N k 1, j ) J k*1 ( N k 1, j ) j ắ ấ từ nút đầu ầ đến ế nút đích J1* ( N11 ) là khoảng cách ngắn 15 January 2014 © H T Hoàng - HCMUT 70 (71) Thí dụ tìm đường ngắn dùng DP Giải PT Bellman qua vòng: Vòng ngược: ngược từ nút cuối nút đầu tìm đoạn đường cuối ngắn Vòng xuôi: từ nút đầu đến nút cuối đường tối ưu 15 January 2014 © H T Hoàng - HCMUT 71 (72) Thí dụ tìm đường ngắn dùng DP Vòng ngược: Bước 5: nút đích J 5* ( N 51 ) Bước 4: đoạn đường ngắn từ nút N41 N42 đến đích: J 4* ( N 41 ) d ( N 41 , N 51 ) J 5* ( N 51 ) J 4* ( N 42 ) d ( N 42 , N 51 ) J 5* ( N 51 ) 15 January 2014 © H T Hoàng - HCMUT 72 (73) Thí dụ tìm đường ngắn dùng DP (tt) Bước 3: có nhiều lựa chọn, từ nút N3i phải chọn ọ đường g đến đích qua nút N4j nào tối ưu đoạn quỹ đạo cuối ối J 3* ( N 3i ) ? J 3* ( N 3i ) mind ( N 3i , N j ) J 4* ( N j ) j * d ( N , N ) J 3i 4j (N4 j ) Từ nút N 41 N 42 N3i N 31 1+3=4 4+4=8 N 32 6+3=9 3+4=7 N 33 15 January 2014 3+3=6 3+4=7 J ( N 3i ) Quyết định đến N41 (H) N42 ((I)) N41 (H) * © H T Hoàng - HCMUT 73 (74) Thí dụ tìm đường ngắn dùng DP (tt) Bước 2: tìm đường tối ưu từ nút N2i đến nút đích N51 (tức nút J), sử dụng kết ế tối ưu đoạn cuối tìm bước J 3* ( N 31 ) J 3* ( N 32 ) J 3* ( N 33 ) J 2* ( N 2i ) mind ( N 2i , N j ) J 3* ( N j ) j Từ nút N2i N 21 d ( N 2i , N j ) J 3* ( N j ) N 31 J ( N 2i ) Quyết định đến * N 32 N 33 7+4=11 4+7=11 6+6=12 11 N 31 N 32 N 22 3+4=7 2+7=9 4+6=10 N 31 N 23 4+4=8 1+7=8 5+6=11 N 31 N 32 15 January 2014 © H T Hoàng - HCMUT 74 (75) Thí dụ tìm đường ngắn dùng DP (tt) Bước 1: tìm đường tối ưu từ nút N11 (tức nút A)) đến nút đích N51 (tức nút J), sử dụng kết tối ưu đ đoạn cuối ối tì tìm đ bước J 2* ( N 21 ) 11 J 2* ( N 22 ) J 2* ( N 23 ) J1* ( N11 ) d ( N11 , N j ) J 2* ( N j ) j Từ N11 d ( N11 , N j ) J 2* ( N j ) N 21 2+11=13 15 January 2014 N 22 4+7=11 N 23 2+8=10 © H T Hoàng - HCMUT J ( N11 ) Quyết Q ết định đến 10 N 23 * 75 (76) Thí dụ tìm đường ngắn dùng DP (tt) Vò xuôi: Vòng ôi từ bước b đến đế b bước để rút út đường đ tối ưu Kết luận: Đường tối ố ưu: N11 N 23 N 31 N 41 N 51 hoặc: N11 N 23 N 32 N 42 N 51 15 January 2014 © H T Hoàng - HCMUT 76 (77) Bài toán điều khiển tối ưu động rời rạc Cho đối tượng ợ g mô tả p phương g trình sai p phân: x (k 1) f ( x (k ), u(k )) đó: x (k ) [ x1 (k ), x2 (k ), , xn (k )]T: vector trạng g thái (*) u(k ) [u1 (k ), u2 (k ), , um (k )]T: vector tín hiệu điều khiển Trạng thái đầu: x (0) x0 , trạng thái cuối: x ( N ) x N Bài toán điều khiển tối ưu: tìm tín hiệu u(k) cho: N 1 J ( N , x N ) L( x (k ), ) u(k )) k 0 Chú ý: Bài toán tối ưu điểm cuối tự ( N , x N ) Bài toán tối ưu điểm cuối cố định ( N , x N ) Ý tưởng giải bài toán ĐK tối ưu rời rạc dùng nguyên lý tối ưu (k ) phụ thuộc x * (k ) theo chiều Bellman: tìm kiếm nghiệm u* (k ngược hướng quỹ đạo từ điểm cuối xN đến điểm đầu x0 15 January 2014 © H T Hoàng - HCMUT 77 (78) PP qui hoạch động giải bài toán ĐK tối ưu rời rạc Đặt hàm mục tiêu tối ưu cho đoạn quỹ đạo t.thái t thái cuối kể từ điểm x(k) N 1 * J k ( x ( k )) ( N , x ( N )) L( x (i ), u(i )) , ( k 0, N 1) u ( k ), ,u ( N 1) i k * Biểu diễn J k ( x (k )) dạng: N 1 * J k ( x (k )) L( x (k ), ) u(k )) ( N , x ( N )) L( x (i ), ) u(i )) u( k ), ,u ( N 1) i k 1 J k* ( x (k )) L( x (k ), u(k )) J k*1 ( x (k 1)) u (k (k ) J k* ( x (k )) L( x (k ), u(k )) J k*1 ( f ( x (k ), u(k ))) u( k ) (PT Bellman) Dễ thấy: J N* ( x ( N )) ( N , x ( N )) và J 0* ( x (0)) minJ Giải N phương trình Bellman theo thứ tự k N tìm tín hiệu điều khiển tối ưu 15 January 2014 © H T Hoàng - HCMUT 78 (79) Trình tự giải bài toán ĐK tối ưu rời rạc dùng DP Đối tượng: Yêu cầu thiết kế: Tìm tín hiệu u* (k ), k 0,1, , N điều khiển hệ ệ thống g từ trạng g thái đầu x (0) x0 đến trạng g thái cuối x ((N ) cho tối thiểu tiêu chất lượng: x (k 1) f ( x (k ), ) u(k )) N 1 J ( N , x N ) L( x (k ), u(k )) k 0 Bước 1: Viết phương trình Bellman: J k* ( x (k )) i L( x (k ), ) u(k )) J k*1 ( f ( x (k ), ) u(k ))) (k 0,1, , N 1) u( k ) với J N* ( x ( N )) ( N , x N ) Bước 2: Giải phương trình Bellman qua vòng: * Vòng ngược: k N tìm u ( k ) phụ thuộc x (k ) * Vòng thuận: k N tính cụ thể u ( k ) từ đ/kiện đầu x0 15 January 2014 © H T Hoàng - HCMUT 79 (80) Trình tự giải bài toán ĐK tối ưu rời rạc dùng DP (tt) * Vòng ngược: tìm u ((kk ) phụ thuộc x(k) (k=N10), 0) gồm các bước: ( N 1) là nghiệm bài toán tối ưu: Tìm u* (N ( N 1) phụ thuộc x (N J N* 1 ( x ( N 1)) L( x ( N 1), u( N 1)) ( N , x ( N )) u ( N 1) ) u( N 1)) x ( N ) với ràng buộc f ( x ( N 1), Với k N :tìm u* (k ) phụ thuộc x (k ) là nghiệm PT Bellman: J k* ( x (k )) L( x (k ), u(k )) J k*1 ( f ( x (k ), u(k ))) u( k ) với J k*1 (.) ( ) là biểu thức hàm mục tiêu tối ưu tối ưu đoạn quỹ đạo cuối đã tìm bước trước đó J k ((.)) 0 Chú ý ý: để tìm tì u (k ) , áp á dụng d PP tối ưu tĩnh, tĩ h giải iải PT PT: u(k ) * 15 January 2014 © H T Hoàng - HCMUT 80 (81) Trình tự giải bài toán ĐK tối ưu rời rạc dùng DP (tt) * (k ) Thực các bước Vòng xuôi: xác định giá trị cụ thể uk (k sau đây với k=0,1,2,….N1: Gán x (k ) vào công thức u* (k (k ) đã tính vòng ngược để giá trị cụ thể u* (k ) Thay u* (k Tha ào mô hình toán đối ttượng ợng để tính đ ợc (k ) vào trạng thái tối ưu thời điểm (k+1) x (k 1) f ( x (k ), ) u* (k )) 15 January 2014 © H T Hoàng - HCMUT 81 (82) Điều khiển tối ưu rời rạc dùng DP – Thí dụ Xét đối tượng là khâu quán tính bậc có mô hình trạng thái: 1 x(k 1) x(k ) u (k ) 2 Xá định Xác đị h tín í hiệu hiệ điề điều khiể khiển tối ối ưu để điề điều khiển khiể hệ thống hố từ trạng thái đầu x(0)=4 đến trạng thái cuối x(4)=0 cho: J ( x (k ) u (k )) i k 0 Giải: Phương trình Bellman: ( x(k )) minx (k ) u J k* ( x (k )) L( x (k ), u(k )) J k*1 ( f ( x (k ), u(k ))) u( k ) J k* u(k ) (k ) J k*1 (0.5 x(k ) 0.5u (k )) (k 3) với: J 4* ( x(4)) 15 January 2014 © H T Hoàng - HCMUT 82 (83) Điều khiển tối ưu rời rạc dùng DP – Thí dụ (tt) Vòng ngược: Với k = 3: Phương trình Bellman: J 3* ( x(3)) x (3) u (3) u ( 3) (do J 4* ( x(4)) ) Điều kiện ràng buộc:0.5 x(3) 0.5u (3) x(4) Lời giải: u * (3) x(3) (để thỏa mãn điều kiện ràng buộc) J 3* ( x(3)) x (3) 15 January 2014 © H T Hoàng - HCMUT 83 (84) Điều khiển tối ưu rời rạc dùng DP – Thí dụ (tt) Vòng ngược: Với k = 2: Phương trình Bellman: ( x(2)) minx (2) u J 2* ( x(2)) x (2) u (2) J 3* ( x(3)) u ( 2) J 2* u ( 2) (2) x (3) 1 * 2 J ( x(2)) i x (2) u (2) x(2) u (2)) u ( 2) 2 3 * J ( x(2)) x (2) x(2)u (2) u (2) u ( 2) 2 J (.) x ( 2) x(2) 3u (2) u * (2) Do u (2) J 2* ( x(2)) x (2) x(2) 2 x(2) x(2) 2 J ( x(2)) x (2) * 15 January 2014 © H T Hoàng - HCMUT 84 (85) Điều khiển tối ưu rời rạc dùng DP – Thí dụ (tt) Vòng ngược: Với k = 1: Phương trình Bellman: J1* ( x(1)) x (1) u (1) J 2* ( x(2)) u (1) * J1 ( x(1)) x (1) u (1) x (2) u (1) * 2 J1 ( x(1)) x (1) u (1) ( x(1) u (1)) u (1) 2 4 J1* ( x(1)) x (1) x(1)u (1) u (1) u (1) 3 3 J (.) x(1) Do: x(1) u (1) u * (1) u (1) x(1) x(1) ( ) x 2 4 J1* ( x(1)) x (1) 2 J1* ( x(1)) x (1) 15 January 2014 © H T Hoàng - HCMUT 85 (86) Điều khiển tối ưu rời rạc dùng DP – Thí dụ (tt) Vòng ngược: Với k = 0: Phương trình Bellman: J 0* ( x(0)) x (0) u (0) J1* ( x(1)) u0 1 J 0* ( x(0)) x (0) u (0) x (1) u (0) * 2 J ( x(0)) x (0) u (0) ( x(0) u (0)) u (0) 2 J 0* ( x(0)) 21 x (0) x(0)u (0) 21 u (0) u ( ) 16 16 J (.) 21 * x(0) u (0) u (0) x(0) Do: u (0) 8 21 2 J 0* ( x(0)) x (0) x(0) x(0) x(0) 21 21 2 26 J 0* ( x(0)) x (0) 21 15 January 2014 © H T Hoàng - HCMUT 86 (87) Thí dụ giải bài toán ĐK tối ưu rời rạc dùng DP (tt) Vòng xuôi: Điều kiện đầu: x(0) 20 Với k = 0: u (0) x(0) 21 21 * 1 20 32 * x(1) ( x(0) u (0)) 2 21 21 Với k = 1: u * (1) x(1) 21 1 32 12 * x(2) ( x(1) u (1)) 21 21 21 15 January 2014 © H T Hoàng - HCMUT 87 (88) Thí dụ giải bài toán ĐK tối ưu rời rạc dùng DP (tt) Vòng xuôi: Với k = 2: Với k = 3: x(2) u (2) 21 1 12 x(3) ( x(2) u * (2)) 2 21 21 21 * u * (3) x(3) 21 1 4 * x(4) ( x(3) u (3)) 2 21 21 4 20 Kết luận: Chuổi tín hiệu ĐK tối ưu là: u ; ; ; 21 21 21 21 * Chỉỉ tiêu chất ấ lượng tối ố ưu: J J 0* ( x(0)) 15 January 2014 © H T Hoàng - HCMUT 26 416 x (0) 21 21 88 (89) Qui hoạch động giải bài toán ĐK tối ưu liên tục Cho đối tượng mô tả phương trình trạng thái: x (t ) f ( x (t ), u(t ), t ) Trạng g thái đầu: x (0) x0 , trạng g thái cuối: x (t f ) x f Bài toán điều khiển tối ưu: tìm tín hiệu điều khiển u(t) cho: tf J (u) ( x (t f )) L( x (t ), u(t ), t )dt ((*)) ti Đặt: Hàm mục tiêu tối ưu đoạn quỹ đạo cuối từ thời điểm ti, trạng thái xi đến thời điểm cuối tf, trạng thái cuối x(tf) là J (ti , xi ) min ( x (t f )) L( x (t ), u(t ), t )dt tf * u(t ) ti Nếu tồn lời giải tối ưu bài toán ((*)) thì hàm mục tiêu tối ưu đoạn quỹ đạo cuối phải thỏa mãn phương trình Hamilton-Jacobi-Bellman: T J (t , x ) J (t , x ) i L( x, u, t ) f ( x, u, t ) u(t ) t x * 15 January 2014 * © H T Hoàng - HCMUT 89 (90) ĐIỀU CHỈNH TOÀN PHƯƠNG TUYẾN TÍNH (Linear Quadratic Regulator – LQR) 15 January 2014 © H T Hoàng - HCMUT 90 (91) Bài toán LQR liên tục Đối tượng tuyến tính mô tả phương trình trạng thái: x (t ) Ax (t ) Bu(t ) (*) ) x2 (t ), , ) xn (t )]T : vector t đó đó: x (t ) [ x1 (t ), t trạng t thái u(t ) [u1 (t ), u2 (t ), , um (t )]T : vector tín hiệu điều khiển Bài toán á đặt đặ là tìm ì tín í hiệu hiệ điều điề khiển khiể u(t) ( ) điều điề chỉnh hỉ h hệ thống hố từ trạng thái đầu x (0) x0 trạng thái cuối x(tf) = cho ợ g dạng g toàn phương: p g tối thiểu tiêu chất lượng tf T J (u) x (t f ) Mx (t f ) x T (t )Qx (t ) uT (t ) Ru(t ) dt 2 t0 đó Q và M là các ma trận trọng số bán xác định dương R là ma trận ậ trọng ọ g số xác định ị dương g Bài toán trên gọi là bài toán điều chỉnh toàn phương tuyến tính 15 January 2014 © H T Hoàng - HCMUT 91 (92) Điều kiện cực trị bài toán LQR liên tục Hàm Hamilton: T H x (t )Qx (t ) uT (t ) Ru(t ) T (t )Ax (t ) Bu(t ) Điều kiện cần để có lời giải tối ưu: PT trạng thái: hái x (t ) Ax A (t ) Bu B (t ) (1) H PT đồng trạng thái: (t ) (2) Q Qx (t ) A (t ) x H t) Điều kiện dừng: Ru(t ) B T (t ) 0x (t ) f ( x (t ), u(t ),(3) u H T (t ) x H 0 T H (t ) L( x, u , t ) (t ) f ( x , u, t ) 15 January 2014 © H T Hoàng - HCMUT 92 (93) Cách tìm lời giải tối ưu Rút u(t) từ (3): u(t ) R 1 B T (t ) (4) Th (4) vào Thay à (1), (1) tta đượ x (t ) Ax (t ) BR 1 B T (t ) Kết ế hợp (5) và (2), ta phương trình vi phân: x (t ) A BR 1 B T x (t ) (t ) Q A (t ) (5) (6) Giải phương trình vi phân (6), tìm x(t) và (t) Thay (t) vào (4) tìm lời giải tối ưu 15 January 2014 © H T Hoàng - HCMUT 93 (94) Lời giải bài toán LQR liên tục Tí hiệu Tín hiệ điều điề khiển khiể tối ưu: u* (t ) K (t ) x (t ) đó: K (t ) R 1 B T P (t ) và P(t) là nghiệm bán xác định dương phương trình vi phân Ricatti: P PA AT P Q PBR 1 B T P P (t f ) M Lời giải phương trình Ricatti: Trường hợp hệ bậc 2: có thể giải tay Trường hợp tổng quát: tham khảo thêm tài liệu 15 January 2014 © H T Hoàng - HCMUT 94 (95) Bài toán LQR liên tục thời gian vô hạn Đối tượng tuyến tính mô tả phương trình trạng thái: x (t ) Ax (t ) Bu(t ) Chỉ tiêu chất lượng dạng toàn phương, phương đó thời điểm cuối tf=: J (u) x T (t )Qx (t ) uT (t ) Ru(t ) dt 20 Tín hiệu điều khiển tối ưu: u* (t ) Kx (t ) đó: K R 1 B T P và P là nghiệm bán xác định dương phương trình đại số Ricatti: PA AT P Q PBR 1 B T P Chú ý: trường hợp này K và P là không phụ thuộc thời gian Giá trị cực tiểu ể tiêu chất ấ lượng: J x T (0) Px (0) 15 January 2014 © H T Hoàng - HCMUT 95 (96) Điều khiển LQR liên tục – Thí dụ Cho hệ tuyến tính bậc không ổn định mô tả PTTT: x (t ) 3x(t ) 2u (t ) Yêu cầu: Thiết kế luật ậ điều khiển u(t) ( ) để hệệ kín ổn định ị và tối thiểu tiêu chất lượng: J ( x (t ) 5u (t ))dt 20 Giải: Phương trình đại số Ricatti: PA AT P Q PBR 1 B T P P.3 3.P P.2 .2.P P 6P 5 P 7.663 (chọn nghiệm xác định dương) 1 T Độ lợi hồi tiếp trạng thái: K R B P K 2.(7,663) 3,065 Luật điều ề khiển ể tối ố ưu: u (t ) Kx(t ) u (t ) 3,065 x(t ) 15 January 2014 © H T Hoàng - HCMUT 96 (97) Điều khiển LQR liên tục – Thí dụ x1 x2 Cho hệ tuyến tính bậc mô tả PTTT: x2 u Yêu cầu: Yê ầ Thiết kế luật l ật điều điề khiển khiể u(t) (t) để hệ kín kí ổn ổ định đị h vàà tối thiểu thiể tiêu chất lượng: J (2 x12 (t ) 2u (t ))dt 20 Giải: x1 (t ) 0 1 x1 (t ) 0 Viết lại phương p g trình trạng g thái: u (t ) 0 x2 (t ) 1 x2 (t ) B A Viết lại tiêu chất lượng: ợ g 2 0 x1 J x1 x2 u (t ))dt 0 x2 R 20 Q 15 January 2014 © H T Hoàng - HCMUT 97 (98) Điều khiển LQR liên tục – Thí dụ Phương trình đại số Ricatti: PA AT P Q PBR 1 B T P p1 p2 0 0 p2 0 1 0 0 p1 p3 0 0 1 0 p2 p1 p2 p1 p2 p1 p2 p3 15 January 2014 p2 p3 0 p1 p2 2 0 p22 p2 0 0 p2 p3 p1 p2 p3 0 p2 p32 0 0 p 0 p1 0 1 p3 1 p2 p2 0 p3 p2 p3 0 p3 © H T Hoàng - HCMUT 98 (99) Điều khiển LQR liên tục – Thí dụ 2 p p1 p2 p3 2 p2 p32 p1 2 p2 p 2 Độ lợi hồi tiếp trạng thái: 2 1 T K R B P K 0 1 2 P 2 2 2 K [1 2] Luật điều khiển tối ưu: u (t ) Kx (t ) [1 * 15 January 2014 x1 (t ) ] x ( t ) u * (t ) x1 (t ) x2 (t ) © H T Hoàng - HCMUT 99 (100) Điều khiển LQR liên tục – Thí dụ Cho hệ tuyến tính bậc mô tả PTTT: x1 (t ) 0 x1 (t ) x (t ) 2 x (t ) 1u (t ) B A Yêu cầu: Thiết kế luật điều khiển u(t) để hệ kín ổn định và tối thiểu tiêu chất lượng: J [2 x12 (t ) x22 (t ) u (t )]dt 20 Giải: Viết lại tiêu chất lượng: ợ g J ([ x1 20 15 January 2014 2 0 x1 x2 ] u (t ))dt x2 R Q © H T Hoàng - HCMUT 100 (101) Điều khiển LQR liên tục – Thí dụ Phương trình đại số Ricatti: PA AT P Q PBR 1 B T P p1 p2 p2 p3 p2 0 p1 p3 2 1 2 p2 p1 p2 p2 p2 p3 p1 p2 p2 p22 p3 p1 p2 p2 p3 15 January 2014 p2 0 p3 0 1 p p 0 p1 1 p2 p2 p3 1 p3 2 0 p22 p2 p3 0 1 p2 p3 p2 0 p3 p2 p3 0 p3 p1 p2 p3 p2 p3 0 p2 p3 p3 © H T Hoàng - HCMUT 101 (102) Điều khiển LQR liên tục – Thí dụ p2 p22 p p p p p 3 p p1 p2 p2 p3 2 p2 p3 p32 p1 2.403 p2 0.732 p 0.542 (chọn các nghiệm g ệ dương) g) 2.403 0.732 P 732 542 Độ lợi hồi tiếp trạng thái: 2.403 0.732 K R B P K 0 1 K [0.732 0.542] 0.732 0.542 x1 (t ) * Luật điều khiển tối ưu: u (t ) Kx (t ) [0.732 0.542] ( ) x t 1 T u * (t ) 0.732 x1 (t ) 0.542 x2 (t ) 15 January 2014 © H T Hoàng - HCMUT 102 (103) Bài toán LQR rời rạc Cho đối tượng tuyến tính rời rạc mô tả phương trình trạng thái: (*) x (k 1) Ad x (k ) Bd u(k ) ) x2 (k ), , ) xn (k )]T: vector t đó đó: x (k ) [ x1 (k ), t trạng t thái u(k ) [u1 (k ), u2 (k ), , um (k )]T: vector tín hiệu điều khiển Bài toán á đặ đặt là tìm ì tín í hiệu hiệ điều điề khiển khiể u(k) (k) điều điề chỉnh hỉ h hệ thống hố từ trạng thái đầu x (0) x0 trạng thái cuối x(N) = cho ợ g dạng g toàn phương: p g tối thiểu tiêu chất lượng N 1 T T J (u) x ( N ) Mx ( N ) x (k )Qx (k ) uT (k ) Ru(k ) k 0 0 đó Q và M là các ma trận trọng số bán xác định dương ậ trọng ọ g số xác định ị dương g R là ma trận 15 January 2014 © H T Hoàng - HCMUT 103 (104) Lời giải bài toán LQR rời rạc Tí hiệu Tín hiệ điều điề khiển khiể tối ưu: u* (k ) K (k ) x (k ) 1 K (k ) B P (k 1) Bd R BdT P (k 1) Ad đó: T d và P(k) là nghiệm bán xác định dương phương trình Ricatti: P ( k ) A P ( k 1) P ( k 1) Bd B P ( k 1) Bd R T d T d 1 BdT P ( k 1) Ad Q P (N ) M Nghiệm phương trình Ricatti rời rạc: thay k ( N 1) vao phương trình Ricatti tìm P(k) 15 January 2014 © H T Hoàng - HCMUT 104 (105) Bài toán LQR rời rạc thời gian vô hạn Đối tượng tuyến tính mô tả phương trình trạng thái rời rạc: x (k 1) Ad x (k ) Bd u(k ) Chỉ tiêu chất lượng dạng toàn phương, phương đó thời điểm cuối N N=: : T J (u) x (k )Qx (k ) uT (k ) Ru(k ) k 0 Tín hiệu điều khiển tối ưu: u* (k ) Kx (k ) 1 K B PBd R BdT PAd và P là nghiệm bán xác định dương phương trình đại số Ricatti: t đó: đó T d P A P PBd B P Bd R T d T d 1 BdT P Ad Q Chú ý: trường hợp này K và P là không phụ thuộc k Giá trị cực tiểu tiêu chất lượng: J x T (0) Px (0) 15 January 2014 © H T Hoàng - HCMUT 105 (106) Lời giải bài toán LQR thời gian vô hạn dùng Matlab Nghiệm phương trình đại số Ricatti liên tục (continuous algebraic Ricatti equation – care) ( Q ) >> P=care(A,B,Q,R) Lời giải bài toán LQR (Linear quadratic Regulator – LQR) liên tục >> K=lqr(A,B,Q,R) Nghiệm hi phương h trình ì h đại đ i sốố Ricatti i i rời ời rạc(discrete (di algebraic l b i Ricatti i i equation – dare) >> P P=dare(A dare(A,B,Q,R) B Q R) Lời giải bài toán LQR (Linear quadratic Regulator – LQR) rời rạc >> K=dlqr(A,B,Q,R) 15 January 2014 © H T Hoàng - HCMUT 106 (107) BỘ LỌC KALMAN 15 January 2014 © H T Hoàng - HCMUT 107 (108) Lọc Kalman liên tục x (t ) Ax (t ) Bu (t ) w (t ) Xét é hệ h tuyến ế tính í h liên li tục: y (t ) Cx(t ) v(t ) Trong đó: w(t) là nhiễu hệ thống; v(t) là nhiễu đo lường lường Giả sử nhiễu hệ thống và nhiễu đo lường có phân bố Gauss, không tương quan, có trung bình và phương sai là: E[ ww T ] Q N E[vvT ] RN xˆ (t ) [ Axˆ (t ) Bu (t )] L[ y (t ) yˆ (t )] Bộ lọc Kalman liên tục: yˆ (t ) Cxˆ (t ) Trong đó L là độ lợi lọc Kalman: L C T RN1 với là nghiệm phương trình Ricatti: A AT C T RN1C Q N 15 January 2014 © H T Hoàng - HCMUT 109 (109) Sơ đồ khối lọc Kalman liên tục u(t) x (t ) Ax (t ) Bu (t ) x(t) C + L B ++ + y(t) () xˆ (t ) C yˆ (t ) A Bộ lọc Kalman: xˆ (t ) Axˆ (t ) Bu (t ) L( y (t ) yˆ (t )) yˆ (t ) Cxˆ (t ) Trong đó: L C T RN1 A AT C T RN1C Q N 15 January 2014 © H T Hoàng - www4.hcmut.edu.vn/~hthoang/ 110 (110) Bộ lọc Kalman liên tục – Thí dụ Cho hệ tuyến tính bậc mô tả PTTT: x (t ) Ax (t ) Bu (t ) w (t ) y (t ) Cx(t ) v(t ) 1 0 Trong đó: A B C 1 0 2 0.2 T E vv [ ] RN 0.01 E[ ww T ] Q N 0.1 Yêu cầu: ầ Thiết ế kếế lọc Kalman ước lượng trạng thái hệ thống ố trên từ tín hiệu đo y(t) Giải: xˆ (t ) Axˆ (t ) Bu (t ) L( y (t ) yˆ (t )) Bộ ước lượng trạng thái: yˆ (t ) Cxˆ (t ) L C T RN1 15 January 2014 © H T Hoàng - HCMUT 111 (111) Bộ lọc Kalman liên tục – Thí dụ Trong đó là nghiệm phương trình đại số Ricatti: A AT Q N C T RN1C p1 0 2 p2 p2 p1 p2 p2 p1 p3 p2 p3 p2 p2 p3 p3 p2 0.2 100 p12 p3 p1 p2 100 p1 p2 15 January 2014 p2 0 0.2 p3 1 2 0.1 p1 p2 1 p1 p2 p2 p3 0 0.01 p2 0 p3 p1 p2 0.2 p2 p3 0.1 p12 p1 p2 100 0 p2 p1 p2 p3 p1 p2 100 p1 p2 0 p2 p3 0.1 p2 © H T Hoàng - HCMUT 112 (112) Bộ lọc Kalman liên tục – Thí dụ (1) 2 p2 0.2 100 p12 p3 p1 p2 100 p1 p2 (2) p2 p3 0.1 p22 (3) (2) &(3) p22 400 p1 p2 p1 10 p2 0.1 (4) 2 (1) &(4) (50 p1 0.1) (50 p1 0.1)(400 p1 10) p1 0.1 2500 p14 20000 p13 490 p12 36 p1 1.09 p1 0.0441 0.0441 0.00279 p2 0.00279 0.00279 0.0262 p3 0.0262 Độ lợi lọc Kalman: L C T RN1 0.0441 0.00279 1 L 0.0262 0 0.01 0.00279 15 January 2014 © H T Hoàng - HCMUT 4.409 L 0.279 113 (113) Lọc Kalman rời rạc x (k 1) Ad x (k ) Bd u (k ) w (k ) Xét hệ tuyến ế tính rời rạc: y (k ) C d x(k ) v(k ) Trongg đó: w(k) ( ) là nhiễu hệệ thống; g; v(k) ( ) là nhiễu đo lường g Giả sử nhiễu hệ thống và nhiễu đo lường có phân bố Gauss, không tương quan, có trung bình và phương sai là: E[ ww T ] Q N E[vvT ] RN Bộ lọc Kalman rời rạc: xˆ (k 1) [ Ad xˆ (k ) Bd u (k )] Lk [ y (k 1) yˆ (k 1)] yˆ (k ) C xˆ (k ) d Trong đó L là độ lợi lọc Kalman: 1 T T L(k ) Ad (k )C d C d (k )C d RN với là nghiệm phương trình Ricatti: (k 1) Ad (k ) AdT Q N Ad (k )C dT RN1C d (k ) AdT 15 January 2014 © H T Hoàng - HCMUT 114 (114) Sơ đồ khối lọc Kalman rời rạc u(t) x d ( k 1) Ad x ( k ) Bd u ( k ) x(t) y(t) () Cd + L Bd ++ + z 1 xˆ (t ) Cd yˆ (t ) Ad ˆ ˆ ˆ Bộ lọc Kalman: x (k 1) [ Ad x (k ) Bd u (k )] Lk [ y (k 1) y (k 1)] yˆ (k ) C d xˆ (k ) Trong đó: L(k ) Ad (k )C C d (k )C RN T d T d 1 (k 1) Ad (k ) AdT QN Ad (k )C dT RN1C d (k ) AdT 15 January 2014 © H T Hoàng - www4.hcmut.edu.vn/~hthoang/ 115 (115) Lời giải lọc Kalman dùng Matlab Lời giải lọc Kalman liên tục: >> L = lqe(A,G,C,QN,RN) l (A G C QN RN) 15 January 2014 %G ma trận ậ đđơn vịị © H T Hoàng - HCMUT 116 (116) BỘ ĐIỀU KHIỂN LQG (Linear Quadratic Gaussian) 15 January 2014 © H T Hoàng - HCMUT 117 (117) Bài toán điều khiển LQG (Linear Quadratic Gaussian) Xét hệ tuyến tính liên tục bị tác động nhiễu Gauss: x (t ) Ax (t ) Bu (t ) w (t ) y (t ) Cx(t ) v(t ) Trong đó: w(t) là nhiễu hệ thống; v(t) là nhiễu đo lường Giả sử nhiễu không tương quan, có trung bình và phương sai là: E[ ww T ] Q N E[vvT ] RN Bài toán đặt là tìm tín hiệu điều khiển u(t) điều chỉnh hệ thống từ trạng thái đầu x (0) x0 trạng thái cuối x(tf) = cho tối thiểu tiêu chất lượng dạng toàn phương: 1 T T J (u) E x (t )Qx (t ) u (t ) Ru(t ) dt 2 t đó Q là các á ma trận t ậ ttrọng số ố bán bá xác á đị định h dương dươ R là ma trận trọng số xác định dương 15 January 2014 © H T Hoàng - HCMUT 118 (118) Nguyên lý tách rời Nguyên lý tách rời: Bài toán tối ưu LQG có thể giải cách giải riêng bài toán điều khiển tối ưu tiền định và bài toán ước lượng trạng thái tối ưu LQG = LQR + Lọc Kalman 15 January 2014 © H T Hoàng - HCMUT 119 (119) Lời giải bài toán điều khiển LQG Tín hiệu điều khiển tối ưu LQR: u* (t ) Kxˆ (t ) với độ lợi hồi tiếp trạng thái: K R 1 B T P đó P là nghiệm bán xác định dương pt đại số Ricatti: PA AT P Q PBR 1 B T P Bộ lọc Kalman: xˆ (t ) [ Axˆ (t ) Bu (t )] L[ y (t ) yˆ (t )] yˆ (t ) Cxˆ (t ) với độ lợi ước lượng: L C T RN1 đó là nghiệm bán xác định dương pt đại số Ricatti: A AT C T RN1C Q N 15 January 2014 © H T Hoàng - HCMUT 120 (120) Sơ đồ khối điều khiển LQG liên tục r(t) u(t) x (t ) Ax (t ) Bu (t ) x(t) y(t) C + L B ++ + xˆ (t ) C yˆ (t ) A K Bộ điều khiển LQR u* (t ) Kxˆ (t ) K R 1 B T P PA AT P Q PBR 1 B T P 15 January 2014 Bộ lọc Kalman xˆ (t ) Axˆ (t ) Bu (t ) L( y (t ) yˆ (t )) yˆ (t ) Cxˆ (t ) L C T RN1 A AT C T RN1C QN © H T Hoàng - www4.hcmut.edu.vn/~hthoang/ 121 (121) THÍ DỤ THIẾT KẾ ĐIỀU Ề KHIỂN Ể TỐI Ố ƯU 15 January 2014 © H T Hoàng - HCMUT 122 (122) Đối tượng điều khiển: hệ lắc ngược Thông số hệ lắc ngược M =1.0 kg: trọng lượng xe m=0.1kg : trọng lượng lắc l = 1.0 m: chieààu daøi laééc u : lực tác động vào xe [N] g:g gia tốc trọïng trường [[m/s2]] x : vò trí xe [m] : góc lắc và phương thaúng ñöng thang đứng [rad] Mô hình toán hệ lắc ngược u ml (sin ) mg cos sin x M m m(cos ) u cos ( M m) g (sin ) ml (cos sin ) ml (cos ) ( M m)l 15 January 2014 © H T Hoàng - ÐHBK TPHCM 123 (123) PTTT phi tuyến hệ lắc ngược Đặt các biến trạng thái x1 , x2 , x3 x, x4 x Phương trình trạng thái phi tuyến x2 x1 u cos x1 ( M m) g (sin x1 ) ml (cos x1 sin x1 ) x2 x ml (cos x1 ) ( M m)l 2 x4 x3 u ml (sin ( x ) x mg g cos x sin x 1 x4 M m m(cos x1 ) Yêu cầu: Thiết kế điều khiển giữ cân lắc quanh vị trí thẳng đứng 15 January 2014 © H T Hoàng - ÐHBK TPHCM 124 (124) PTTT tuyến tính hệ lắc ngược PTTT tuyến tính hóa quanh điểm cân thẳng đứng (góc lệch nhỏ 100) 0 x x1 M m 1 x g 0 x2 Ml Ml u 0 x3 x3 m x4 M g 0 0 x4 M Thay cụ thể thông số hệ lắc ngược: 0 x1 x1 x 10.78 0 0 x 1 2 u x3 0 1 x3 x 0.98 0 0 x4 B A 15 January 2014 © H T Hoàng - ÐHBK TPHCM 125 (125) Thiết kế điều khiển LQR Giả thiết: Đặc tính động hệ lắc ngược có thể mô tả hệ phương trình biến trạng thái tuyến tính Điều này hỉ đúng đú góc ó lệch lệ h nhỏ hỏ Hệ thống phản hồi trạng thái đầy đủ, nghĩa là có thể đo biến trạng thái (góc lệch , vận tốc góc, vị trí xe x, vận tốc xe ) Không có nhiễu tác động vào hệ thống Thiết kế dù dùng Matlab: M tl b >> K = lqr(A,B,Q,R) Tùy theo độ lớn tương đối trọng số Q và R mà hệ thống có đáp ứng quá độ và lượng tiêu tốn khác Muốn trạng thái đáp ứng nhanh tăng thành phần Q tương ứng Muốn giảm lượng tăng R 15 January 2014 © H T Hoàng - ÐHBK TPHCM 126 (126) Mô điều khiển LQR hệ lắc ngược 15 January 2014 © H T Hoàng - ÐHBK TPHCM 127 (127) Kết mô điều khiển LQR hệ lắc ngược 0 0 0 0 0 1 -0.5 [m],[m m/s] 1 0 Q 0 0 [rad],[rad/s] 0.5 x x 0.5 -0.5 R 1 10 [N] 15 January 2014 u Góc lệ Gó lệch h lắ lắc giữ cân tốt, tuyy nhiên vị trí xe dao động khá lớn -5 Time [s] K= [34.3620 10.7009 1.000 2.4109] © H T Hoàng - ÐHBK TPHCM 128 (128) Kết mô điều khiển LQR hệ lắc ngược 0 0 100 0 0 1 0 15 January 2014 -0.5 -1 0 20 u 10 [N] x x -1 R 1 Tăng trọng số q33 (tương ứng với vị trí xe) vị trí xe ít dao động hơn, nhiên lượng tiêu tốn tăng lên [m],[m m/s] 1 0 Q 0 0 [rad],[rad/s] 0.5 -10 Time [s] K=[70.1356 22.1091 10.000 11.0514] © H T Hoàng - ÐHBK TPHCM 129 (129) Kết mô điều khiển LQR hệ lắc ngược 0 0 100 0 0 1 0 15 January 2014 -0.5 -1 0 20 u 10 [N] x x -1 R 1 Khuyết điểm điều khiển LQR là có nhiễu đo lường thì chất lượng điều khiển bị ảnh hưởng đáng kể [m],[m m/s] 1 0 Q 0 0 [rad],[rad/s] 0.5 -10 10 Time [s] K=[70.1356 22.1091 10.000 11.0514] © H T Hoàng - ÐHBK TPHCM 130 (130) Thiết kế điều khiển LQG Giả thiết: Hệ thống hoạt động miền tuyến tính Giả sử đo ợ g góc lệch ệ và vịị trí xe Có nhiễu tác động vào hệ thống Nhiễu đo vị trí xe có phương sai là 0.01; nhiễu đo góc lệch lắc có phương sai 0.001 001 Dùng lọc Kalman để ước lượng trạng thái và lọc nhiễu Thiết ế kế ế dùng Matlab: >> K = lqr(A,B,Q,R) >> L = lqe(A,G,C,QN,RN) q ( , , ,Q , ) 15 January 2014 %G là ma trận ậ đơn vịị © H T Hoàng - ÐHBK TPHCM 131 (131) Thiết kế điều khiển LQG Bộ điều khiển LQR 1 0 Q 0 0 0 0 100 0 0 1 0 K=[70.1356 22.1091 10.000 11.0514] R 1 Bộ lọc Kalman Q N 0.000001I 0.001 RN 0 01 6.5617 0.0571 21.5437 0.1876 L 0.5713 0.1470 1.9568 0.0271 (Do ta giả sử không có nhiễu hệ thống nên chọn QN bé bé Hai thành phần RN chính là phương sai nhiễu đo lường) 15 January 2014 © H T Hoàng - ÐHBK TPHCM 132 (132) Mô điều khiển LQG hệ lắc ngược 15 January 2014 © H T Hoàng - ÐHBK TPHCM 133 (133) Kết mô điều khiển LQG hệ lắc ngược [rad],[rad/s] -1 -2 [m],[m/s] x x -2 10 [N] 6 u -10 Time [s] Bộ lọc Kalman ước lượng trạng thái và lọc nhiễu, nhờ mà đáp ứng hệ thống điều khiển LQG tốt LQR trường hợp hệ thống có nhiễu 15 January 2014 © H T Hoàng - ÐHBK TPHCM 134 (134) MỘT SỐ CÔNG THỨC CẦN NHỚ 15 January 2014 © H T Hoàng - HCMUT 135 (135) Nghiệm phương trình vi phân bậc Phương trình vi phân bậc đồng : x (t ) ax(t ) at x ( t ) Ce Nghiệm tổng quát: Hằng số C xác định dựa vào điều kiện biên 15 January 2014 © H T Hoàng - HCMUT 136 (136) Nghiệm phương trình vi phân bậc (tt) Phương trình vi phân bậc không đồng : x (t ) ax (t ) b x (t ) Ce at b a Nghiệm tổng quát: Hằng ằ số ố C xác định dựa vào điều ề kiện biên 15 January 2014 © H T Hoàng - HCMUT 137 (137) Nghiệm phương trình vi phân bậc (tt) Phương trình vi phân bậc không đồng : x (t ) p (t ) x(t ) q (t ) Nghiệm tổng quát: đó: (t )q(t )dt C x(t ) (t ) p ( t ) dt (t ) e Hằng số C xác định dựa vào điều kiện biên biên 15 January 2014 © H T Hoàng - HCMUT 138 (138) Nghiệm phương trình vi phân bậc Phương trình vi phân bậc đồng : ax(t ) bx (t ) cx(t ) Nghiệm tổng quát: Trường hợp 1: b 4ac x(t ) C1e p1t C2 e p2t Trường hợp 2: b 4ac x(t ) C1e pt C2te pt với p1, (b ) /(2a) với p b /(2a) Trường hợp 3: b 4ac x(t ) C1et sin t C2 et cos t Với b /(2a) và /(2a) Hằng số C1 và C2 xác định dựa vào điều kiện biên 15 January 2014 © H T Hoàng - HCMUT 139 (139) Nghiệm phương trình vi phân bậc Phương trình vi phân bậc không đồng : ax(t ) bx (t ) cx(t ) d d Nghiệm tổng quát: x z c đó z(t) là nghiệm phương trình vi phân đồng nhất: az(t ) bz (t ) cz (t ) Hằng số C1 và C2 xác định dựa vào điều kiện biên 15 January 2014 © H T Hoàng - HCMUT 140 (140) Nghiệm phương trình trạng thái Phương trình vi phân bậc 1: x (t ) Ax (t ) Bu (t ) Điều kiện đầu: x (t0 ) x0 ) x2 (t ), , ) xn (t )]T n đó: x (t ) [ x1 (t ), A nn t Nghiệm : x(t ) (t ) x(t0 ) (t ) Bu ( )d t0 Trong đó: (t ) e At Cách 1: (t ) e At L1 ( sI A) 1 Cách 2:(t ) e At C0 I C1 A C2 A2 Cn 1 An 1 thay các trị riêng i ma trận A (nghiệm det(I A) ) vào phương trình trên tính các hệ số Ci 15 January 2014 © H T Hoàng - HCMUT 141 (141) Nghiệm phương trình trạng thái (tt) Các trường hợp riêng phương trình vi phân bậc 1: Nếu B=0: x (t ) Ax (t ) x(t ) (t ) x(t0 ) e A(t t0 ) x(t0 ) Nếu u=1: x (t ) Ax (t ) B t x(t ) (t ) x(t0 ) (t ) Bd t0 15 January 2014 © H T Hoàng - HCMUT 142 (142) Tổng kết chương Sau học xong chương 3, sinh viên phải có khả năng: Giải bài toán tối ưu động không ràng buộc và có ràng buộc Thành Thà h lậ lập các á bài ttoán á điề điều khiể khiển tối ưu động độ Giải bài toán tối ưu động liên tục dùng phương pháp biến phân Giải bài toán tối ưu rời rạc dùng phương pháp qui hoạch động Thiết ế kế ế điều ề khiển ể LQR, lọc Kalman, điều ề khiển ể LQG 15 January 2014 © H T Hoàng - HCMUT 143 (143)