Vấn đề điều khiển tối ưu tác động nhanh đối với hệ- 123docz.net

bám sát mục tiêu

Như chương II đã trình bày, động học của đối tượng trong trường hợp này có dạng:   ( ) ( ) Ty t  y t ku t , (3.16)   max u t U . (3.17) Trong đó: y t( ) đầu ra của đối tượng; T  hằng số thời gian; k – hệ số khuếch đại; u t( ) tác động điều khiển. Ở đây, tác động điều khiển bị giới hạn, thỏa mãn điều kiện (3.17).

Để tiện cho việc giải bài toán tổng hợp hệ thống bám sát đối với đối tượng (3.16) phương trình động học được viết lại dưới dạng phương trình theo sai số

( ) d( ) ( )

x t  y t  y t , mày td( ) là tín hiệu đầu vào của hệ thống.    

( ) ( )

Tx t x t  ku t  f t , (3.18) trong đó: f t Tyd t  yd t . (3.19) Từ (3.19) ta nhận thấy rằng nhiễu f t( ) là do đạo hàm các bậc của tín hiệu đầu vào gây ra. Trong trường hợp y td( )const, nhiễu f t( ) sẽ bằng không. Nếu nhiễu f t( ) đo được, hoặc có thể xác định được bằng cách nào đó, thì tác động của nhiễu f t( ) lên hệ thống sẽ được bù trừ. Trong các trường hợp nêu trên, phương trình (3.18) sẽ có dạng:

  ( ) ( )

Tx t x t  ku t . (3.20) Để cho gọn ta tạm thời không chỉ rõ biến thời gian t của các hàm

( ), ( )

x t u t . Phương trình (3.20) có thế được biến đổi thành hệ phương trình: x1 x2 , (3.21)

2 2

Tx   x ku, (3.22) trong đó x t1   x t .

Bài toán điều khiển tối ưu tác động nhanh cho đối tượng (3.21), (3.22), (3.17) đòi hỏi phải xác định hàm điều khiển u, làm cho hệ thống chuyển động từ một vị trí ban đầu bất kỳ x10,x20về gốc toạ độ  0,0 , đảm bảo cực tiểu cho chỉ tiêu: 0 min k t t J dt .

Áp dụng nguyên lý cực đại của Pontriaghin L.S. [97] và định lý n khoảng điều khiển [98], chúng ta có thể xác định được hàm điều khiển tối ưu. Trên thực chất, định lý n khoảng điều khiển là cụ thể hoá của nguyên lý cực đại của Pontriaghin khi xét theo tiêu chuẩn tối ưu tác động nhanh và với hệ SISO

[98]. Theo định ý n kho ng điều khiển, một hệ thống SIS b c n với ràng buộc 3.17 sẽ có hàm điều khiển tối ưu tác động nhanh à một hàm có n

kho ng điều khiển kế tiếp nhau mỗi kho ng có giá trị không đổi à Umax hoặc Umax; dấu của hàm điều khiển trên mỗi kho ng phụ thuộc vào vị trí ban đầu của hệ thống. Như vậy, đối với hệ (3.17), (3.21), (3.22) điều khiển tối ưu tác động nhanh sẽ là một hàm theo thời gian * *

( )

u u t , gồm hai khoảng điều khiển và một lần đổi dấu. Vì điều khiển tối ưu *

( )

u t là hàm theo thời gian, không phải là hàm của các biến trạng thái, chúng ta không thể thực hiện được điều khiển theo phản hồi trạng thái theo các mạch vòng kín. Đây là điều bất lợi. Nhằm khắc phục điều này, dưới đây u n án đề uất gi i pháp ác định điều kiện đổi dấu của tín hiệu điều khiển trên cơ sở kh o sát chân dung pha (phase portrait) của hệ thống.

Để có được chân dung pha, chúng ta cần xây dựng phương trình của các quỹ đạo pha. Từ (3.21), (3.22) ta có

1 2 2 2 dx x T dx  x ku   . (3.23) Lấy tích phân hai vế của phương trình (3.23): 2

1 2 2 x dx T dx x ku      .

Từ đây ta thu được:

1 2 ln 2

x Tx Tku ku x c

      . (3.24) Với c là hằng số tích phân phụ thuộc vào điều kiện ban đầu của hệ thống. Giả sử điều kiện ban đầu là x t1( )0 x1,0;x t2( )0 x2,0; Khi đó phương trình (3.24) sẽ có dạng:

x1 x1,0 T x 2 x2,0Tkuln kux2 Tkuln kux2,0 . (3.25) Phương trình (3.25) mô tả quỹ đạo của hệ thống trong mặt phẳng pha, khi điều kiện ban đầu bằng không x1,0 0;x2,0 0, từ phương trình (3.25) ta có:

x1  Tx2 Tkulnkux2 Tkulnku . (3.26) Phương trình (3.25) và (3.26) được sử dụng để xây dựng quỹ đạo pha, chân dung pha của hệ thống.

Trên hình 3.3 là chân dung pha của hệ thống cho trường hợp hệ thống có các tham số cụ thể: K 0,0023;Umax 220;u Umax;

Hình 3.3. Chân dung pha của hệ thống

Đối với trường hợp chúng ta đang xét, chân dung pha của hệ thống là hai họ đường cong tương ứng với hai giá trị u  Umax ; khi u Umaxta có được họ đường cong mũi tên chỉ xuống và khi u Umax ta có họ đường cong có mũi tên chỉ lên. Với chân dung pha, mà trong đó quỹ đạo pha được xác lập cho các trường hợp u Umax như trên hình 3.3, chúng ta sẽ dễ dàng xác định quỹ đạo pha tối ưu theo tiêu chuẩn tác động nhanh.

Xem xét chân dung pha của hệ thống (3.17); (3.21);(3.22) với tác động điều khiển là Umax và Umax đã được xây dựng ở phần trên ta có thể xác

định quỹ đạo tối ưu tác động nhanh của hệ thống từ bất cứ một điểm xuất phát ban đầu nào. Giả sử, vị trí ban đầu của hệ thống là điểm I1 (trên hình 3.3) Để đưa hệ thống về gốc tọa độ với thời gian ngắn nhất, trước tiên ta sử dụng tác động điều khiển cho khoảng điều khiển thứ nhất là u  u1 Umax. Khi quỹ đạo pha của hệ thống đạt được điểm D1 trên đường cong QO, ta đổi dấu tác động điều khiển uu2  Umax. Sau đó hệ thống sẽ chuyển động về gốc tọa độ theo đường cong QO. Từ vị trí ban đầu là I2, ta sử dụng tác động điều khiển cho khoảng thứ nhất là u  u1 Umax, khi đạt được điểm D2 trên đường cong PO, ta đổi dấu của tác động điều khiển uu2  Umaxvà hệ thống sẽ chuyển động về gốc tọa độ theo đường cong PO. Từ đây ta có thể rút ra nhận xét cần thiết cho các bước tiếp theo.

Nhận x t 1: Từ bất kỳ vị trí ban đầu nào, ở khoảng thứ 2 hệ thống (3.17); (3.21);(3.22) chỉ có thể chuyển động nhanh nhất về gốc tọa độ theo các đường cong QO hoặc PO. Phương trình (3.26) mô tả chuyển động của hệ thống theo đường cong POQ để về gốc tọa độ O.

Phương trình của đoạn đường cong PO với u Umax

x1  Tx2 TkUmaxln x2 kUmax TkUmaxlnkUmax (3.27a) 1 1 2 maxln 2 max maxln max 0

R x Tx TkU x kU TkU kU

       (3.27b)

Phương trình của đoạn đường cong QO với u Umax: 1 2 maxln 2 max maxln max

x  Tx TkU x kU TkU kU (3.28a) 2 1 2 maxln 2 max maxln max 0

R x Tx TkU x kU TkU kU

       (3.28b)

Đường cong POQ chính là đường đổi dấu. Nếu vị trí ban đầu của hệ thống nằm ở phía phải của đường đổi dấu POQ thì khoảng điều khiển thứ nhất sẽ có

max

u U , khoảng điều khiển thứ hai sẽ là u Umax và ranh giới giữa hai khoảng điều khiển sẽ là điểm khi quỹ đạo hệ thống tương ứng với u Umax

gặp đường đổi dấu. Nếu vị trí ban đầu của hệ thống nằm ở phía trái của đường đổi dấu POQ thì khoảng điều khiển thứ nhất sẽ có u Umax, khoảng thứ hai sẽ có u Umax; Dấu của tín hiệu điều khiển sẽ đổi từ dấu trừ sang dấu cộng khi gặp quỹ đạo tương ứng với u Umax xuất phát từ vị trí ban đầu chuyển động theo đường cong với mũi tên chỉ lên gặp đường đổi dấu POQ.

Nhận x t 2: Từ phương trình mô tả quỹ đạo pha (3.25) của hệ thống, chúng ta thấy rằng, mọi quỹ đạo pha của hệ thống tương ứng với các tác động điều khiển u Umax đều tiệm cận đến một trong hai đường thẳng L L1 2 :

2 max

x  kU (3.29)

và L L3 4 : x2  kUmax (3.30) Điều đó cũng có nghĩa là: đối với hệ thống (3.17); (3.21); (3.22) quỹ đạo pha luôn luôn bị giới hạn bởi hai đường L L1 2 và L L3 4 .Về mặt toán học, điều

này cũng dễ dàng rút ra được khi ta xem xét phương trình (3.22). Nếu ta xét cả (3.21) và (3.22) thì, về ý nghĩa vật lý, điều đó có nghĩa là: Tốc độ của hệ thống là đại lượng x2 sẽ không bao giờ vượt quá tốc độ tối đa, tương ứng với đầu vào u Umax. Từ nhận xét này ta suy ra: chân dung pha của hệ thống luôn luôn bị giới hạn bởi hai đường L L1 2 và L L3 4

Nhận x t 3: Luật điều khiển tối ưu tác động nhanh đảm bảo cho hệ thống chuyển từ một vị trí sang vị trí khác với thời gian nhỏ nhất. Đây là một trong những yếu tố quan trọng nhất để đánh giá chất lượng của hệ thống điều khiển. Tuy nhiên, bài toán điều khiển tối ưu tác động nhanh vẫn để ngỏ các vấn đề về độ chính xác, về tính bền vững và tính kháng nhiễu. Đối với các hệ thống tự động bám thì độ chính xác, tính kháng nhiễu, tính bền vững và độ tác động nhanh đều là những yếu tố quan trọng. Vì v y, vấn đề đặt ra cần gi i quyết tiếp theo à ây dựng u t điều khiển có tính bền vững và tính kháng nhi u và

tích hợp u t điều khiển này với u t điều khiển tác động nhanh. Trong các phần sau, u n án đề uất phương pháp để gi i quyết vấn đề quan trọng đó.

3.3.2. Đề xuất phương pháp tổng hợp luật điều khiển đ m b o tính bền vững và tính kháng nhiễu trên cơ sở sử dụng chế độ trượt

3.3.2.1. Xác định thông số của đường trượt

Tính chất ưu việt nổi trội của chế độ trượt trong điều khiển là: trong chế độ này hệ thống có tính bền vững cao, có tính kháng nhiễu tốt [18], [102]. Đối với các hệ thống tự động bám, tính bền vững và tính kháng nhiễu đòi hỏi rất cao, bởi hệ thống luôn luôn chịu tác động của nhiễu từ bên ngoài, đặc biệt là nhiễu do tác động đầu vào gây ra.

Xét chân dung pha của hệ thống trên hình 3.3, ta có thể thấy rằng mặt trượt chỉ có thể tồn tại trong miền T đã được gạch chéo (chữ T là viết tắt của chữ Trượt). Vấn đề đặt ra là phải xây dựng phương trình của đường trượt. Phương trình của đường trượt có dạng:

1 2 1 1 2 2 1 2

( , ) T 0, 0, 0

S x x c X c x c x  c  c  . (3.31) Tham số của đường trượt (3.31) được chọn bằng c1 1, còn c2 được chọn sao cho đảm bảo chế độ trượt ổn định [18], [102], và vẫn đảm bảo được độ tác động nhanh. Rõ ràng là nếu đường trượt càng sát với đường POQ thì càng có độ tác động nhanh tốt hơn. Từ chân dung pha trên hình 3.3 ta rút ra: đường trượt gần nhất với đường POQ là đường thẳng nối hai điểm A1 và A2 đi qua gốc tọa độ. Tọa độ của các điểm A1 và A2 được xác định khi ta thay x2 từ (3.29), (3.30) vào phương trình (3.27), (3.31) của đường POQ.

Do ba điểm A O A1, , 2 nằm trên một đường thẳng, vì vậy để xác định thông số c2 cho đường trượt A OA1 2 ta chỉ cần xác định tọa độ của một điểm A1 hoặc

A . Tọa độ của điểm A1:

2,A max

1,A max maxln 2 max maxln max max(1 ln 2)

x  TkU TkU kU TkU kU  TkU  (3.33) Như vậy, nếu ta chọn đường trượt là đường A OA1 2 thì từ (3.31) và (3.32), (3.33) ta tìm được thông số c2của mặt trượt:

1 1 1, 2 max max 2, ln 2 ln (1 ln 2) A A x c T T kU T kU T x        (3.34)

3.3.2.2. Xác định u t điều khiển đ m b o chế độ trượt

Phương trình của hệ bám (3.18) được viết lại dưới dạng:

( ) ( ) ( ) ( ) X t AX t bu t df t (3.35) trong đó  1 2 T X  x x ; A : ma trận kích thước 2 2 ; 11 0; 12 1; 21 0; 22 1 ; a  a  a  a   T b ma trận cột : b1 0; b2  k T ; d - ma trận cột: d1 0; d2 1T ;

Nhiễu f t  do tác động đầu vào gây nên được xác định theo (3.19). Đối với các hệ thống bám, đa phần là các hệ thống mà nhiễu do tín hiệu vào gây ra không thể đo được. Biểu thức (3.19) cho thấy rằng tín hiệu nhiễu f t  thỏa mãn các điều kiện của định lý Stone-Weiestrass [51], vì vậy có thể sử dụng mạng nơron RBF để xấp xỉ với bất kỳ độ chính xác nào [51], [27]. Giả thiết rằng, nhiễu f t  đã được xấp xỉ bằng phương pháp đề xuất trong chương II của luận án, trên cơ sở mạng nơron RBF; ta xây dựng luật điều khiển với cấu trúc biến đổi đảm bảo tồn tại chế độ trượt trên đường S x x( ,1 2)0 theo biểu thức (3.31):

uux uf (3.36)

u  thành phần điều khiển sử dụng các thông tin về trạng thái của hệ thống;

u thành phần điều khiển kháng nhiễu sử dụng thông tin về nhiễu f t  trên cơ sở xấp xỉ f tˆ bằng mạng nơron RBF:

1 1 2 2 x u u   x   x  ; (3.37) ˆ f f u   f (3.38) Các hệ số   1, 2, f thay đổi theo logic sau đây

0; 1, 2 ; 0; 1, 2 ˆ 0; 1, 2 ; ˆ 0; 1, 2 i i i i i f f f khi x S i khi x S i khi fS i khi fS i                        (3.39)

Đại lượng u thay đổi theo luật:

0 0 0; 0; u khi S khi S          (3.40) 0

  hằng số nhỏ tuỳ ý, nhưng khác không và có dấu cùng với dấu của c bT . Vấn đề đặt ra tiếp theo là phải chứng minh điều kiện cần và đủ cho sự tồn tại chế độ trượt trong hệ thống (3.35) - (3.40) trên đường (3.31) S x x( ,1 2)0.

Để làm được điều đó, chúng ta phải chứng minh được rằng với tín hiệu điều khiển (3.36) - (3.40) từ bất cứ một điểm nào trong không gian pha (không gian trạng thái) đều bị hút lên đường trượt (3.31). Chọn hàm Lyapunov: 2 1 0 2 V  S  (3.41) Đạo hàm theo thời gian của V sẽ là:

  1 2 1 1 1 2 2 2 2 2 ( ) ( ) ( ) ( ) . T T T T T T T T f u V SS S c a c c a c b x c a c c a c b x  c d c b f                         (3.42) Trong đó và 2 a là cột thứ 1 và thứ 2 của ma trận A.

Từ (3.35) đến (3.42) ta thu được điều kiện cần và đủ để V SS 0

2 2 ( ) ( ) 1, 2 ( ) ( ) 1, 2 T T i T i i T T i T i i c b c a c c a i c b c a c c a i            (3.43) ( ) ( ) T f T T f T c b c d c b c d        (3.44) Như vậy luật điều khiển (3.36) - (3.44) đảm bảo điều kiện cần và đủ cho sự tồn tại của chế độ trượt trên đường S x x( ,1 2)0. Khi hệ thống hoạt động ở chế độ trượt, chất lượng của hệ thống chỉ phụ thuộc vào thông số của đường trượt (mặt trượt), và không phụ thuộc vào tác động của nhiễu từ bên ngoài, không phụ thuộc vào sự thay đổi thông số động học của đối tượng điều khiển. Nói cách khác là: hệ thống có tính kháng nhiễu và tính bền vững.

3.3.2.3. Tích hợp điều khiển tác động nhanh với điều khiển trượt

Chất lượng của hệ thống bám được xác định bởi các tiêu chí chủ yếu sau đây:

1. Độ tác động nhanh: Yêu cầu phải giảm thiểu thời gian để đưa hệ thống từ một vị trí xác định sang một vị trí mới.

2. Sai số bám, tính kháng nhiễu và tính bền vững. Sai số của hệ thống phụ thuộc trực tiếp vào nhiễu tác động từ bên ngoài và phụ thuộc vào sự thay đổi của tham số động học của đối tượng điều khiển. Điều khiển trượt trên mặt

1 2

( , ) 0

S x x  đảm bảo cho hệ thống loại trừ được ảnh hưởng của nhiễu của sự thay đổi tham số của đối tượng đến độ chính xác của hệ thống.

Hai tiêu chí quan trọng trên được kết hợp với nhau theo một logic tuần tự: Khi sai số hệ thống còn lớn, cần sử dụng luật điều khiển tối ưu tác động

Vấn đề điều khiển tối ưu tác động nhanh đối với hệ thống tự động bám sát