Tube-based cho điều khiển dự báo theo mô hình- 123docz.net

a) Giới thiệu

Để thiết lập thuật toán trong thực tế chúng ta cần bỏ qua tính tối ưu để đơn giản hơn, đã có nhiều phương thức để làm điều đó. Tác giả đưa ra tiếp theo đây một quy trình để đạt được mục tiêu và kết quả tốt cho điều khiển dự báo theo mô hình bền vững bằng cách giải online bài toán điều khiển tối ưu, nó có độ khó tương đương với bài toán điều khiển dự báo theo mô hình thông thường. Chúng ta làm đơn giản hóa biến điều khiển, lý tưởng hóa, là một sách lược bằng cách thay thế nó với một tham số hữu hạn chiều, nó bao gồm chuỗi điều khiển vòng hở và bộ điều khiển phản hồi khu vực đơn giản. Thêm vào đó, ta thay thế “tube” (được xác định chính xác rất khó) bằng một “tube” đơn giản hơn và bao ngoài “tube” chính xác, do đó ý tưởng sau đây khá đơn giản. Ta tạo ra vị trí trung tâm của “tube” bằng cách sử dụng bộ điều khiển dự báo theo mô hình thông thường với ràng buộc chặt lên mô hình hệ thống tối ưu, hạn chế kích thước của “tube” bằng cách sư dụng phản hồi khu vực để cố gắng lái tất cả quỹ đạo trạng thái của hệ thống có thành phần bất định tới quỹ đạo trung tâm. Bộ điều khiển tổng hợp có thể được coi như một bộ điều khiển hai bậc tự do. Phản hồi khu vực xung quanh quỹ đạo ước lượng đó là vòng trong và nhiễu tắt dần trong khi điều khiển dự báo theo mô hình được áp đụng trong vòng ngoài.

Ta sẽ xét đến điều khiển dự báo theo mô hình bền vững của hệ tuyến tính có yếu tố ràng buộc. Để làm được việc đó, ta sẽ áp dụng một số lý thuyết về đại số như sau. Cho hai tập A và B nằm trong tập n , ta định nghĩa tập tổng, tập hiệu, tập tích và khoảng cách Hausdorff giữa hai tập.

a) Tập tổng: A B: ab a| A b, B b) Tập hiệu: A B:x n| x  B A c) Tập tích: Cho K m n , K A. :Ka a| A

Chương 3: Điều khiển dự báo mô hình phi tuyến

d) Khoảng cách Hausdorff dH  giữa hai tập con A và B của n được đinh nghĩa như sau:

 , : max sup  , ,sup  , 

a A b B

d A B d a B d b A

 



Trong đó d x S ,  được định nghĩa là khoảng cách của một điểm x n tới tập S n, được định nghĩa là:  , : inf  , |  y d x S  d x y yS  , : d x y  x y

Trong những định nghĩa đó,  x là bao gồm những điểm đơn lẻ x and

 x B, do vậy ký hiệu tập xb b| B; tập hợp A B là một hợp C lớn nhất mà B C A. Mỗi chuỗi  x i  được gọi là hội tụ tới tập S nếu có

 

 ,  0

d x i S  khi i . Nếu dHA B,  , khoảng cách của mỗi điểm bB

tới tập Alà nhỏ hơn hoặc bằng . Ta nói rằng chuỗi các tập  A i  là hội tụ tới tập

B nếu khoảng cách dHA i B , 0 khi i  trong không gian Hausdorff. Đó là những khái niệm đầu tiên để ta thiết lập ra “tube” bao ngoài. Những cơ sở lý thuyết rất hữu ích này được đưa ra trong Kolmanovsky và Gilber (1998).

b) “Tube” bao ngoài cho hệ tuyến tình kết hợp thành phần nhiễu

Xét mô hình hệ thống tuyến tính

 1      

x k Ax k Bu k w k

Trong đó w , là tập con lồi và compact của tập n

có bao gồm cả điểm gốc. Ta giả sử rằng tập chứa điểm gốc ở phía bên trong của nó hoặc nếu không có thì wG trong đó   p,pn nằm trong tập lồi compact  có chưa điểm gốc bên trong nó và cặp ma trận A G,  là điều khiển được. Gọi i x;  0 , ,u w là

Chương 3: Điều khiển dự báo mô hình phi tuyến

nghiệm của phương trình x k  1 Ax k Bu k w k  tại thời điểm i nếu trạng thái đầu (thời điểm 0 ) và x 0 và biến điều khiển u k , chuỗi nhiễu w k 

Mô hình lý tưởng được mô tả như sau

 1    

z k  Az k Bu k

Và gọi  i z u; ,  là nghiệm của phương trình z k  1 Az k Bu k  tại thời điểm i nếu trạng thái đầu tại thời điểm 0 là z 0 . Gọi e k :x k   z k , là sai lệch của trạng thái thực tế x k  và trạng thái lý tưởng z k  thỏa mãn phương trình sai phân sau:

 1    

e k  Ae k w k

Từ đó ta sẽ tính được tại thời điểm thứ i

    1   0 0 i i j j e i A e A w j    

Trong đó e 0 x   0 z 0 . Nếu có e 0 0, e i S i  và tập S i  được định nghĩa là:   1 1 0 : ... i j i j S i A A A        

Trong ký hiệu phép lấy  tổng là phép tính tập tổng  như đã được định nghĩa ở trên. Theo những giả thiết của ta cho tập hợp rằng tập S i  bao gồm điểm gốc bên trong nó cho toàn bộ in. Đầu tiên, ta xét đến “tube” X x u , được lấy ra từ chuỗi tín hiệu điều khiển vòng hở u với trạng thái đầu x   0  z 0 x, và

 0 0

e  . Dễ dàng nhận thấy ràng X x u , X  0,x X, 1; ,x u,...,X N x u ; , 

trong đó

   0;

X x  x X i x u ; , :i x u w; , , |w  z i  S i 

Và z i i x u; ,  trạng thái tại thời điểm i của hệ thống lý tưởng là trung tâm của “tube”. Tương đối dễ dàng nhận được “tube” chính xác, mà được tạo ra bởi

Chương 3: Điều khiển dự báo mô hình phi tuyến

điều khiển vòng hở nếu hệ thống là tuyến tính và thành phần nhiễu thêm vào bị chặn, nó cung cấp cho ta việc tính tính tập hợp S i  . Nếu G ,trong đó là tập lồi, thì S i  cũng là lồi với mọi giá trị i. Nếu thêm vào đso, bao gồm cả giá trị gốc bên trong nó và cặp ma trận A G,  là điều khiển được, thì S i  cũng sẽ bao gồm cả giá trị gốc bên trong nó với mọi giá trị i.

Nếu A là ma trận bền, với lý thuyết đã được trình bày của Kolmanovsky và Gilbert (1998), tập   0 : j i S A  

  tồn tại và là bất biến dương cho

 1    

x k  Ax k w k . Với x S  kéo theo rằng Axw S  cho mọi

w , ngoài ra S i S  trong không gian Hausdorff khi i . Tập S 

được gọi là tập bất biến dương bền vững tối thiểu cho x k  1 Ax k w k ,

w W . Thêm nữa, S i S i  1 S  cho mọi giá trị của i , và “tube”

  ˆ , X x u được định nghĩa là          ˆ , : ˆ 0 , ˆ 1; , ,..., ˆ ; , X x u  X X x u X N x u Trong đó Xˆ 0    x X i x uˆ ; ,  z i  S

Trong đó S S  là “tube” bao ngoài với mặt cắt ngang hằng số S cho “tube” chính xác X x u , (X i x u ; , X i x uˆ ; ,  cho mọi giá trị của i). Sẽ là khá thuận tiện khi ta áp dụng “mặt cắt hằng số” “tube” bao ngoài X x uˆ , trong thay

cho “tube” chính xác X x u , . Nếu ta giới hạn xét đến khoảng 0,N như là việc tính đến tác động của điều khiển dự báo theo mô hình, sau đó đặt S S N  mang tại ít hơn tính bảo toàn, mặt cắt ràng buộc, “tube” bao ngoài cho khoảng 0,N.

Trong khi “tube” chính xác X x u , và “tube” bao ngoài X x uˆ , có thể nhận

được dễ dàng, nhưng việc ta áp dụng vào bài toán sẽ gặp một số hạn chế cho những lý do được đề cập trước đó – tập S i  có thể là lớn nhưng không cần thiết đơn giản

Chương 3: Điều khiển dự báo mô hình phi tuyến

vì một chuỗi điều khiển vòng hở hơn là sách lược điều khiển phản hồi được dẫn ra từ “tube”. Ví dụ, nếu   1,1 và x k  1    x k u k w k , với

   1

S i  i tăng nhưng không bị chặn khi mà i tăng lên. Ta phải giới thiệu đến khâu phản hồi để bao hàm kích thước của tập S i , nhưng để làm việc đó một cách đơn giản vì việc tối ưu hóa cho một sách lược bất kì là không được phép. Sách lược phản hồi mà ta đề xuất sẽ là:

      

uv k K x k z k

Trong đó x k  là trạng thái hiện thời của hệ thống

 1      

x k  Ax k Bu k w k , z k  là trạng thái hiện thời của hệ thống lý tưởng, v k  là tín hiệu đầu vào cho hệ thống lý tưởng. Với sách lược phản hồi, trạng thái x k  thỏa mãn phương trình sai phân sau:

 1        

x k Ax k Bv k BKe k w k

Trong đó thì e k :x k   z k là sai lệch giữa trạng của hệ thống thái thực tế và trạng thái của hệ thống lý tưởng. Gọi i x;  0 , , ,v e w là nghiệm tại thời điểm

i của mô hình hệ thống x k  1 Ax k Bv k BKe k w k với trạng thái đầu tại thời điểm 0 là x 0 , chuỗi tín hiệu điều khiển là v k  , chuỗi nhiễu là

 

w k , chuỗi tín hiệu sai lệch là e k  . Hệ thống lý tưởng tương ứng với hệ thống có thành phần bất định x k  1 Ax k Bv k BKe k w k  là:

 1    

z k Az k Bv k

Sai lệch e k  sẽ thỏa mãn phương trình sai phân sau:

 1 K    

e k A e k w k

A  A BK

Nó có dạng của phương trình sai phân được sử dụng trước đó ngoại trừ ma trận A, nó có thể không phải là ma trận bền, và được thay thế bởi ma trận AK, là

Chương 3: Điều khiển dự báo mô hình phi tuyến

một ma trận bền được chọn bởi người thiết kế. Nếu K được chọn để có được ma trận làAKbền, thì ta sẽ có tập bất định tương ứng được định nghĩa như sau:

  1 0 : i j K K j S i A   

Có thể được cho là nhỏ hơn giá trị góc của tập bất định S i  với mọi i , nhỏ hơn đáng kể nếu ma trận A là không bền và i tương đối lớn, nhưng không nhất thiết phải nhỏ hơn nhiều ma trận A là bền. Những giả thiết của ta về tập kéo theo rằng SK i , giống như S i  bao gồm cả giá trị gốc bên trong nó cho mỗi giá trị i . Vì ma trận AK là bền, tập   0 : j K K j S A  

  tồn tại và dương bất biến cho

 1 K    

e k  A e k w k , cũng như vậy SK i SK  trong không gian Hausdorff khi i . Vì K được chọn cố định, tín hiệu điều khiển phản hồi

   

uK x k z k v k được tham số hóa bởi chuỗi tín hiệu điều khiển vòng hở

 

v k . Nếu x 0  z 0 , “tube” được tạo ra bởi sách lược điều khiển  sẽ là

 ,    0 , 1; , ,...,  , , 

X x v  X X x v X N x v

Trong đó X   0  x X i x v ; , :Ki x v w; , , |w W  z i  SK i Như ta đã biết thì z i  là nghiệm của mô hình lý tưởng tại thời điểm i với trạng thái đầu của hệ lý tưởng z 0 x 0 , và chuỗi tín hiệu điều khiển là v k . Với trạng thái đầu cho trước x 0 và chuỗi tín hiệu điều khiển v k  thì nghiệm của phương trình x k  1 Ax k Bv k BKe k w k nằm trên “tube”

 ,

X x v cho mỗi chuỗi nhiễu chấp nhận được w. Như đã đề cập trước đó, tập

 

S i có thể được thay thế bởi SK  để nhận được “tube” bao ngoài. Nếu giảm sự chú ý về thời gian để chọn khoảng thời gian 0,N , SK i có thể được thay thế bởi SK N để nhận được một “tube” bao ngoài vừa phải.

Chương 3: Điều khiển dự báo mô hình phi tuyến

Trong những thảo luận trước, ta có x 0  z 0 suy ra có e 0 0 để có thể đảm bảo rằng e i S i  hoặc là e i SK i . Khi có AK là ma trận bền, tuy nhiên, chúng ta có thể giảm nhẹ một số yêu cầu đó. Với SK  tồn tại và là bất định dương bền vững cho e k  1 A e kK  w k , e k SK  dẫn đến

 1 K 

e k S  cho mọi e k  1 A e kK   . Vì vậy, nếu e 0 SK  , thì e i SK  cho mọi giá trị i và mọi w i.

Trong tube-based điều khiển dự báo theo mô hình, ta đảm bảo rằng z i 0 khi i , cũng có nghĩa là x i  (nằm trong tập  z i  SK i ) hội tụ tới tập

 

S  với i . Mặc dù là SK  là rất khó khăn để tính toán, nó là một tính chất có tính hữu dụng trong lý thuyết của điều khiển hệ thống. Bộ điều khiển được yêu cầu để đảm bảo rằng những yếu tố ràng buộc của trạng thái và biến điều khiển là không được vi phạm. Để làm được điều đó, những hiểu biết về tập SK  là không cần thiết. Nếu chúng ta biết rằng e 0 SK  bởi vì, với ví dụ z 0 được lựa chọn để thỏa mãn z 0 x 0 , với x i  nằm trong  z i  SK  cho mọi giá trị i. Tất cả những thế cần, trong bài toán điều khiển tối ưu lý tưởng PN, là “knowledge” của tập S ( tập S được gọi là xấp xỉ bao ngoài của tập SK  ). Nếu có x i  nằm trong  z i  SK  , nó sẽ chắc chắn nằm trong  z i  S. Và nếu

 

 z i  S X với mọi i, thì x i  z i  SK   chắc chắn thỏa mãn yếu tố ràng buộc của biến trạng thái x i X với mọi giá trị i và chuỗi nhiễu chấp nhận được. Tất nhiên, việc chọn độ rộng của tập xấp xỉ bao ngoài S dẫn đến mức độ chặt chẽ; với tập Slà một sự lựa chọn thỏa hiệp giữa sự đơn giản và chặt chẽ của bài toán. Tập Sxấp xỉ với tập SK  , nó không chặt như S nhưng lại phức tạp hơn tập S. Nếu ta được chọn tùy ý z 0 , ta có thể chọn tập S là tập xấp xỉ bao ngoài

Chương 3: Điều khiển dự báo mô hình phi tuyến

bất biến dương bền vững của tập SK  ; sau đó x i  z i  S cho mọi giá trị

 0   0

x  z S

Sau đây, ta xét đến “tube” X z i, được định nghĩa rằng

 , :  0   , , 1 , ,..., N , 

X z v  X z v X z v X z v

Trong đó, với mỗi i0,1,...,N

 , :   

X z v  z i S

 : ;  0 , 

z i  i z v

Và tập S là xấp xỉ bao ngoài của SK  (SK  S).Theo những điều kiện ta có trước đó, nếu x 0  z 0 SK  và tập Sđơn thuần là xấp xỉ bao ngoài của tập SK  hoặc nếu x 0  z 0 S, trong đó S là tập xấp xỉ bao ngoài bất biến dương bền vững của tập SK  (Rakovic, Kerrigan, Kouramas and Mayne, 2005), sau đó e i  nằm trong tập Svới mọi giá trị của i, và mỗi quỹ đạo trạng thái

 

 x i của x k  1 Ax k B v k  Ke k w k w ,  . Mặt khác, mỗi quỹ đạo tương ứng với một thực thi chấp nhận được của w, nằm trong “tube” X z v , (hình 3.2). Những sự lựa chọn hiển nhiên cho trạng thái ban đầu của hệ lý tưởng

 0

z để đảm bảo rằng e 0 SK  là z 0  x 0 . Tương tự với mỗi quỹ đạo điều khiển  u i  của hệ thống có thành phần bất định nằm trong “tube”

 

   

 v i KSK   hoặc là trong “tube”  v i  KS.

Thực tế rằng quỹ đạo trạng thái và quỹ đạo điều khiển của hệ thống có thành phần bất định nằm trong những quỹ đạo trạng thái và điều khiển lân cận đã biết, tương ứng là  z i  và  u i  , đây là cơ sở cho tube-based điều khiển dự báo theo

Tube-based cho điều khiển dự báo theo mô hình

Động lực học phi tuyến

Mô hình điều khiển dự báo