Xác định một cách chính xác “tube” X X0, 1,... tương ứng với điều kiện đầu đã cho và sách lược điều khi n ể là rất khó khăn, thậm chí là vớ ệi h tuyến tính, và là hầu như khơng thể cho các hệ phi tuyến. Do đó, tác giả ẽ đưa ra cách làm như thế s nào để đơn giản các “tube”, nó sẽ ớ ạ ấ ả gi i h n t t c trư ng hờ ợp có thể ả x y ra c a qu ủ ỹ đạo trạng thái. Ví dụ, cho h tuy n ệ ế tính với ràng buộ ồc l i, với “tube” X X0, 1,... , trong đó với m i i ,ỗ Xi z i Z ,z i là trạng thái tại thời điểm i c a h cho ủ ệ trước, Xi là một “polytope” , và
Z là mộ ật t p b t biấ ến dương, có thể được thi t k ế ế để ớ ạn toàn bộ gi i h trư ng hờ ợp có thể ả x y ra c a qu o trủ ỹ đạ ạng thái. “Tube” chính xác đó sẽ ằ ở bên trong củ n m a vi c x p x ệ ấ ỉ đơn giản đó. Áp dụng cấu trúc này cho điều khi n d ể ự báo theo mơ hình bền vững, nó được thi t k ế ế mà không cần quá nhiều cơng việc tính tốn như là u cầu đố ớ ệ đã xác định đó.i v i h
Chương 3: Điều khi n d ể ự báo mơ hình phi tuyến
30
3.4.2. T ube-based cho điều khiển dự báo theo mơ hình a) Giới thiệu
Để thi t l p thuế ậ ật toán trong th c t ự ế chúng ta cần b ỏ qua tính tối ưu để đơn giản hơn, đã có nhiều phương thức đ làm điều đó. Tác giả đưa ra tiếp theo đây một ể quy trình để đạt được mục tiêu và kết qu tả ốt cho điều khi n d ể ự báo theo mơ hình b n v ng bề ữ ằng cách giải online bài toán điều khi n tể ối ưu, nó có độ khó tương đương với bài toán điều khi n d ể ự báo theo mơ hình thơng thường. Chúng ta làm đơn giản hóa biến điều khiển, lý tưởng hóa, là một sách lược bằng cách thay thế nó v i m t tham s h u h n chiớ ộ ố ữ ạ ều, nó bao gồm chuỗi điều khiển vịng hở và bộ điều khi n ph n h i khu vể ả ồ ực đơn giản. Thêm vào đó, ta thay thế “tube” (được xác định chính xác rất khó) b ng mằ ột “tube” đơn giản hơn và bao ngồi “tube” chính xác, do đó ý tưởng sau đây khá đơn giản. Ta t o ra v ạ ị trí trung tâm của “tube” bằng cách sử d ng b ụ ộ điều khi n d ể ự báo theo mơ hình thơng thường với ràng buộc chặt lên mơ hình hệ th ng tố ối ưu, hạn ch ế kích thước của “tube” bằng cách sư dụng ph n h i ả ồ khu vực để ố ắng lái tấ ả c g t c qu o trỹ đạ ạng thái của h ệ thống có thành phần bất định t i qu ớ ỹ đạo trung tâm. Bộ điều khi n t ng hể ổ ợp có thể được coi như một b ộ điều khi n hai b c t do. Ph n h i khu v c xung quanh qu ể ậ ự ả ồ ự ỹ đạo ước lượng đó là vịng trong và nhiễ ắ ần trong khi điều t t d u khi n d ể ự báo theo mơ hình được áp đụng trong vịng ngồi.
Ta s ẽ xét đến điều khi n d ể ự báo theo mơ hình bền v ng c a h tuyữ ủ ệ ến tính có yếu tố àng buộc. Để làm đượ r c việc đó, ta sẽ áp dụng m t s ộ ố lý thuyế ề đạ ố như t v i s sau. Cho hai t p ậ A và B n m trong t p ằ ậ , ta định nghĩa tập t ng, t p hi u, tổ ậ ệ ập tích và khoảng cách Hausdorff gi a hai t p. ữ ậ
a) Tậ ổp t ng: A B: a b a A b B | ,
b) T p hi u: ậ ệ A B A
Chương 3: Điều khi n d ể ự báo mơ hình phi tuyến
31
d) Khoảng cách Hausdorff dH gi a hai t p con ữ ậ A và B của được đinh nghĩa như sau:
, : max sup , ,sup ,
H
a A b B
d A B d a B d b A
Trong đó d x S , được định nghĩa là khoảng cách của một điểm x tới t p ậ S , được định nghĩa là: , : inf , | y d x S d x y y S , : d x y x y
Trong những định nghĩa đó, x là bao gồm những điểm đơn lẻ x and x B, do vậy ký hiệ ậu t p x b b B ; t p h p | ậ ợ A là mộ ợ C l n nht h p ớ ất mà B C A. M i chuỗ ỗi x i được gọi là hội t t i tụ ớ ập S nếu có
, 0
d x i S khi i . Nếu dH A B, , khoảng cách của mỗi điểm b B t i t p ớ ậ Alà nhỏ hơn hoặc b ng . Ta nói rằằ ng chuỗi các ật p A i là hộ ụ ớ ậi t t i t p
B n u khoế ảng cách dH A i B, 0 khi i trong khơng gian Hausdorff. Đó là những khái niệm đầu tiên để ta thi t lế ập ra “tube” bao ngoài. Những cơ s ở lý thuyết rất hữu ích này được đưa ra trong Kolmanovsky và Gilber (1998).
b) “Tube” bao ngồi cho hệ tuyến tình kế ợp thành phầt h n nhi u ễ Xét mơ hình hệ ố th ng tuyến tính
1
x k Ax k Bu k w k
Trong đó , là tập con lồi và compact củ ậa t p có bao gồm c ả điểm g c. Ta gi s r ng tố ả ử ằ ập chứa điểm gốc ở phía bên trong của nó hoặc nếu khơng có thì w G trong đó n m trong t p l i compact ằ ậ ồ có chưa điểm gốc bên trong nó và cặp ma tr n ậ A G , là điều khiển được. Gọi i x; 0 , ,u w là
Chương 3: Điều khi n d ể ự báo mơ hình phi tuyến
32
nghi m cệ ủa phương trình x k 1 Ax k Bu k w k t i thạ ời điểm i nếu trạng thái đầu (thời điểm 0 ) và 0x và biến điều khi n ể u k , chu i nhi u ỗ ễ w k
Mơ hình lý tưởng được mơ tả như sau 1
z k Az k Bu k
Và gọi i z u ; , là nghiệm của phương trình z k 1 Az k Bu k tại thời điểm i n u trế ạng thái đầ ạu t i thời điểm 0 là 0z . Gọi e k : x k z k , là sai l ch c a trệ ủ ạng thái thự ế x k c t và trạng thái lý tưởng z k thỏa mãn phương trình sai phân sau:
1
e k Ae k w k
T ừ đó ta sẽ tính được tại thời đi m thứ i ể
1 0 0 i i j j e i A e A w j
Trong đó 0e x 0 z 0 . Nếu có e 0 0, e i S i và tậ S i được p định nghĩa là: 1 0 : i j j S i A
Trong ký hiệu phép lấy tổng là phép tính tập t ng ổ như đã được định nghĩa ở trên. Theo những gi thi t c a ta cho t p h p ả ế ủ ậ ợ r ng t p S i bao gồm ằ ậ điểm gốc bên trong nó cho tồn bộ i n . Đầu tiên, ta xét đến “tube” X x u được , l y ra t ấ ừ chuỗi tín hiệu điều khiển vịng hở u v i trớ ạng thái đầu x 0 z 0 x, và
0 0
e . D ễ dàng nhận thấy ràng X x u, X 0, ,x X1; , ,...,x u X N x u ; , trong đó
0;
X x x X i x u; , : i x u w w; , , | i S i
Và z i i x u ; , trạng thái tại thời điểm i c a h ủ ệ thống lý tưởng là trung tâm của “tube”. Tương đố ễ dàng nhận được “tube” chính xác, mà đượ ại d c t o ra b i ở
Chương 3: Điều khi n d ể ự báo mơ hình phi tuyến
33
điều khiển vòng hở ế n u h thệ ống là tuyến tính và thành phần nhiễu thêm vào bị chặn, nó cung cấp cho ta việc tính tính tập hợp S i . N u ế ,trong đó là t p lậ ồi, thì S i cũng là lồ ới v i mọi giá trị i. Nếu thêm vào đso, bao g m c ồ ả giá trị ốc bên trong nó và cặ g p ma tr n ậ A G , là điều khiển được, thì S i cũng sẽ bao g m c ồ ả giá trị ốc bên trong nó vớ g i mọi giá trị i .
N u ế A là ma t ậr n b n, về ới lý thuyết đã được trình bày của Kolmanovsky và Gilbert (1998), tập
0
: j
i
S A t n tồ ại và là bất biến dương cho 1
x k Ax k w k . Với x S kéo theo rằng Ax w S cho m iọ
w , ngoài ra S i S trong không gian Hausdorff khi i . T p ậ S được gọi là tập b t biấ ến dương bền v ng t i thi u cho ữ ố ể x k 1 Ax k w k ,
w W . Thêm nữa, S i S i 1 S cho mọi giá trị ủa i , và “tube” c
ˆ ,
X x u được định nghĩa là
ˆ , : ˆ 0 , ˆ 1; , ,..., ˆ ; ,
X x u X X x u X N x u
Trong đó ˆ 0X x X i x uˆ ; , z i S
Trong đó S S là “tube” bao ngoài với m t c t ngang h ng s ặ ắ ằ ố S cho “tube” chính xác X x u (, X i x u; , X i x u cho mˆ ; , ọi giá trị ủa i ). S c ẽ là khá thuận tiện khi ta áp dụng “mặ ắt c t h ng sằ ố” “tube” bao ngoài X x u trong thay ˆ , cho “tube” chính xác X x u . N u ta gi i h, ế ớ ạn xét đến kho ng ả 0, N như là việc tính đến tác động của điều khi n d ể ự báo theo mơ hình, sau đó đặt S S N mang tại ít hơn tính bảo tồn, mặt cắt ràng buộc, “tube” bao ngồi cho khoảng 0, N .
Trong khi “tube” chính xác X x u và “tube” bao ngồi ˆ, X x u có thể, nh n ậ được d ễ dàng, nhưng việc ta áp dụng vào bài toán sẽ ặ g p m t s h n ch cho nh ng ộ ố ạ ế ữ lý do được đề ập trước đó – ậ c t p S i có thể là lớn nhưng khơng cần thiết đơn giản
Chương 3: Điều khi n d ể ự báo mơ hình phi tuyến
34
vì một chuỗi điều khiển vòng hở hơn là sách lược điều khi n ph n hể ả ồi được d n ra ẫ t ừ “tube”. Ví dụ, n u ế 1 và x k 1 x k u k w k , với
1
S i i tăng nhưng không bị chặn khi mà i tăng lên. Ta phải gi i thiớ ệu đ n ế khâu phản hồi để bao hàm kích thước c a t p S i , nhưng để làm việc đó một cách ủ ậ đơn giản vì việ ối ưu hóa cho một sách lược t c bất kì là không được phép. Sách lược ph n hả ồi mà ta đề xuấ ẽ là:t s
u v k K x k z k
Trong đó x k là trạng thái hiện th i ờ c a ủ h ệ thống 1
x k Ax k Bu k w k, z k là trạng thái hiện th i c a h ờ ủ ệ thống lý tưởng, v k là tín hiệu đầu vào cho hệ thống lý tưởng. Với sách lược ph n hả ồi, trạng thái x k thỏa mãn phương trình sai phân sau:
1
x k Ax k Bv k BKe k w k
Trong đó thì e k : x k z k là sai lệch gi a tr ng c a h ữ ạ ủ ệ thống thái thực t ế và trạng thái của h ệ thống lý tưởng. Gọi i x; 0 , , ,v e w là nghiệm t i thạ ời điểm i của mơ hình hệ thống x k 1 Ax k Bv k BKe k w kv i trớ ạng thái đầu t i thạ ời điểm 0 là x 0 , chuỗi tín hiệu điều khiển là v k , chu i nhiỗ ễu là w k , chuỗi tín hiệu sai lệch là e k . H ệ thống lý tưởng tương ứng v i h ớ ệ thống có thành phần b t đ nh ấ ị x k 1 Ax k Bv k BKe k w k là:
1
z k Az k Bv k
Sai lệch s ẽ thỏa mãn phương trình sai phân sau:
1 K
e k A e k w k
:
K
A A BK
Nó có dạng của phương trình sai phân được s dử ụng trước đó ngoại tr ma ừ trận A, nó có thể không phải là ma trận bền, và được thay th b i ma tr n ế ở ậ AK, là
Chương 3: Điều khi n d ể ự báo mơ hình phi tuyến
35
m t ma tr n bộ ậ ền được ch n bọ ởi người thi t k . N u ế ế ế K được chọn để có được ma trận làAKbền, thì ta sẽ có tập bấ ịnh tương ứng đượt đ c định nghĩa như sau:
1 0 : i j K K j S i A
Có thể được cho là nhỏ hơn giá trị góc củ ậa t p bất định S i v i mớ ọi i , nh ỏ hơn đáng kể ế n u ma tr n ậ A là không bền và i tương đố ớn, nhưng không nhất i l thiết ph i nh ả ỏ hơn nhiều ma tr n ậ A là bền. Nh ng gi ữ ả thiế ủt c a ta v t p ề ậ kéo theo r ng ằ S i , giống như S i bao g m c K ồ ả giá trị ốc bên trong nó cho mỗi giá g trị i . Vì ma trận AK là bền, t p ậ
0
: j
K K
j
S A t n tồ ại và dương bất bi n cho ế
1 K
e k A e k w k , cũng như vậy S iK SK trong không gian
Hausdorff khi i . Vì K được ch n c ọ ố định, tín hiệu điều khi n ph n hể ả ồi u K x k z k v k được tham s ố hóa bởi chuỗi tín hiệu điều khiển vịng hở
v k . N u ế x 0 z 0 , “tube” được t o ra bạ ởi sách lược điều khi n ể s ẽ là
, 0 , 1; , ,..., , ,
X x v X X x v X N x v
Trong đó X 0 x X i x v; , : K i x v w w W; , , | z i KS i Như ta đã biết thì z i là nghiệm của mơ hình lý tưởng t i thạ ời điểm i với trạng thái đầu c a h ủ ệ lý tưởng z 0 x 0 , và chuỗi tín hiệu điều khiển là v k . V i trớ ạng thái đầu cho trước x 0 và chuỗi tín hiệu điều khi n ể v k thì nghiệm
của phương trình x k 1 Ax k Bv k BKe k w knằm trên “tube”
,
X x v cho m i chu i nhi u ch p nhỗ ỗ ễ ấ ận được . Như đã đề ập trước đó, tậ c p
K
S i có thể được thay th bế ởi SK nhđể ận được “tube” bao ngoài. Nếu giảm s ự chú ý về thời gian để chọn kho ng th i gian ả ờ 0, N , S i K có thể được thay th ế bởi S N nhK để ận được một “tube” bao ngoài vừa ph ải.
Chương 3: Điều khi n d ể ự báo mơ hình phi tuyến
36
Trong nh ng th o luữ ả ận trước, ta có x 0 z 0 suy ra có e 0 0 để có thể đảm b o r ng e iả ằ S i hoặc là e i S i . Khi có K AK là ma trận b n, tuy ề nhiên, chúng ta có thể gi m nh m t s ả ẹ ộ ố yêu cầu đó. Với SK t n tồ ại và là bất định dương bền v ng cho ữ e k 1 A e kK w k , e k SK dẫn đến
1 K
e k S cho mọi e k 1 A e kK . Vì vậy, n u ế e 0 SK ,
thì e i SK cho mọi giá tr i và mọi wị .
Trong tube-based điều khi n d ể ự báo theo mơ hình, ta đảm b o r ng ả ằ z i 0 khi i , cũng có nghĩa là x i (n m trong t p ằ ậ z i S i ) h i t t i tK ộ ụ ớ ập
K
S với i . Mặc dù là SK là rất khó khăn để tính tốn, nó là một tính chất có tính hữu dụng trong lý thuyế ủa điềt c u khi n h th ng. B đi u khiể ệ ố ộ ề ển được yêu cầu để đả m b o r ng nh ng y u t ả ằ ữ ế ố ràng buộc c a trủ ạng thái và biến điều khi n ể là không được vi phạm. Để làm được điều đó, những hi u bi t v t p ể ế ề ậ SK là không cần thi t. Nế ếu chúng ta biế ằt r ng e 0 SK bởi vì, với ví dụ z 0 được l a chự ọn để thỏa mãn z 0 x 0 , với x i n m trong ằ z i SK cho mọi giá trị i . T t c nh ng th cấ ả ữ ế ần, trong bài toán điều khi n tể ối ưu lý tưởng P , là N “knowledge” củ ậa t p S ( t p ậ S được gọi là xấp x ỉ bao ngoài củ ậa t p SK ). N u ế có x i n m trong ằ z i SK , nó sẽ ch c ch n n m trong z iắ ắ ằ S . Và nếu z i S X v i mớ ọi i , thì x i z i SK chắc ch n thắ ỏa mãn yế ốu t ràng buộc c a bi n trủ ế ạng thái x i X v i mớ ọi giá trị i và chuỗi nhi u ch p nhễ ấ ận được. Tất nhiên, việc chọn độ ộ r ng c a t p x p x ủ ậ ấ ỉ bao ngoài Sdẫn đến mức độ chặt chẽ; v i t p S là mộ ự ựớ ậ t s l a ch n th a hi p gi a s ọ ỏ ệ ữ ự đơn giản và chặt ch cẽ ủa bài toán. Tập S x p x v i t p ấ ỉ ớ ậ SK , nó khơng chặt như S nhưng lại ph c tứ ạp hơn t p ậ S . Nếu ta được chọn tùy ý 0z , ta có thể ch n t p S ọ ậ là tập x p x ấ ỉ bao ngoài
Chương 3: Điều khi n d ể ự báo mơ hình phi tuyến
37
b t biấ ến dương bền v ng c a t p ữ ủ ậ SK ; sau đó x i z i S cho mọi giá trị