Động lực học phi tuyến có mặt ở hầu hết các ứng dụng kỹ thuật. Phát triển đầy đủ mô hình phi tuyến có thể rất khó khăn và không có cách thức mô hình rõ ràng nào là phù hợp để đại diện cho các quá trình phi tuyến tổng quát. Trên thực tế, mô hình phi tuyến là khó khăn để xây dựng, hoặc là từ đầu vào / đầu ra dữ liệu tương quan hoặc bằng cách sử dụng các nguyên tắc đầu tiên từ định luật bảo toàn khối lượng và năng lượng nổi tiếng.
3.2. Ƣớc lƣợng dịch tầm dự báo
Hình 3.1: Ước lượng dịch tầm dự báo
Khi áp dụng mô hình hệ phi tuyến hoặc xét đến yếu tố ràng buộc trong việc ước lượng, chúng ta không thể tính được mật độ phụ thuộc theo đệ quy cũng như khi ta sử dụng tới bộ lọc Kalman. Tương tự như vậy, chúng ta cũng không thể giải theo đệ quy bài toán bình phương tối thiểu. Nếu chúng ta sử dụng phương pháp bình phương tối thiểu, ta phải tối ưu hóa đồng thời tất cả các trạng thái trong quỹ đạo x T để nhận được trạng thái ước lượng. Bài toán tối ưu hóa trở nên khó hơn
Chương 3: Điều khiển dự báo mô hình phi tuyến
23
khi thời gian T được tăng lên. Phương pháp ước lượng dịch tầm dự báo (MHE) sẽ loại bỏ sự khó khăn đó bằng cách chỉ xem xét đến khoảng thời gianNgần nhất để đo đạc và cũng chỉ tìm ra N giá trị gần nhất của quỹ đạo trạng thái như là hình 3.1. Biến trạng thái được ước lượng là
,...,
N
x T x TN x T
và ước lượng đầu ra
,...,
N
y T y T N y T
Các dữ liệu hệ thống được chia thành hai phần
y T N 1 ,yN T y T
Giả sử rằng T N 1 để bỏ qua những chu kì ban đầu, trong đó cửa sổ ước lượng
điền đầy với các phép đo và giả sử rằng cửa sổ này luôn được điền đầy đủ.
Công thức đơn giản nhất của ước lượng dịch tầm dự báo theo công thức bình phương tối thiểu.
ˆ min N T N x T V x T Trong đó hàm mục tiêu là 1 1 1 2 2 1 ˆ 1 2 T T T N Q R k T N k T N V x T x k Ax k y k Cx k
Tác giả sử công thức như trên để chỉ rõ rằng hàm mục tiêu ước lượng dịch tầm dự báo đang xét đến các dữ liệu từ thời điểm TN đến thời điểm T chứ không xét đến toàn bộ thông tin hoặc là hàm bình phương tối thiểu xết đến dữ liệu từ 0 đến .T
Ước lượng dịch tầm dự báo của bình phương tối thiểu. Chú ý rằng từ phương pháp quy hoạch động sử dụng đệ qui, viết lại hàm mục tiêu bình phương tối thiểu đầy đủ
Chương 3: Điều khiển dự báo mô hình phi tuyến 24 1 1 1 2 2 1 1 2 T N T N T T Q R k T N k T N V x T V x T N x k Ax k y k Cx k
Trong đó VT N là hàm mục tiêu tại thời điểm T N . So sánh giữa hai hàm mục tiêu, rõ ràng rằng hàm mục tiêu đơn giản nhất của ước lượng dịch tầm dự báo tương đương với việc chọn hàm mục tiêu như trên bằng cách chọn VT N 0.
Ước lượng dịch tầm dự báo của mật độ phụ thuộc. Bởi vì chúng ta đã thiết lập mối liên kết giữa bình phương tối thiểu và mật độ phụ thuộc, ta viết lại bài hàm bình phương tối thiểu đầy đủ cũng như tương đương với cực đại hóa hàm mật độ phụ thuộc | max | N N x T y T x T p x T y T
Với hàm mật độ ở thời điểm trước đó
| 1 | 1 . VT N x
x T N y T N
p x y T N c e
(3.1)
Trong đó hằng số c và giá trị của nó không làm thay đổi nghiệm của bài toán tối ưu. Chúng ta có thể thấy từ công thức (3.1) rằng đặt VT N 0 trong hàm tối giản nhất của ước lượng dịch tầm dự báo tương đương cho phương sai vô hạn ứng với mật độ phụ thuộc của x T N | y T N 1 . Nó có nghĩa là ta bỏ qua các thông tin trước của biến trạng thái x T N và những thông tin trước giá trị đo
1 .
y T N
Để thuận tiện hơn cho bài toán ước lượng dịch tầm dự báo, ta đưa ra hàm phát cho trạng thái đầu tiên tính toán để bỏ qua thông tin về y T N 1
1 1 1 2 2 ˆ 1 1 2 T N T N T T Q R k T N k T N V x T x T N x k Ax k y k Cx k
Chương 3: Điều khiển dự báo mô hình phi tuyến
25
Với trường hợp cho hàm Gauss tuyến tính, ta có thể giải thích cho việc loại bỏ đi những thông tin mà không có thành phần xấp xỉ bằng cách đặt thêm hàm bằng với hàm VT N , tương đương với hàm loga âm của mật độ phụ thuộc tại trạng thái mà được cho bởi các phương thức đo các giá trị trước đó. Thật vậy, không cần sử dụng ước lượng dịch tầm dự báo cho bài toán Gauss tuyến tính bởi vì chúng ta có thể giải bài toán đầy đủ theo đệ quy.
3.3. Mô hình điều khiển dự báo
Những điểm quan trọng cần xem xét và yếu tố quyết định của điều khiển dự báo theo mô hình được đề xuất và thảo luận ở chương trước là một giải pháp của bài toán điều khiển tối ưu vòng hở được giải và nhận được nghiệm tối ưu theo phương pháp quy hoạch động ứng với trạng thái đầu. Khi có sự xuất hiện của thành phần bất định và biến trạng thái là biết được hoặc là bộ quan sát trang thái có thể sử dụng để ước lượng thì điều khiển phản hồi sẽ tốt hơn so với bộ điều khiển vòng hở. Bài toán điều khiển tối ưu được giải trực tuyến, vì vậy phương thức điều khiển phản hồi có thể áp dụng để đưa nghiệm đó trùng với nghiệm của phương pháp quy hoạch động. Bài toán điều khiển tối ưu với tầm dự báo N là *
N x
, trong đó biến quyết định điều khiển là chuỗi các luật điều khiển hơn là N x
với biến quyết định điều khiển u k là chuỗi các tín hiệu điều khiển. Điều khiển dự báo theo mô hình với
sách lược điều khiển được áp dụng là điều khiển dự báo theo mô hình có phản hồi để so sánh với đáp ứng của điều khiển dự báo theo mô hình thông thường. Cả hai phương thức điều khiển dự báo theo mô hình đều cung cấp phản hồi của tín hiệu điều khiển vì nhiệm vụ điều khiển sẽ phải phụ thuộc vào biến trạng thái hiện thời với cả hai trường hợp. Nhưng luật điều khiển được áp dụng có hay không sự phụ thuộc vào việc bài toán điều khiển tối ưu được giải theo vòng hở, trong thường hợp biến quyết định điều khiển là chuỗi điều khiển hoặc phản hồi, hoặc trong trường hợp biến quyết định điều khiển là sách lược điều khiển phản hồi.
Chương 3: Điều khiển dự báo mô hình phi tuyến
26
Trong điều khiển dự báo theo mô hình có phản hồi thì nghiệm tối ưu ứng với bài toán tối ưu *
N x là sách lược điều khiển
0 .; , 1 .; ,..., 1 .;
o o o o
N
x x x x
Những luật điều khiển cấu thành là sự hạn chế trong việc áp dụng phương pháp tối ưu quy hoạch động và do vậy nó phụ thuộc vào điều kiện đầu x k như là một hệ quả theo quan điểm này. Như vậy chỉ có duy nhất thành phần đầu tiên
0
0 ;
u x x x của luật điều khiển 0 .;x ứng với trạng thái đầu x k cần được xác định, trong khi các luật điều khiển tiếp theo đó chỉ cần được xác định trong một khoảng giới hạn.
Trong khi điều khiển dự báo theo mô hình có phản hồi là hiệu quả hơn khi có sự xuất hiện của thành phần bất định, liên quan tới việc bài toán tối ưu trở nên khó hơn so với bài toán tối ưu thông thường khi ứng dụng điều khiển dự báo theo mô hình. Biến quyết định điều khiển , là một chuỗi các luật điều khiển, có số chiều không giới hạn; mỗi luật điều khiển hoặc hàm số yêu cầu, nhìn chung thì có không giới hạn cách để chỉ ra nó. Tính phức tạp là khi giải bài toán tối ưu theo phương pháp quy hoạch động, với điều khiển dự báo theo mô hình, trong trường hợp đưa ra luật điều khiển có thể thay thế phương pháp quy hoạch động bằng giải bài toán tối ưu vòng hở, khi nó không dễ dàng để tìm được nghiệm tối ưu với sự xuất hiện của thành phần bất định. Do đó, để cố gắng nghiên cứu trong việc áp dụng điều khiển dự báo theo mô hình có phản hồi cần bỏ lại yếu tố tối ưu để có thể đơn giản hóa bài toán. Cũng giống như điều khiển thích nghi ngày nay, có rất nhiều đề xuất khác nhau thể thực hiện chúng. Những đề xuất cho điều khiển dự báo theo mô hình bền vững đều được đơn giản hơn cho việc thực thi hơn là áp dụng trực tiếp nghiệm tối ưu được giải từ phương pháp quy hoạch động.
Ta đã biết rằng những giải thuật tối ưu tiêu chuẩn đều có thể được áp dụng để tìm ra nghiệm tối ưu của chuỗi điều khiển vòng hở cho bài toán điều khiển tối ưu. Chúng ta còn chưa có nhiều giải thuật để giải quyết được vấn đề, vẫn còn tồn tại
Chương 3: Điều khiển dự báo mô hình phi tuyến
27
nhiều giải thuật, giải thuật “second variation” , nó đưa ra không chỉ duy nhất một chuỗi tín hiệu điều khiển tối ưu mà còn có luật phản hồi khu vực thay đổi theo thời gian u k v k K k x k z k , trong đó v k là chuỗi tín hiệu điều khiển tối ưu vòng hở và z k là chuỗi trạng thái tối ưu vòng hở tương ứng với
v k . Sách lược điều khiển này cung cấp tín hiệu điều khiển phản hồi cho biến trạng thái x k gần hơn tới biến trạng thái lý tưởng z k . Giải thuật “second variation” là quá phức tạp để áp dụng cho điều khiển dự báo theo mô hình thông thường bởi vì nó yêu cầu tính đạo hàm cấp hai theo x t u t , của hàm f và
l . Xét hệ tuyến tính, hàm mục tiêu là dạng toàn phương có thêm thành phần nhiễu, tuy nhiên, luật điều khiển tối ưu cho tầm dự báo vô hạn không có ràng buộc là u x Kx t . Kết quả này có thể đưa ra luật điều khiển thay đổi theo thời gian
u k v k K k x k z k với chuỗi trạng thái và chuỗi điều khiển z k
và v k thỏa mãn phương trình lý tưởng sai phân: z k 1 Az k Bv k ,
v z Kz k , chuỗi z k và v k là nghiệm tối ưu của vòng hở cho hệ không có nhiễu và trạng thái đầu. Luật điều khiển theo thời gian
u k v k K k x k z k rõ ràng là tối ưu với trường hợp hệ không có yếu tố ràng buộc; nó vẫn là tối ưu trong trường hợp hệ có yếu tố ràng buộc tại lân cận quỹ đạo ưu lượng z k nếu z k và v k thuộc điểm trong của miền ràng buộc tương ứng.
Có một số lý luận rằng sách lược điều khiển theo thời gian
,
u x k v k K xz k có thể là đầy đủ, ít nhất là khi hàm f là tuyến tính. Chuỗi tín hiệu điều khiển và biến trạng thái ước lượng, v k và z k có thể được tìm ra bằng cách giải bài toán tối ưu vòng hở với việc áp dụng điều khiển dự báo theo mô hình và ma trận phản hồi K được tính offline. Cho thấy rằng công thức của điều khiển dự báo theo mô hình bền vững có cùng mức độ khó việc tính
Chương 3: Điều khiển dự báo mô hình phi tuyến
28
online như là áp dụng cho hệ xác định thông thường. Nó cần sự thay đổi của công thức cho bài toán điều khiển tối ưu online trong đó ràng buộc được đơn giản hóa để xem xét đến sự xuất hiện của thành phần nhiễu, do vậy sự ràng buộc lên quỹ đạo trạng thái của hệ thống chứa thành phần bất định để cho nằm trong “tube” được đặt ở trung tâm của quỹ đạo ước lượng. Tính toán offline được áp dụng để quyết định đến ràng buộc bị thay đổi và ma trận phản hồi K. Chúng ta cũng đưa ra một sự thay đổi của quá trình “tube-based” này cho hệ phi tuyến với sách lược phản hồi khu vực phi tuyến được sử dụng.
3.4. Điều khiển dự báo theo mô hình tube-based 3.4.1.Điều khiển tube-based 3.4.1.Điều khiển tube-based
Trong hình 3.1, “Tube” ứng với tín hiệu điều khiển tối ưu o
uu x và điều kiện đầu x1, là X X X0, 1, 2,X3 trong đó X0 1 , với mỗi i
; , , w | w W
i
X i x u , tập học các trạng thái tại thời điểm i được tạo ra bởi các thành phần nhiễu có thể xảy ra. Những ràng buộc của biến trạng thái phải được thỏa mãn bởi mỗi quỹ đạo trạng thái trong “tube”. Bài toán điều khiển hệ có thành phần bất định được xem như tốt nhất với việc điều khiển các “tube” hơn là điều khiển quỹ đạo; người thiết kế có có thể chọn cho mỗi điều kiện đầu một “tube” trong tất cả sự thực thi của quỹ đạo trạng thái được điều khiển để nó nằm vào trong đó. Bằng một cách lựa chọn thuận tiện của “tube”, sự thỏa mãn yếu tố ràng buộc của biến trạng thái và biến điều khiển có thể được đảm bảo cho mỗi lần thực thi của chuỗi thành phần nhiễu.
Chương 3: Điều khiển dự báo mô hình phi tuyến
29
Hình 3.2: Quỹ đạo vòng hở
Xác định một cách chính xác “tube” X X0, 1,... tương ứng với điều kiện đầu đã cho và sách lược điều khiển là rất khó khăn, thậm chí là với hệ tuyến tính, và là hầu như không thể cho các hệ phi tuyến. Do đó, tác giả sẽ đưa ra cách làm như thế nào để đơn giản các “tube”, nó sẽ giới hạn tất cả trường hợp có thể xảy ra của quỹ đạo trạng thái. Ví dụ, cho hệ tuyến tính với ràng buộc lồi, với “tube” X X0, 1,..., trong đó với mỗi i ,Xi z i Z ,z i là trạng thái tại thời điểm i của hệ cho trước, Xi là một “polytope” , và Z là một tập bất biến dương, có thể được thiết kế để giới hạn toàn bộ trường hợp có thể xảy ra của quỹ đạo trạng thái. “Tube” chính xác đó sẽ nằm ở bên trong của việc xấp xỉ đơn giản đó. Áp dụng cấu trúc này cho điều khiển dự báo theo mô hình bền vững, nó được thiết kế mà không cần quá nhiều công việc tính toán như là yêu cầu đối với hệ đã xác định đó.
Chương 3: Điều khiển dự báo mô hình phi tuyến
30
3.4.2.Tube-based cho điều khiển dự báo theo mô hình a) Giới thiệu a) Giới thiệu
Để thiết lập thuật toán trong thực tế chúng ta cần bỏ qua tính tối ưu để đơn giản hơn, đã có nhiều phương thức để làm điều đó. Tác giả đưa ra tiếp theo đây một quy trình để đạt được mục tiêu và kết quả tốt cho điều khiển dự báo theo mô hình bền vững bằng cách giải online bài toán điều khiển tối ưu, nó có độ khó tương đương với bài toán điều khiển dự báo theo mô hình thông thường. Chúng ta làm đơn giản hóa biến điều khiển, lý tưởng hóa, là một sách lược bằng cách thay thế nó với một tham số hữu hạn chiều, nó bao gồm chuỗi điều khiển vòng hở và bộ điều