Mô hình điều khiển dự báo

Những điểm quan trọng cần xem xét và yếu tố quyết định của điều khiển dự báo theo mô hình được đề xuất và thảo luận ở chương trước là một giải pháp của bài toán điều khiển tối ưu vòng hở được giải và nhận được nghiệm tối ưu theo phương pháp quy hoạch động ứng với trạng thái đầu. Khi có sự xuất hiện của thành phần bất định và biến trạng thái là biết được hoặc là bộ quan sát trang thái có thể sử dụng để ước lượng thì điều khiển phản hồi sẽ tốt hơn so với bộ điều khiển vòng hở. Bài toán điều khiển tối ưu được giải trực tuyến, vì vậy phương thức điều khiển phản hồi có thể áp dụng để đưa nghiệm đó trùng với nghiệm của phương pháp quy hoạch động. Bài toán điều khiển tối ưu với tầm dự báo N là *  

N x

, trong đó biến quyết định điều khiển  là chuỗi các luật điều khiển hơn là N x

với biến quyết định điều khiển u k  là chuỗi các tín hiệu điều khiển. Điều khiển dự báo theo mô hình với

sách lược điều khiển được áp dụng là điều khiển dự báo theo mô hình có phản hồi để so sánh với đáp ứng của điều khiển dự báo theo mô hình thông thường. Cả hai phương thức điều khiển dự báo theo mô hình đều cung cấp phản hồi của tín hiệu điều khiển vì nhiệm vụ điều khiển sẽ phải phụ thuộc vào biến trạng thái hiện thời với cả hai trường hợp. Nhưng luật điều khiển được áp dụng có hay không sự phụ thuộc vào việc bài toán điều khiển tối ưu được giải theo vòng hở, trong thường hợp biến quyết định điều khiển là chuỗi điều khiển hoặc phản hồi, hoặc trong trường hợp biến quyết định điều khiển là sách lược điều khiển phản hồi.

Chương 3: Điều khiển dự báo mô hình phi tuyến

Trong điều khiển dự báo theo mô hình có phản hồi thì nghiệm tối ưu ứng với bài toán tối ưu *  

N x là sách lược điều khiển

   0 .; , 1  .; ,..., 1 .; 

o o o o

x x x x

     

Những luật điều khiển cấu thành là sự hạn chế trong việc áp dụng phương pháp tối ưu quy hoạch động và do vậy nó phụ thuộc vào điều kiện đầu x k  như là một hệ quả theo quan điểm này. Như vậy chỉ có duy nhất thành phần đầu tiên

   

0 ;

u x  x x của luật điều khiển 0 .;x ứng với trạng thái đầu x k  cần được xác định, trong khi các luật điều khiển tiếp theo đó chỉ cần được xác định trong một khoảng giới hạn.

Trong khi điều khiển dự báo theo mô hình có phản hồi là hiệu quả hơn khi có sự xuất hiện của thành phần bất định, liên quan tới việc bài toán tối ưu trở nên khó hơn so với bài toán tối ưu thông thường khi ứng dụng điều khiển dự báo theo mô hình. Biến quyết định điều khiển , là một chuỗi các luật điều khiển, có số chiều không giới hạn; mỗi luật điều khiển hoặc hàm số yêu cầu, nhìn chung thì có không giới hạn cách để chỉ ra nó. Tính phức tạp là khi giải bài toán tối ưu theo phương pháp quy hoạch động, với điều khiển dự báo theo mô hình, trong trường hợp đưa ra luật điều khiển có thể thay thế phương pháp quy hoạch động bằng giải bài toán tối ưu vòng hở, khi nó không dễ dàng để tìm được nghiệm tối ưu với sự xuất hiện của thành phần bất định. Do đó, để cố gắng nghiên cứu trong việc áp dụng điều khiển dự báo theo mô hình có phản hồi cần bỏ lại yếu tố tối ưu để có thể đơn giản hóa bài toán. Cũng giống như điều khiển thích nghi ngày nay, có rất nhiều đề xuất khác nhau thể thực hiện chúng. Những đề xuất cho điều khiển dự báo theo mô hình bền vững đều được đơn giản hơn cho việc thực thi hơn là áp dụng trực tiếp nghiệm tối ưu được giải từ phương pháp quy hoạch động.

Ta đã biết rằng những giải thuật tối ưu tiêu chuẩn đều có thể được áp dụng để tìm ra nghiệm tối ưu của chuỗi điều khiển vòng hở cho bài toán điều khiển tối ưu. Chúng ta còn chưa có nhiều giải thuật để giải quyết được vấn đề, vẫn còn tồn tại

Chương 3: Điều khiển dự báo mô hình phi tuyến

nhiều giải thuật, giải thuật “second variation” , nó đưa ra không chỉ duy nhất một chuỗi tín hiệu điều khiển tối ưu mà còn có luật phản hồi khu vực thay đổi theo thời gian u k   v k K k     x k z k , trong đó  v k  là chuỗi tín hiệu điều khiển tối ưu vòng hở và  z k  là chuỗi trạng thái tối ưu vòng hở tương ứng với

 

 v k . Sách lược điều khiển này cung cấp tín hiệu điều khiển phản hồi cho biến trạng thái x k  gần hơn tới biến trạng thái lý tưởng z k . Giải thuật “second variation” là quá phức tạp để áp dụng cho điều khiển dự báo theo mô hình thông thường bởi vì nó yêu cầu tính đạo hàm cấp hai theo x t u t   ,  của hàm f   và

 

l  . Xét hệ tuyến tính, hàm mục tiêu là dạng toàn phương có thêm thành phần nhiễu, tuy nhiên, luật điều khiển tối ưu cho tầm dự báo vô hạn không có ràng buộc là u x Kx t  . Kết quả này có thể đưa ra luật điều khiển thay đổi theo thời gian

          

u k v k K k x k z k với chuỗi trạng thái và chuỗi điều khiển  z k 

và  v k  thỏa mãn phương trình lý tưởng sai phân: z k  1 Az k Bv k  ,

   

v z Kz k , chuỗi  z k  và v k  là nghiệm tối ưu của vòng hở cho hệ không có nhiễu và trạng thái đầu. Luật điều khiển theo thời gian

          

u k v k K k x k z k rõ ràng là tối ưu với trường hợp hệ không có yếu tố ràng buộc; nó vẫn là tối ưu trong trường hợp hệ có yếu tố ràng buộc tại lân cận quỹ đạo ưu lượng  z k  nếu  z k  và v k thuộc điểm trong của miền ràng buộc tương ứng.

Có một số lý luận rằng sách lược điều khiển theo thời gian

   ,   

u x k v k K xz k có thể là đầy đủ, ít nhất là khi hàm f   là tuyến tính. Chuỗi tín hiệu điều khiển và biến trạng thái ước lượng,  v k  và  z k  có thể được tìm ra bằng cách giải bài toán tối ưu vòng hở với việc áp dụng điều khiển dự báo theo mô hình và ma trận phản hồi K được tính offline. Cho thấy rằng công thức của điều khiển dự báo theo mô hình bền vững có cùng mức độ khó việc tính

Chương 3: Điều khiển dự báo mô hình phi tuyến

online như là áp dụng cho hệ xác định thông thường. Nó cần sự thay đổi của công thức cho bài toán điều khiển tối ưu online trong đó ràng buộc được đơn giản hóa để xem xét đến sự xuất hiện của thành phần nhiễu, do vậy sự ràng buộc lên quỹ đạo trạng thái của hệ thống chứa thành phần bất định để cho nằm trong “tube” được đặt ở trung tâm của quỹ đạo ước lượng. Tính toán offline được áp dụng để quyết định đến ràng buộc bị thay đổi và ma trận phản hồi K. Chúng ta cũng đưa ra một sự thay đổi của quá trình “tube-based” này cho hệ phi tuyến với sách lược phản hồi khu vực phi tuyến được sử dụng.

Động lực học phi tuyến

Điều khiển dự báo theo mô hình tube-based