CƠ SỞ LÝ THUYẾT TỐI ƯU
Điều khiển phản hồi trạng thái tối ưu (LQR)
1Hình 1.1 Cấu trúc điều khiển phản hồi trạn thái tối ưu LQR
Cho hệ tuyến tính tham số hằng: dx Ax Bu dt (1.1) x: là vector trạng thái; u: đầu vào điều khiển
A: là ma trận trạng thái hằng số; B: là ma trận đầu vào hằng số
Tìm kích thích điều khiển u(x,t) sao cho hàm mục tiêu dạng toàn phương:
- R là ma trận đối xứng xác định dương
- Q là ma trận đối xứng bán xác định dương
- Khoảng thời gian T cố định cho trước
- Trạng thái đầu x(0) tùy ý cho trước, trạng thái cuối x(T) tùy ý
- Không có rằng buộc về tín hiệu điều khiển
1.1.1 Trường hợp thời gian tối ưu là hữu hạn
Trong mục này ta sử dụng phương pháp biến phân nhằm tìm ra tín hiệu điều khiển tối ưu Ta thành lập hàm Hamilton như sau:
Từ điều kiện cần, tín hiệu tối ưu u* phải thỏa mãn:
Thay kết quả (1.4) vào mô hình (1.1) ta có hệ phương trình vi phân với các biến trạng thái là x và p:
Do điều kiện cuối của biến đồng trạng thái p 0 nên
Chương 1: Cơ sở lý thuyết tối ưu
5 Đặt P t( )-E 21 t E 11 1 t thay vào công thức (1.4) ta có:
Thuật toán 1.1: Bộ điều khiển phản hồi âm như công thức (1.7) sẽ được thiết kế từ các công thức (1.5) tính ma trận (1.6) tính H21, H11 và cuối cùng là công thức (1.7)
Ma trận e A t ˆ - là một ma trận hàm, với các phần tử là hàm số theo t, điều này làm cho việc xác định các ma trận con H11 và E21 để tính P(t) trở nên khó khăn và không mang tính hệ thống Vì vậy, cần tìm kiếm những phương pháp đơn giản hơn để giải quyết vấn đề này.
Bắt đầu từ mối quan hệ giữa biến đồng trạng thái và biến trạng thái, kết hợp với điều kiện của biến đồng trạng thái trong phương pháp biến phân, ta có thể rút ra những kết luận quan trọng về sự tương tác giữa các yếu tố này.
T dp dP dx dP x P x P Ax BR B p dt dt dt dt dPx PAx PBR B Px dt dP PA PBR B P x dt
Do tính chất của biến đồng trạng thái dp H Qx A p T Q A P x T dt x
Phương trình vi phân Riccati là một loại phương trình phi tuyến nổi bật với nhiều nghiệm khác nhau Theo tài liệu, các nghiệm của phương trình này có những đặc tính đáng chú ý.
- P T( ) trong đó là ma trận không, P(t) ma trận xác định dương
- P t( )không phụ thuộc vào x0 , tức là nghiệm tối ưu không phụ thuộc vào trạng thái đầu của hệ thống
- P t( )phụ thuộc vào T, và lim ( )
Phương pháp giải phương trình vi phân riccati chính xác và chứng minh các tính chất của ma trận P(t) có thể tham khảo tại các tài liệu [1][2]
1.1.2 Trường hợp thời gian tối ưu là vô hạn
Khi thời gian tối ưu kéo dài vô hạn, ma trận giá trị P sẽ tiến dần về một ma trận hằng Điều này dẫn đến việc phương trình vi phân Riccati chuyển đổi thành phương trình đại số Riccati.
Bộ điều khiển phản hồi sẽ tương tự khâu khuếch đại hằng số
Giá trị của hàm mục tiêu:
1.1.3 Tính ổn định của hệ kín
Tính ổn định của hệ thống điều khiển là chỉ tiêu quan trọng nhất, với trọng tâm là tính bền của ma trận hệ kín (A - BK) Nếu hệ thống không ổn định, bài toán điều khiển tối ưu sẽ trở nên vô nghĩa.
Trong trường hợp thời gian tối ưu là hữu hạn, việc thêm điều kiện xT = 0 sẽ đảm bảo hệ kín ổn định GAS Ngược lại, nếu không có điều kiện này, bộ điều khiển sẽ được thiết kế theo thuật toán 1.1.
Chương 1: Cơ sở lý thuyết tối ưu
Hệ thống có thể không đảm bảo tính ổn định khi bộ điều khiển tối ưu chỉ đảm bảo hàm chi phí J min bị chặn trong khoảng thời gian (0;T) Tuy nhiên, sau thời điểm T, không thể khẳng định hệ thống vẫn ổn định vì hàm chi phí J không còn ảnh hưởng nữa Đây vẫn là một bài toán mở Đối với trường hợp thời gian tối ưu là vô hạn, hiện tại chưa có các điều kiện cần và đủ cho các ma trận A, B, Q, R để hệ GAS, nhưng có một số điều kiện đủ đã được xác định.
- Nghiệm P là xác định dương
- (A,B) điều khiển được, (A, Z) quan sát được với QZ Z T
Thuật toán Kleinman và các tính chất liên quan
Trong các tài liệu [1][7] , xét bài toán tối ưu 1.1, lấy Pi, với i = 0, 1, là nghiệm ma trận đối xứng xác định dương duy nhất của phương trình lyapunov:
Trong đó, bằng phép lặp:
K 0được chọn sao cho ma trận ABK 0 có các trị riêng có phần thực âm
Thì các tính chất sau thỏa mãn:
3) Ak có các trị riêng có phần thực âm
( P là nghiệm của ARE trong mục 1.1.2 P k 1 P k tương đương P k 1 P k là ma trận xác định dương )
Giả sử ta có tín hiệu điều khiển dạng:
J x Qx u Ru dt x e Q K RK e x dt x e Q K RK e dt x
P i tồn tại giới hạn khi và chỉ khi ma trận trạng thái Ai = A - BKi của hệ kín có các trị riêng với phần thực âm Trong trường hợp này, Pi là nghiệm của phương trình Lyapunov.
Từ định nghĩa Pi ta có:
Áp dụng vào chứng minh, thay K k R B P 1 T k 1 vào công thức trên ta có
Do đó P 1 P 0 và ma trận A1 ổn định (vì P1 là nghiệm của phương trình (1.10) ) Tương tự ta cũng có P k 1 P k và:
Chương 1: Cơ sở lý thuyết tối ưu
=> các tính chất 1) 3) thỏa mãn
Dãy Pk bao gồm các phần tử xác định dương và giảm, do đó tồn tại giới hạn khi k tiến ra vô cùng Từ thuật toán, ta có thể xác định phương trình liên quan đến dãy này.
A P BR B P Cho qua giới hạn ta có:
Rõ ràng cùng với (1.10) phương trình ARE sẽ cho nghiệm duy nhất, dẫn đến
Thuật toán Kleiman cung cấp một phương pháp truy hồi có thể áp dụng vào hệ số thực tế, cho phép truy hồi từ các bước 1, 2, Tuy nhiên, kết quả thu được sẽ có sự sai lệch nhỏ so với kết quả thực tế.
Tóm tắt các bước của thuật toán Kleinman như sau:
1) Xác định bộ phản hồi trạng thái K0 làm hệ ổn định (A-BK0 là ma trận bền), chọn hằng số bé tùy ý
2) Tính Ak bằng (2),và Pk bằng cách giải phương trình (1)
4) Nếu đúng đưa ra kết quả Pk, nếu không tính Kk+1 rồi quay lại bước 2.
Phương pháp quy hoạch động
1.3.1 Trường hợp hệ liên tục
Bài toán 1.2: Cho hệ liên tục không dừng, bậc n:
Và các điều kiện ràng buộc:
- Tập U m là một tập con ( hở hoặc đóng ) trong không gian điều khiển m
- Khoảng thời gian T xảy ra quá trình tối ưu là cố định trước
- Trạng thái đầu x 0 x 0 là tùy ý, nhưng phải cho trước
- Trạng thái cuối x T x T là bất kỳ
Hãy xác định bộ điều khiển phản hồi trạng thái tối ưu u * u x t , U đưa hệ đi từ x 0 tới x T trong khoảng thời gian T sao cho hàm mục tiêu Q cho bởi
Q g x u t dt (1.13) Đạt giá trị nhỏ nhất
Trước tiên, từ nội dung nguyên lý tối ưu, ta định nghĩa hàm Bellman:
Hàm Bellman đại diện cho giá trị tối ưu trong quá trình tối ưu từ thời điểm t đến thời điểm cuối T Nó thể hiện giá trị của hàm mục tiêu dọc theo đoạn cuối của quỹ đạo tối ưu, bắt đầu từ trạng thái x(t) = x' đến trạng thái x(T) bất kỳ.
Khi đó, theo nguyên lý tối ưu Bellman thì:
(1.15) Định lý 1.1: Nếu u * u x t , U là nghiệm bài toán tối ưu 1.2 thì hàm Bellman (1.14) phải thỏa mãn: a)
Chương 1: Cơ sở lý thuyết tối ưu
Phương trình vi phân đạo hàm riêng (1.16) có tên gọi là phương trình Hamilton – Jacobi – Bellman, viết tắt là phương trình HJB
Thuật toán 1.2: Thuật toán quy hoạch động cho hệ liên tục
1) Từ điều kiện b), tức là từ công thức (1.17) ta xác định quan hệ phải có của tín hiệu điều khiển tối ưu u * với x và B x t , x
, nói cách khác là xác định quan hệ:
2) Thay quan hệ (1.18) vừa tìm được vào phương trình HJB (1.16) và xác định nghiệm B x t , của nó thỏa mãn điều kiện biên B x T T , 0
3) Thay nghiệm B x t , tìm được vào (1.18) để có bộ điều khiển tối ưu
Chú ý: Nếu ở bài toán 1.2 không có điều kiện ràng buộc U cho tín hiệu điều khiển u m thì để có u * u x B x t , , từ công thức (1.17), ta có thể sử dụng điều kiện cần:
1.3.2 Trường hợp hệ không liên tục
Phương pháp quy hoạch động nổi bật hơn phương pháp biến phân trong việc giải quyết các bài toán tối ưu không có ràng buộc U hoặc có ràng buộc U là tập hở, đặc biệt là trong trường hợp hệ không liên tục.
Phương pháp quy hoạch động là một kỹ thuật tính toán nhằm tìm ra nghiệm cho các bài toán tối ưu không liên tục, một lĩnh vực mà trước đây chưa được giải quyết hoàn toàn.
Bài toán 1.3 [1] : Cho hệ không liên tục không dừng, bậc n:
Với phiếm hàm mục tiêu
Và các điều kiện ràng buộc:
- Tập U m là một tập con ( hở hoặc đóng) trong không gian điều khiển m
- Số bước điều khiển N xảy ra quá trình tối ưu là cố định cho trước
- Trạng thái đầu x 0 là tùy ý, nhưng phải cho trước
- Trạng thái cuối x N có thể cho trước, nhưng cũng có thể là bất kỳ
Xác định bộ điều khiển phản hồi trạng thái tối ưu \( u_k^* = u(x(k)) \) thuộc tập hợp \( U \) nhằm điều khiển hệ thống từ trạng thái ban đầu \( x_0 \) đến trạng thái cuối \( x_N \) trong \( N \) bước, với mục tiêu là tối thiểu hóa giá trị hàm mục tiêu \( Q \) theo công thức (1.19).
Kỹ thuật nhúng (vòng ngược) [1]
Dựa trên nguyên lý tối ưu, chúng ta sẽ giải bài toán 1.3 bằng cách áp dụng phương pháp đi ngược từ thời điểm cuối N về thời điểm đầu 0 Tại mỗi thời điểm k trong khoảng này, chúng ta sẽ xác định các giá trị tối ưu để tìm ra nghiệm cho bài toán.
Để xác định mối quan hệ giữa tín hiệu điều khiển \( u_k \) và trạng thái tối ưu \( x_k \), cần lập công thức biểu diễn giá trị hàm mục tiêu Điều này được thực hiện thông qua phương trình (1.19) cho đoạn cuối.
Theo nguyên lý tối ưu, các hàm Q k trong quỹ đạo trạng thái tối ưu phải đạt giá trị nhỏ nhất khi tính ngược từ k = N, N-1, , 1, 0.
Chương 1: Cơ sở lý thuyết tối ưu
Khi đã xác định hàm B k 1 cho đoạn cuối tối ưu từ điểm trạng thái x k 1, ta có thể xác định mối quan hệ giữa tín hiệu điều khiển tối ưu u* và trạng thái x k theo quy tắc.
Trong đó các giá trị biênB B 0 , N được xác định từ điều hiển nhiên sau: min 0
Công thức (1.20) và điểm xuất phát (1.21) tạo ra công cụ giúp xác định quan hệ giữa tín hiệu điều khiển và trạng thái tối ưu u * = u x(k) Các bước tính toán này được gọi là vòng ngược, thực hiện từ k = N (trạng thái cuối x N) đến k = 0 (trạng thái đầu x 0) Kỹ thuật này được Bellman gọi là kỹ thuật nhúng.
Nội dung của vòng ngược như sau:
1) Bắt đầu từ k N 1 ta có B N 0 Từ đây, trong trường hợp x N bất kỳ thì với công thức (1.20) ta được:
Và hàm Bellman B N 1 cũng như u * N 1 chỉ phụ thuộc vào x N 1 Trong trường hợp x N là cố định cho trước ta lại có:
Như vậy, ở đây hàm Bellman B N 1 và u * N 1 cũng chỉ phụ thuộc vào x N 1 Ta sẽ nhấn mạnh sự phụ thuộc này bằng ký hiệu B N 1 x N 1 và u * N 1 x N 1
2) Lần lượt với k N 2, ,1,0 thì do hàm Bellman B k 1 và u * k 1 đã có được từ bước trước chỉ phụ thuộc vào x k 1 , tức là B k 1 x k 1 và u * k 1 x k 1 , nên theo (1.20), mà cụ thể là:
Ta cũng có B k và u k * chỉ phụ thuộc vào x k , tức là, lại có các hàm:B k x k và
Chú ý: Nếu bài toán 1.3 không có ràng buộc U cho tín hiệu điều khiển thì để tìm u k * theo công thức (1.21), ta có thể sử dụng điều kiện cần:
Bằng cách thực hiện N bước tính ngược từ k = -N + 1 đến k = 0, ta thu được N công thức mô tả mối quan hệ u * k(x k) với k = 0, 1, , N - 1 Đây chính là bộ điều khiển phản hồi trạng thái tối ưu mà chúng ta cần tìm, tức là nghiệm của bài toán 1.3.
Sau khi xác định được tín hiệu tối ưu u * k cho k = 0, 1, , N-1 và có điểm đầu x 0 đã được chỉ định, giá trị cụ thể của tín hiệu tối ưu u * k sẽ được tính toán dựa trên mô hình đối tượng.
1 , , k k k x f x u k Ta gọi các bước tính này là vòng xuôi vì nó được thực hiện lần lượt từ k 0 đến k N 1
Nội dung của vòng xuôi như sau:
Chương 1: Cơ sở lý thuyết tối ưu
1) Với k 0 ta có giá trị cụ thể của u 0 * u 0 * x 0 , vì đã có x 0 Từ đây cũng có được x 1 từ x 0 và u * 0 theo công thức
2) Với 1 k N 1 ta cũng lân lượt có u * k u * k x k và x k 1 f x u k k , k ,
Điều khiển dự báo MPC
Điều khiển dự báo mô hình (MPC) đã phát triển từ cuối những năm 70, cung cấp một lớp các phương pháp điều khiển dựa trên mô hình của đối tượng nhằm tối thiểu hóa hàm mục tiêu MPC liên quan chặt chẽ đến điều khiển tối ưu truyền thống, cả hai đều sử dụng khái niệm hàm mục tiêu để thiết lập sách lược điều khiển Khái niệm “dự báo” trong MPC đề cập đến việc ước lượng hành vi của hệ thống trong tương lai, giúp đưa ra tín hiệu điều khiển phù hợp Khác với điều khiển tối ưu truyền thống, nơi nghiệm tối ưu được xác định từ các bài toán tối ưu đã cho, tín hiệu điều khiển theo MPC là một dãy điều khiển, với mỗi phần tử đại diện cho tín hiệu tại thời điểm cụ thể Bài toán tối ưu được lặp lại sau mỗi chu kỳ với thông tin mới nhất về hệ thống.
MPC (Model Predictive Control) rất phù hợp cho các hệ thống tuyến tính nhờ vào mô hình tuyến tính, giúp ước lượng trạng thái tiếp theo của biến trạng thái một cách đơn giản Tuy nhiên, việc tính toán nhiều giá trị ước lượng cùng lúc dẫn đến thời gian tính toán kéo dài, đặc biệt trong các hệ thống có nhiều đầu vào và đầu ra Do đó, phạm vi ứng dụng của MPC thường bị giới hạn trong các hệ thống có động học chậm.
Dựa vào mô hình quá trình, các phương pháp MPC được phân loại thành mô hình tuyến tính và phi tuyến Mỗi loại mô hình này đều có những ưu điểm và nhược điểm riêng, vì vậy việc lựa chọn mô hình phù hợp sẽ phụ thuộc vào bài toán cụ thể và yêu cầu kỹ thuật.
Lớp mô hình tuyến tính, bao gồm hàm truyền, đáp ứng xung và đáp ứng quá độ, giúp ước lượng nhanh chóng và dễ dàng áp dụng thuật toán vào phần cứng Tuy nhiên, do các quá trình thực tế thường phi tuyến, việc tìm kiếm mô hình tuyến tính phù hợp trở nên khó khăn.
Do đó mô hình phi tuyến đc sử dụng cho những bài toán yêu cầu việc ước lượng các biến quá trình chính xác
1.4.1 Điều khiển dự báo mô hình tuyến tính
MPC (Model Predictive Control) ban đầu được phát triển cho hệ tuyến tính, và hiện nay, nhiều nghiên cứu về MPC cho hệ tuyến tính đã được áp dụng rộng rãi Các phương pháp điều khiển như GPC (Generalized Predictive Control) và DMC (Dynamic Matrix Control) là những ví dụ điển hình trong lĩnh vực này.
2Hình 1.2: Mô tả tầm dự báo Ny và tầm điều khiển Nu
Mô hình là nền tảng của điều khiển dự báo (MPC), cho phép dự đoán hành vi tương lai của quá trình Để đạt được điều này, mô hình cần thể hiện sự phụ thuộc của đầu ra vào các biến đo được hiện tại cùng với các biến đầu vào hiện tại và tương lai Trong MPC, mô hình chỉ sử dụng để tính toán đầu ra dự báo, vì vậy một mô hình đơn giản nhưng chính xác là lý tưởng Mô hình có thể là tuyến tính hoặc phi tuyến, tùy thuộc vào độ phức tạp của tính toán và độ chính xác cần thiết Do MPC thực hiện tính toán ở các thời điểm trích mẫu, mô hình gián đoạn là lựa chọn chính, và từ đây, chúng ta sẽ tập trung vào các mô hình gián đoạn của đối tượng.
Chương 1: Cơ sở lý thuyết tối ưu
17 a) Mô hình đáp ứng xung
Trong hệ tuyến tính, việc biết đáp ứng xung cho phép chúng ta tính toán đầu ra dựa trên đầu vào thông qua phép tính cuộn Do đó, mô hình đáp ứng xung có thể được áp dụng hiệu quả trong điều khiển dự đoán model predictive control (MPC).
Dãy giá trị { g k } được gọi là dãy trọng lượng, tương tự như định nghĩa hàm trọng lượng trong mô hình liên tục, và phương trình liên quan được gọi là mô hình đáp ứng xung Mỗi giá trị g k trong dãy trọng lượng thể hiện ảnh hưởng khác nhau của các giá trị đầu vào trong quá khứ đối với giá trị y t ( ) tại thời điểm hiện tại Đối với một quá trình ổn định, dãy trọng lượng sẽ giảm dần về 0 khi k tăng lên.
Vì thế ta có thể xấp xỉ bằng một mô hình đáp ứng xung hữu hạn hay gọi tắt là mô hình FIR(Finite Impulse Response):
Trong đó N được chọn đủ lớn để các số hạng sau có thể bỏ qua b) Mô hình trạng thái
Phương trình trạng thái gián đoạn của hệ tuyến tính có thể được viết:
Các ma trận A, B, C, D được gọi lần lượt là ma trận chuyển tiếp, ma trận đầu vào, ma trận đầu ra và ma trận liên thông Trong mô hình tham số hằng, các phần tử của chúng là hằng số, trong khi đối với mô hình tham số biến thiên, chúng là hàm theo thời gian Mối quan hệ giữa đầu vào và đầu ra, cũng như giữa đầu vào và trạng thái, được tính theo công thức đã được xác định.
1.4.2 Điều khiển dự báo mô hình phi tuyến (NMPC) Động lực học phi tuyến có mặt ở hầu hết các ứng dụng kỹ thuật Phát triển đầy đủ mô hình phi tuyến có thể rất khó khăn và không có cách thức mô hình rõ ràng nào là phù hợp để đại diện cho các quá trình phi tuyến tổng quát Trên thực tế, mô hình phi tuyến là khó khăn để xây dựng, hoặc là từ đầu vào / đầu ra dữ liệu tương quan hoặc bằng cách sử dụng các nguyên tắc đầu tiên từ định luật bảo toàn khối lượng và năng lượng nổi tiếng Ba loại chính của mô hình được sử dụng trong lĩnh vực này là: thực nghiệm, cơ bản (mà đến trực tiếp từ phương trình cân bằng, thường được gọi là mô hình nguyên tắc đầu tiên), và hộp màu xám (được phát triển bằng cách kết hợp các phương pháp thực nghiệm và cơ bản, khai thác lợi thế của từng loại mô hình) mô hình thực nghiệm được thảo luận dưới đây Một khó khăn cơ bản kết hợp với các phương pháp tiếp cận mô hình thực nghiệm là lựa chọn một dạng mô hình phù hợp Các mô hình có sẵn phi tuyến sử dụng cho NMPC, được chia thành hai nhóm chính: đầu vào-đầu ra và không gian trạng thái Và trong nội dung đề tài này ta chỉ tập trung và mô hình trên không gian trạng thái
Trong luận văn này, chúng tôi sẽ áp dụng điều khiển dự báo cho mô hình phi tuyến trong hệ xe kéo Lý thuyết liên quan sẽ được trình bày chi tiết trong chương 3, trong khi việc triển khai ứng dụng sẽ được thực hiện ở chương 4.
Ý tưởng của NMPC tương tự như MPC cho hệ tuyến tính, bao gồm hàm mục tiêu và luật điều khiển được cập nhật theo thời gian Tuy nhiên, NMPC cung cấp nhiều lựa chọn hơn về mô hình dự báo, cho phép áp dụng vào các hệ phi tuyến mà không cần phải xấp xỉ tuyến tính như trong MPC truyền thống.
Chương 2: Điều khiển dự tối ưu cho hệ LTI không biết trước tham số
ĐIỀU KHIỂN TỐI ƯU CHO HỆ TUYẾN TÍNH BẤT BIẾN THEO THỜI GIAN KHÔNG BIẾT TRƯỚC THAM SỐ
Bài toán đặt ra
Trong chương 1, chúng ta đã thảo luận về thiết kế bộ điều khiển phản hồi trạng thái tối ưu với thời gian tối ưu là vô hạn Để giải phương trình đại số Riccati, hệ thống cần biết trước các tham số cụ thể, bao gồm ma trận trạng thái A và ma trận đầu B Việc không xác định được hai ma trận A và B sẽ khiến cho các thuật toán cổ điển không thể được áp dụng hiệu quả.
Trong bối cảnh giả thiết các ma trận A và B của hệ 1.1 là hằng số nhưng chưa được xác định, đã có nhiều hướng nghiên cứu được triển khai để giải quyết vấn đề này Paul J Werbos đã có những đóng góp quan trọng liên quan đến học tăng cường và lập trình động gần đúng (RLADP) trong tài liệu [9] Bên cạnh đó, việc sử dụng nhận dạng để xác định các tham số hệ thống nhằm xây dựng bộ điều khiển tối ưu cũng đã được xem xét, tuy nhiên, do số lượng tham số lớn (như ma trận A và B), việc ước lượng trở nên không khả thi Chương này sẽ trình bày phương pháp xử lý vấn đề này.
Bài toán 2.1: Cho hệ tuyến tính tham số hằng (1.1) A và B là hai ma trận không biết trước
Hãy thiết kế luật điều khiển phản hồi trạng thái: u Kx
Sao cho hàm mục tiêu:
J x Qxu Ru dt Với các điều kiện cho trước:
- Q = Q T =ZZ T ma trận bán dương, R = R T xác định dương
- (A B) điều khiển được và (A, Z) quan sát được để đảm bảo nghiệm duy nhất ARE làm hệ ổn định
Gọi K * là ma trận phản hồi trạng thái tối ưu, theo công thức (1.9) K * phải thỏa mãn:
Việc không xác định các ma trận A và B khiến cho phương trình 2.1 không thể giải được Để khắc phục điều này, chúng ta áp dụng các tính chất của thuật toán Kleinman và đề xuất một phương pháp lặp nhằm tìm kiếm giá trị K*.
Thuật toán xử lý
Theo tài liệu [5], phương pháp đề xuất tập trung vào việc thiết kế một thuật toán truy hồi nhằm tính toán xấp xỉ nghiệm tối ưu trong một khoảng thời gian nhất định Hình 2.1 minh họa cấu trúc của thuật toán này, với giả định rằng tín hiệu điều khiển u và biến trạng thái x được đo một cách hoàn toàn chính xác.
3Hình 2.1: Cấu trúc triển khai thuật toán r: là tín hiệu đầu vào cho quá trình học
K0: là ma trận chọn trước sau cho hệ kín ban đầu ổn định
Chương 2: Điều khiển dự tối ưu cho hệ LTI không biết trước tham số
Kopt: là nghiệm tối ưu thuật toán tính ra được
Bộ điều khiển phản hồi K0 được chọn đầu tiên trong quá trình lặp dãy K = {K0, K1, } nhằm đảm bảo sự ổn định cho hệ thống Đồng thời, tín hiệu học r (hình 2.1) được sử dụng là tín hiệu ngẫu nhiên, giúp quá trình lặp hội tụ một cách hiệu quả Lý do cho sự lựa chọn này sẽ được làm rõ trong phần sau của bài viết.
Chia thời gian làm các khoảng thời gian không nhất thiết phải bằng nhau:
Trong mỗi khoảng thời gian ta thành lập hai dãy ma trận Pk và Kk thỏa mãn các tính chất của thuật toán Kleinman k k
Việc thiết lập dãy ma trận P k K k là cần thiết để đảm bảo hội tụ về nghiệm tối ưu của bài toán, như đã được chứng minh trong thuật toán Kleinman Giải pháp trực tiếp cho vấn đề này mang lại hiệu quả cao trong việc tìm kiếm nghiệm tối ưu.
Pk và Kk+1 là không thực hiện được do hai ma trận A B không biết trước Viết lại phương trình sai phân mô tả hệ thống:
Từ (2.1) đặt Q k Q K RK k T k A P k T k P A k k thay vào (2.3) ta có:
Từ phương trình (2.5) ta đưa ra kết luận:
- Phương trình (2.5) đúng với mọi k
Phương trình (2.5) mô tả mối quan hệ giữa Kk và Pk Kk+1 mà không cần biết các ma trận A, B Do đó, chúng ta có thể thiết lập công thức truy hồi để tính toán nghiệm tối ưu một cách hiệu quả.
Giải Kk+1 Pk theo phương trình (2.5) đảm bảo tính hội tụ theo thuật toán Kleinman, vì từ đẳng thức (2.3) và (2.5) có thể suy ra (2.1) và (2.2) Để giải phương trình (2.5), ta thay giá trị k = 1, 2, nhằm lập nên hệ phương trình Chúng ta định nghĩa ba phép toán sau:
Chương 2: Điều khiển dự tối ưu cho hệ LTI không biết trước tham số
- Vec tơ hóa ma trận: 1 ; ( ) [ 1 ] n
Vec A A Vec A A Vec ABC C A vec B
Do ma trận đối xứng cần biết 1 2 (n n1)phần tử nên toán tử vector hóa ma trận sẽ thừa các phần tử (nn) do đó cần toán tử trên
Từ định nghĩa trên ta có:
Từ (2.8) và (2.9) thay vào vec(2.5) ta có:
Lặp với k = 0,1,2…s ta ký hiệu :
Y M vec Q Để phương trình (2.12) có nghiệm duy nhất thì ma trận X k s phải có hạng bằng số cột tức ( ) 1 1
Rank X k n n mn Từ đó, một trong những điều kiện cần là số hàng của ma trận X k phải lớn hơn hoặc bằng số cột
Chương 2: Điều khiển dự tối ưu cho hệ LTI không biết trước tham số
Lúc đó nghiệm của phương trình (2.12) tính theo nghiệm sai lệch bình phương tối thiểu:
Trong thực tế, số khoảng thời gian s có thể được điều chỉnh nếu phương trình (2.12) không có nghiệm Cụ thể, s sẽ được tăng lên 1 đơn vị khi quá trình lặp không hội tụ, tức là Pk+1 > Pk hoặc khi phương trình (2.12) vô nghiệm Mặc dù lý thuyết cho phép chọn bất kỳ khoảng thời gian nào trong các khoảng như t0 t1, t1 t2, , ts-1 ts, nhưng trong thực tiễn, để đơn giản, các khoảng thời gian thường được chọn bằng nhau Ngoài điều kiện cần (2.13), việc thiết lập một điều kiện đủ cũng là cần thiết để xem xét tính (1).
Rank X k n n mn Bổ đề dưới đây cho ta điều kiện đủ:
Nếu tồn tại số nguyên dương s 0 sao cho Rank M x s 0 M u s 0 1 2 n n 1 mn thì với mọiss 0 thì ( ) 1 1 1
Rank M M Rank M M x xd x ud n n mn
Tương tự với ss 0 thì ta cũng có: Rank M x s M u s 1 2 n n 1 mn (B2)
26 Để chứng minh X k s có số hàng bằng số cột ta sẽ chứng minh phương trình s 0
X a k (B1) có duy nhất nghiệm tầm thường
0 2 n n mn a Giả sử (I) alà nghiệm khác không của phương trình (B2), phân tích thành:
P K P K aa a a a Tương ứng ta định nghĩa 2 ma trận Pa,Ka thỏa mãn: ˆ ,
Làm tương tự từ công thức (2.5) đến (2.13) ta dẫn đến:
Từ (B1) Rank M x s M u s 1 2 n n 1 mn bằng số cột,(B3) ta suy ra E = 0,
Thay vào (B4) và (B5) ta có:
Chương 2: Điều khiển dự tối ưu cho hệ LTI không biết trước tham số
Vì A k là ma trận bền (theo Kleinman 1968) dẫn đến phương trình lyapunov (B5) có nghiệm duy nhất P a 0suy ra K a 0dẫn đến giả sử (I) vô lý Vậy phương trình s 0
Ma trận X k chỉ có một nghiệm duy nhất a = 0, dẫn đến việc ma trận X k s có số hạng bằng số cột với mọi k thuộc tập số dương Trước khi phát triển thuật toán, tính chính xác của nó được khẳng định qua Định lý 2, trong đó nêu rõ rằng phép lặp (2.12) bắt đầu với K 0 thuộc m n × sẽ đảm bảo hệ ổn định Nếu thỏa mãn bổ đề 1, thì Pk và Kk sẽ hội tụ về giá trị tối ưu P * K *.
Do thỏa mãn bổ đề một, ma trận X k s có số hàng bằng số cột dẫn đến phương trình 2.12 sé có duy nhất một nghiệm
Thêm vào đó các phép biến đổi
P n n P và vec K( )điều là tương đương Phương trình 2.12 cho ra nghiệm duy nhất P K k , k 1
Phương trình (2.12) đúng với mọi k đo dó từ 2.12 ta có thể suy ra phương trình (2.11) do đó có phương trình (2.5) được thỏa mãn Từ phương trình (2.3) và (2.5) ta có:
Do phương trình 2.15 đúng với mọi k và x thuộc quỹ đạo trạng thái do đó bắt buộc:
Hai phương trình trên chính là phép lặp trong thuật toán Kleinman do vậy dãy
Pk và Kk tìm theo công thức (2.12) sẽ hội tụ về giá trị tối ưu Định lý được chứng minh
Thuật toán bao gồm các bước:
1, Đưa vào hệ thống u K x 0 r trong [t0 ts], ABK 0 bền (Nếu hệ ổn định không cần K0), e là tín hiệu ngẫu nhiên với kỳ vọng bằng 0 Đặt k = 0, s
Rank M M n n mn nếu đúng làm tiếp bước 4, nếu sai thay s = s +1 rồi chuyển lại về bước 2
4, Giải Pk và Kk+1 từ (2.12)
5, Kiểm tra điều kiện P k P k 1 nếu đúng chuyển tiếp bước 4, nếu sai đặt
6, Lấy u = - Kkx làm tín hiệu điều khiển và kết thúc thuật toán
Chương 2: Điều khiển dự tối ưu cho hệ LTI không biết trước tham số
4 Hình 2.2: Sơ đồ thuật toán
Giải Pk và Kk+1 từ k = k + 1
Thuật toán (2.12) lý thuyết sẽ cung cấp nghiệm tương đương với phương pháp của Kleinman khi hệ thống hoàn toàn tuyến tính, không bị ảnh hưởng bởi nhiễu và không có sai lệch trong quá trình tính toán.
Thuật toán này cho phép tính toán giá trị của bộ phản hồi trạng thái tối ưu LQR mà không cần biết trước các tham số của hệ thống, điều này đặc biệt hữu ích cho các hệ thống mất ổn định Tuy nhiên, việc áp dụng thuật toán cho hệ không ổn định với nhiều đầu vào đầu ra gặp khó khăn do kích thước ma trận K0 lớn Một điểm mạnh của thuật toán là khả năng áp dụng cả online và offline, tương tự như bộ tính toán, chỉ cần dữ liệu hệ thống là có thể tính toán được giá trị tối ưu.
Tín hiệu học u được xác định bởi công thức u = -Kx₀ + r, trong đó r là tín hiệu ngẫu nhiên với kỳ vọng bằng 0 Nếu u là một vector, các phần tử trong ma trận phải không tương quan với nhau.
Trong thực tế, không có hệ thống nào hoàn toàn tuyến tính và miễn nhiễm với nhiễu Nội dung của thuật toán 2 chưa phản ánh đầy đủ tính bền vững của hệ thống khi phải đối mặt với sai lệch mô hình và tác động của nhiễu Ở chương 4, chúng tôi sẽ áp dụng thuật toán đã phát triển vào một hệ thống cụ thể để kiểm tra tính chính xác của nó.
ĐIỀU KHIỂN DỰ BÁO MÔ HÌNH PHI TUYẾN
Điều khiển dự báo mô hình phi tuyến
3.1.1 Mô hình dự báo phi tuyến
Mô hình trạng thái miêu tả hệ phi tuyến:
Mô hình phi tuyến với vector trạng thái x(k) và các hàm g, f thỏa mãn điều kiện Lipschitz có thể được xây dựng từ hệ phương trình sai phân, áp dụng cho cả hệ thống đơn biến và đa biến Trong chương này, chúng ta chỉ tập trung vào hệ được mô tả bởi phương trình (3.1), loại mô hình này đã mở rộng đáng kể các nghiên cứu về hệ phi tuyến, đóng góp vào nhiều kết quả lý thuyết quan trọng, đặc biệt là trong lĩnh vực ổn định và vững mạnh Mặc dù mô hình dự báo phi tuyến mang lại kết quả chính xác hơn với thực tế, nhưng việc xây dựng các phép ước lượng biến trạng thái trở nên phức tạp hơn.
3.1.2 Ước lượng biến trạng thái
Khác với mô hình tuyến tính, mô hình phi tuyến không cho phép giải chính xác các giá trị của biến trạng thái tại một thời điểm cụ thể Do đó, cần thiết lập các bộ ước lượng để xấp xỉ các biến trạng thái của mô hình phi tuyến Việc sử dụng mô hình dự báo phi tuyến giúp xử lý nhiều hệ thống mà các phương pháp MPC truyền thống không thể áp dụng Trong lý thuyết ước lượng, bài toán tối ưu đóng vai trò quan trọng, ví dụ như trong Bộ lọc Kalman mở rộng (EKF) và Bộ dịch tầm ước lượng (MHE) Thiết kế các bộ lọc này thực chất là giải quyết các bài toán tối ưu đã được đề ra.
Trong đồ án này, chúng ta tìm hiểu phương pháp dịch tầm ước lượng (MHE) cho hệ thống (3.1) dự báo, nhấn mạnh những ưu điểm của nó trong điều khiển dự đoán (MPC) Khác với bộ lọc Kalman mở rộng (EKF), phương pháp này không yêu cầu giải theo đệ quy từ thời điểm 0 đến T Việc sử dụng phương pháp bình phương tối thiểu đòi hỏi tối ưu hóa tất cả các trạng thái trong quỹ đạo x T, dẫn đến bài toán tối ưu hóa trở nên phức tạp hơn khi thời gian T tăng lên MHE giải quyết vấn đề này bằng cách chỉ xem xét khoảng thời gian gần nhất và tìm ra N giá trị gần nhất của quỹ đạo trạng thái, với biến trạng thái ước lượng là x N (T) = {x T (-N), , x T}.
Dữ liệu hệ thống được xác định bởi chuỗi giá trị đầu vào \( \{ u_{T-N}, u_{T-N+1}, \ldots, u_{T} \} \) Giả định rằng \( T \geq N-1 \) để loại bỏ các chu kỳ ban đầu, giúp cửa sổ ước lượng luôn được điền đầy đủ với các phép đo.
Xét hệ được miêu tả bởi phương trình (3.1), bài toán đặt ra:
Giả sử chúng ta đo được các giá trị y N(T) và u N(T) hoặc ước lượng các giá trị x N(T) để hàm mục tiêu trong dịch tầm ước lượng đạt giá trị nhỏ nhất trong khoảng cửa sổ đang xét Hình 1.3 mô tả hoạt động của bộ MHE, trong đó cửa sổ ước lượng có độ dài N, cho phép ước lượng dãy các biến trạng thái tại thời điểm t-1.
Chương 3: Điều khiển dự báo mô hình phi tuyến
Trong đó hàm mục tiêu là:
Hàm mục tiêu ước lượng dịch tầm dự báo chỉ sử dụng dữ liệu từ thời điểm T - N đến T, không xét toàn bộ thông tin như hàm bình phương tối thiểu từ 0 đến T Khác với bộ lọc Kalman mở rộng, MHE đảm bảo tính ổn định địa phương cho bộ ước lượng mà không cần sử dụng tuyến tính hóa.
Trong một số bài toán không chú trọng đến đầu ra, mọi biến trạng thái có thể được đo lường, tuy nhiên hệ thống vẫn chịu ảnh hưởng từ nhiễu Do đó, cần ước lượng giá trị trạng thái tiếp theo của hệ thống là xˆ k 1| k, biến đổi bài toán thành một nhiệm vụ mới.
Nghiệm của bài toán tối ưu (3.2) là các giá trị ước lượng xˆ j T | j T N T tại thời điểm T, với các giá trị đo được x u j j trong khoảng (T-N, T) Ràng buộc x ˆ j T | f x ˆ j 1| T , u j 1 có thể được viết lại thành G x ˆ , N T | u N 0, nhằm đưa về dạng ràng buộc phương trình tổng quát Để giải bài toán (3.2), chúng ta áp dụng phương pháp nhân tử Lagrange.
1, Khởi tạo mô hình ước lượng x ˆ k 1 f x u ˆ , k k
2, Đo các giá trị vào – biến trạng thái: x N k | x k , , x k N u N k | u k , , u k N
3, Giải bài toán tối ưu (3.2) với x ˆ N k | x ˆ k k | , , x ˆ k N k | là biến số
4, Cho k=k+1 rồi quay lại bước 2
3.1.3 Áp dụng MHE vào NMPC step MHE NMPC k-1
6 Bảng 3.2: Vai trò MHE trong NMPC
Bảng 3.2 bộ MHE ước lượng giá trị trong tương lai, từ đó bộ NMPC sẽ cung cấp tín hiệu điều khiển dựa trên bài toán tối ưu nhằm giảm thiểu sai lệch giữa giá trị đặt và giá trị ước lượng, với hàm mục tiêu được xác định rõ ràng.
Trong đó: Ny là tầm dự báo
Điều khiển dự báo mô hình bền vững
Do tín hiệu phản hồi của bộ điều khiển MPC khá phức tạp, việc lý tưởng hóa MPC trở thành một lựa chọn tự nhiên Trước khi đi vào chi tiết, có một số điểm quan trọng cần lưu ý.
MPC sử dụng hàm giá trị trong điều khiển tối ưu tham số, thường là liên tục, mặc dù điều này không phải là điều kiện cần thiết nếu biến trạng thái hoặc ràng buộc hai phía đã được xác định Dù hàm giá trị có thể liên tục, bộ điều khiển tương ứng có thể không liên tục, chẳng hạn như khi nghiệm tối ưu không đơn nhất.
Chương 3: Điều khiển dự báo mô hình phi tuyến
Bộ điều khiển có khả năng ổn định hệ thống, nhưng cần lưu ý rằng những bất ổn định bền vững và nhiễu ngẫu nhiên, dù nhỏ, vẫn có thể gây ra mất ổn định Teel (2004) đã chỉ ra rằng điều này xảy ra trong hệ không liên tục dừng khi n = 2 và x = (x1, x2).
Nếu giá trị đầu là x 1,1 , thì 1; x 0, 2 và 2; x 0,0 , cũng tương tự cho những giá trị đầu khác Ta có, với mọi nghiệm thỏa mãn
là một hàm , do đó hệ là ổn định tiệm cận Bây giờ hãy xét hệ thống khi bị ảnh hưởng bởi nhiễu: x x
Khi có một hằng số nhiễu 0, giá trị x1 sẽ hoàn toàn dương Nếu giá trị khởi đầu là x (1,1), thì xk1 sẽ trở thành với k 1, và xk2 sẽ lớn hơn 2 + k, tiến tới vô cùng, bất kể giá trị của và là nhỏ Vì vậy, hệ thống sẽ không ổn định khi có sự xuất hiện của nhiễu, dù chỉ là nhỏ và ngẫu nhiên.
Mặc dù ví dụ trên có thể không hoàn toàn tự nhiên, Teel (2004) đã chỉ ra rằng nó có thể xảy ra trong điều kiện điều khiển tối ưu nhằm giảm thiểu độ chính xác của dự báo đối với hệ thống liên tục Hãy xem xét hệ thống sau đây:
Với tín hiệu điều khiển u chịu ràng buộc thuộc miền U = [-1, 1], chúng ta chọn tầm dự báo N = 2 và xác định Xf là miền gốc Nếu x1 ≠ 0, trình tự điều khiển duy nhất có thể đưa x về 0 trong hai bước là u = {1, 0} Kết quả thu được là chuỗi các trạng thái tương ứng.
Do chỉ có cách điều khiển phù hợp, nghiệm tối ưu được xác định là 2 x 1 với mọi x thỏa mãn x 1 0 Nếu x 1 0, chỉ tồn tại duy nhất một nghiệm u 0,0 và 2 x 0 Kết quả là vòng kín của hệ thỏa mãn.
trong đó K 2 x 1 nếu x 1 0 và K 2 x 0 trong các trường hợp còn lại
Hệ thống x + f(x) là một hệ không liên tục đã được phân tích Do đó, việc điều khiển tối ưu nhằm giảm tầm dự báo cho hệ liên tục dẫn đến kết quả là hệ không liên tục ổn định, tiệm cận những trạng thái không bền vững.
3.2.1 Điều kiện ổn đinh MPC bền vững cho hệ bất định tham số
Giả sử hệ thống được mô tả bởi phương trình x + f(x) = 0, trong đó f(x) không nhất thiết phải liên tục Khi hệ thống bị nhiễu, nó có thể được mô tả bằng phương trình x + f(x + e) = w, với e là chuỗi nhiễu loạn Ta định nghĩa Sδ(x) là tập hợp nghiệm cho hệ thống khi bị nhiễu, với giá trị trạng thái ban đầu là x và chuỗi nhiễu e = {e(0), e(1), e(2), } cùng với w = {w(0), w(1), w(2), }.
max e , w , trong đó với mọi chuỗi v, v được hiểu là chuẩn sup,
Theo định nghĩa của tính bền vững (Teel 2004), ổn định toàn cục tiệm cận bền (GAS) được xác định trong một tập hợp compact Cụ thể, với d(x, a) = min{a - x | a ∈ A} và x = d(x, a), một tập được coi là bền vững GAS cho hàm f(x) nếu tồn tại một hàm lớp β(•) sao cho với mỗi ε > 0 và mỗi tập compact C, luôn tồn tại δ > 0 để thỏa mãn điều kiện x ∈ C và mọi φ ∈ Sδ(x).
Chương 3: Điều khiển dự báo mô hình phi tuyến
Khi xem xét tập hợp chỉ bao gồm điểm gốc x = x, nếu điểm gốc ổn định tiệm cận bền đối với phương trình x' = f(x), thì với mỗi ε > 0, luôn tồn tại δ > 0 sao cho mọi quỹ đạo nhiễu của hệ thống x' = f(x + e) + w với max{e, w} ≤ δ đều hội tụ về ε (hình cầu đơn vị đóng) Đây là một tính chất quan trọng Nếu trạng thái ban đầu thỏa mãn x ≤ β(ε - 1), thì có thể chứng minh rằng φ(k) ≤ β(β(ε - 1), 0) + ε^2 cho mọi k thuộc £ và cho mọi φ ≥ 0 thuộc Sδ.
Ta quay lại với câu hỏi ban đầu: cần điều kiện gì để hệ ổn định tiệm cận bền?
Mệnh đề 3.2 (Hàm Lyapunov và GAS bền vững) Giả sử là tập compact và
f có lân cận bị chặn Tập là ổn định toàn cục tiệm cận bền cho hệ x f x khi và chỉ khi hệ tồn tại một hàm Lyapunov toàn cục cho
Hệ thống x + f(x) = 0 được coi là ổn định Lyapunov toàn cục nếu tồn tại hai hàm α1(·) và α2(·), cùng với một hàm liên tục dương ρ(·), thỏa mãn điều kiện ổn định cho mọi x thuộc R^n.
Trong điều khiển tối ưu theo MPC, việc tính toán trực tiếp hàm Lyapunov gặp nhiều khó khăn, đặc biệt trong trường hợp sổ hữu hạn Đối với các hệ tuyến tính với nhiều ràng buộc, hàm giá trị thường là liên tục Mệnh đề 3.2 đã đưa ra điều kiện ổn định bền phù hợp hơn, vì vùng quan tâm có thể không phải là toàn cục.
Kết quả này có khả năng áp dụng hạn chế, chỉ phù hợp với các hệ thống có nhiễu xác định rõ với 0 Trong phần tiếp theo, chúng ta sẽ trình bày phương pháp ước lượng cho một hệ bất định có nhiễu bị giới hạn.
Mệnh đề 3.2 [4] chỉ ra rằng tính ổn định bền của hệ x + f(x) được xác định bởi sự tồn tại của một hàm Lyapunov Điều này có nghĩa là sự ổn định bền là yếu tố quyết định cho sự ổn định của hệ thống.
38 liên tục cho hệ thống Mệnh đề thay thế sau đề cập đến tính ổn định bền của cho hệ x f x (Teel, 2004)
Mệnh đề 3.3 [4] : (Robust GAS and regularization) Giả sử rằng là compact và
f có lân cận bị chặn Tập là GAS bền cho hệ x f x khi và chỉ khi là ổn định toàn cục tiệm cận cho x F x , hợp thức của x f x
3.2.2 Ổn định vào-trạng thái
Điều khiển dự báo mô hình phân tán
3.3.1 Giới thiệu về điều khiển dự báo mô hình phân tán
7Hình 3.3: Sơ đồ điều khiển phi tập trung
Phương pháp điều khiển dự báo tựa mô hình (MPC) mang lại nhiều ưu điểm nổi bật trong việc tối ưu hóa hệ thống đa biến và xử lý các ràng buộc, điều này đã khiến nó trở thành công nghệ điều khiển phổ biến trong nhiều nhà máy sản xuất.
Trong các hệ thống quy mô lớn, việc sử dụng bộ điều khiển MPC tập trung không phù hợp do yêu cầu xử lý khối lượng tính toán lớn khi số lượng biến vào/ra tăng Sử dụng một bộ điều khiển duy nhất cho toàn bộ hệ thống gây ra sự không linh hoạt, khó khăn trong vận hành và bảo trì Hơn nữa, việc phụ thuộc vào một bộ điều khiển cho hệ thống có hàng trăm đầu vào/ra là không hợp lý, vì sự cố ở một vòng có thể ảnh hưởng đến toàn bộ hệ thống.
Một giải pháp hiệu quả cho tình huống này là áp dụng các bộ điều khiển dự báo phi tập trung cho từng đối tượng con (DMPC) Phương pháp này cho phép chia nhỏ toàn bộ hệ thống lớn thành nhiều hệ thống con liên kết với nhau, được quản lý bởi một cấu trúc điều khiển phân tán Mỗi hệ thống con sẽ hoạt động độc lập nhưng vẫn duy trì sự liên kết với các hệ thống khác.
Chương 3: Điều khiển dự báo mô hình phi tuyến
Hệ thống 43 con được điều khiển bởi các bộ điều khiển khu vực, cho phép liên kết và trao đổi thông tin giữa chúng Khi các bộ điều khiển khu vực áp dụng giải thuật điều khiển dự báo, hệ thống lớn này được gọi là điều khiển dự báo phi tập trung Mũi tên gạch chấm biểu thị sự trao đổi thông tin giữa các bộ điều khiển, tuy nhiên, trong đề tài này, chúng ta sẽ tập trung vào việc các bộ MPC không tương tác với nhau.
Trong hệ thống điều khiển dự báo phi tập trung, các bộ điều khiển dự báo khu vực liên kết với nhau qua mạng lưới để trao đổi thông tin Ảnh hưởng của các bộ điều khiển khác đến dự báo của bộ điều khiển đang xem xét được xem như một quá trình truyền thẳng.
3.3.2 Cở sở toán học cho điều khiển dự báo phân tán
Cho hệ MIMO mô tả bởi phương trình trạng thái gián đoạn tuyến tính:
Trong bài viết này, chúng ta sẽ xây dựng bộ Điều khiển Dự đoán Mơ hồ (DMPC) cho hệ thống, với các biến trạng thái đặt (x(k) ∈ n), biến trạng thái thực (u(k) ∈ q) và biến đầu vào tại thời điểm k Mục tiêu của bộ DMPC sẽ được xác định thông qua hàm mục tiêu cụ thể.
Hệ thống được mô hình hóa theo phương trình (3.8) sử dụng nhiều bộ điều khiển cục bộ phi tập trung, được thiết kế và điều chỉnh độc lập cho từng hệ con.
Mỗi bộ điều khiển cục bộ đảm nhiệm việc điều khiển một phần của hệ thống, được gọi là hệ con thứ i, với động học được mô tả qua phương trình cụ thể.
Ma trận A ii và B ii mô tả động học của hệ con thứ i, với i từ 1 đến N Để đảm bảo khả năng điều khiển, chúng ta giả định rằng các cặp ma trận (A ii, B ii) là điều khiển được, tức là chúng thỏa mãn tiêu chuẩn Kalman Phần còn lại của phương trình (2) thể hiện ảnh hưởng của biến trạng thái và biến đầu vào của hệ con thứ j lên hệ con thứ i.
j i Tổng số biến trạng thái và biến đầu vào của cả hệ thống lớn lần lượt là
Trong bài toán điều khiển phi tập trung này ta giả định rằng:
- Tầm dự báo Ny và tầm điều khiển Nu là bằng nhau cho tất cả các hệ con, với
- Chu kì điều khiển là giống nhau chung cho các hệ con
- Các bộ điều khiển MPC phi tập trung có khả năng ổn định toàn bộ quá trình
- Các tín hiệu x, u đều đo được hoàn toàn
Dựa trên các giả thiết, giá trị của các biến trạng thái được dự báo bởi bộ điều khiển MPC phi tập trung với tầm dự báo Hp và tầm điều khiển Hu được xác định thông qua phương trình.
Chương 3: Điều khiển dự báo mô hình phi tuyến
Hệ số i cho thấy rằng các biến trạng thái của hệ con j tại thời điểm k chỉ ảnh hưởng đến hệ con i tại cùng thời điểm k, mà không tác động đến các biến trạng thái dự báo trong tương lai.
Trong mô hình dự báo (3.11), chỉ có thành phần u k ˆ i l k | mà không có dạng u k ˆ i l k | Do đó, cần phân tích thành phần u k ˆ i l k | để chuyển đổi về dạng u k ˆ i l k | , nhằm áp dụng trong hàm mục tiêu của hệ thống MPC cục bộ.
Ta phân tích như sau:
ˆ i 1| ˆ i 1| ˆ i | 1 u k k u k k u k k u k Làm tương tự đến k N y 1| k ta có:
Ở ngoài tầm điều khiển (N u l N y 1) thì u k ˆ i l k | 0
Như vậy, với các phân tích trên, thành phần u k ˆ i l k | trong phương trình (3.11) có thể được viết lại như sau:
(3.12) Đặt X k i và U k i là vecto biến trạng thái và chênh lệch điều khiển được dự báo tại thời điểm k:
Thay (3.13) và (3.12) vào phương trình (3.11) ta có:
Chương 3: Điều khiển dự báo mô hình phi tuyến
Từ phương trình (3.7), nghiệm Z k i P g ii 1 i đại diện cho kết quả dự báo của mô hình đã chọn Dựa vào hàm mục tiêu (3.2), chúng ta có thể xác định kết quả u i * k Bằng cách thay k = k + 1, chúng ta sẽ tạo ra một dãy các tín hiệu điều khiển tối ưu.
MÔ PHỎNG KIỂM CHỨNG
Mô hình con lắc ngược
Trong phần này, chúng ta sẽ xây dựng một mô hình phi tuyến cho con lắc ngược, bao gồm hai phần: xe và con lắc, với trọng lực tác động vào tâm của mỗi phần Sau đó, bằng phương pháp tuyến tính hóa xung quanh điểm cân bằng, chúng ta sẽ thu được mô hình tuyến tính để áp dụng trong thuật toán ở chương 2 Cấu trúc và ký hiệu được minh họa trong hình vẽ.
8Hình 4.1: Hình vẽ con lắc ngược
Hệ phương trình vi phân mô tả con lắc ngược:
Chương 4: Mô phỏng kiểm chứng
M : Khối lượng của xe m : Khối lượng của con lắc ngược
: Chiều dài của con lắc
Góc giữa con lắc và trục thẳng đứng ảnh hưởng đến chuyển động của hệ thống, trong khi gia tốc trọng trường g, hệ số ma sát lăn b giữa xe và mặt đất, cùng với hệ số ma sát động c giữa con lắc và xe đều đóng vai trò quan trọng trong việc xác định hiệu suất và ổn định của chuyển động.
Phương trình dạng tổng quát:
Tuyến tính hóa xung quanh điểm cân bằng tại:
Thay vào phương trình ta có
Mô hình trạng thái tuyến tính hóa xung quanh điểm cân bằng của con lắc ngược:
Chương 4: Mô phỏng kiểm chứng
Cài đặt thuật toán chương 2 cho hệ con lắc ngược
Trước khi đi vào cặt đặt thuật toán ta có vài nhận xét:
- Mô hình xấp xỉ tuyến tính (4.1) không ổn định do đó phải khởi tạo ma trận K0 để ABK 0 bền
Tín hiệu điều khiển F được xác định bởi công thức F = -K0[qT qT]T + r trong khoảng thời gian [t0, ts], với r là tín hiệu ngẫu nhiên Mô hình này chỉ áp dụng khi góc lệch θ0 có giá trị nhỏ, vì vậy tín hiệu r cần được chọn sao cho góc lệch θ0 không vượt quá ±5 độ.
Trển khai thuật toán với bộ thông số như sau:
L = 0.5; g = 9.8; b = 0.1; c = 0.1; x0 = 0; theta0 = 0; Trạng thái đầu của con lắc n m
Kết quả ma trận A, B và nghiệm tối ưu theo lý thuyết K * P *
K0 1 30 1 3 A – BK0 là ma trận bền
Các bước chạy của thuật toán:
Chương 4: Mô phỏng kiểm chứng
Kết quả cho thấy tại bước lặp P6, nghiệm P* đã được xấp xỉ, dẫn đến Kk tiến về K* theo yêu cầu của thuật toán Mô phỏng một lần nữa khẳng định độ chính xác của thuật toán (2.2) Hình 4.2 minh họa đáp ứng của hệ thống khi chịu ảnh hưởng của nhiễu ngẫu nhiên trước và sau khi cập nhật tín hiệu điều khiển tối ưu, cho thấy đặc tính của hệ thống được cải thiện với ít dao động và biên độ dao động giảm.
9Hình 4.2: Đồ thị góc giữa con lắc với trục thẳng đứng
Mô hình xe kéo
Hệ xe kéo bao gồm một Tractor và một Trailer thụ động, trong đó Tractor được điều khiển trực tiếp và Trailer hoàn toàn phụ thuộc vào lực kéo từ Tractor Hình 2.1 mô tả cấu trúc của hệ xe kéo này.
Xe kéo (Tractor) có hai bánh xe gắn trên trục với hai thiết bị truyền động độc lập và một bánh xe tự do, giúp xe cân bằng và di chuyển đa hướng Hướng di chuyển được điều chỉnh bằng cách thay đổi vận tốc góc tương đối giữa các bánh xe Trong khi đó, rơ moóc (Trailer) cũng có hai bánh xe và một bánh cân bằng, với tất cả các bánh đều hoạt động thụ động Chuyển động của rơ moóc hoàn toàn phụ thuộc vào xe kéo thông qua khớp nối tại điểm Q.
10Hình 4.3: Cơ cấu hệ xe kéo
P 0 , P 1 Trung điểm hai bánh xe của hai xe, và được quy ước là tọa độ của xe
C 0 , C 1 Trọng tâm của hai xe d 0 , d 1 Khoảng cách từ P0 và P1 tới khớp nối Q a 0 , a 1 Khoảng cách từ P0, P1 lần lượt tới C0 và C1 r Bán kính bốn bánh xe
2b Khoảng cách giữa hai bánh Tractor m 0 , m 1 Trọng lượng của Tractor và Trailer
I 0 , I 1 Mômen quán tính của hai xe qua trọng tâm của xe
11Bảng 4.4: Ký hiệu tham số của hệ xe kéo
Chương 4: Mô phỏng kiểm chứng
Trong đồ án nghiên cứu hệ xe kéo, ta có Q P 0 với d 0 0 và ký hiệu d d 1 Trọng tâm của Tractor và Trailer được ký hiệu là C C 0, 1, trong khi P 1 ( , )x y là gốc tọa độ gắn vào Trailer Các biến của hệ thống được xác định rõ ràng trong nghiên cứu này.
- Biến cần điều khiển: Tọa độ x y, của Trailer
- Biến điều khiển: Mômen r , l cấp cho hai bánh của Tractor
- Các biến trạng thái: vận tốc dài u 1 của Trailer, tốc độ góc u 2 và góc quay 0 của của Tractor …
- Hệ được thiết kế dựa trên sách lược điều khiển tầng, vì vậy mô hình đối tượng được xác định:
- Vòng ngoài: đầu vào là vector vận tốc u u 1 u 2 T
- Vòng trong: đầu vào là mômen cấp cho hai bánh Tractor, đầu ra là vector vận tốc u
12Hình 4.5: Mô hình đối tượng xe kéo
Mô hình vòng ngoài (vòng động học)
Giả sử rằng các bánh xe lăn mà không bị trượt, ta có thể thấy rằng vector vận tốc của từng xe tại điểm P0 và P1 đều song song với phương chuyển động của xe, từ đó tạo ra một ràng buộc quan trọng trong hệ thống.
Trong đó x,y là vận tốc của Trailer,
P 0 y là vận tốc của Tractor theo 2 trục Ox và Oy của hệ trục tọa độ gốc
Thay vào phương trình (4.3) ta được
( sin sin sin ) ( cos cos cos ) 0 sin cos cos( ) 0 x d y d x y d (4.5)
Từ (4.2) ta có được ràng buộc về quỹ đạo của hệ xe kéo:
(4.7) được gọi là ma trận ràng buộc Ràng buộc này thuộc loại ràng buộc non – holonomic (không tích phân được)
Trở về công việc mô hình hóa, do ràng buộc (4.2), ta có được các phương trình:
Kết hợp các phương trình trên, ta xác định được mô hình vòng ngoài của hệ với các biến trạng thái x y, , , 1 0 :
Chương 4: Mô phỏng kiểm chứng
Trong đó u 1 và u 2 chính là đầu vào của hệ Như vậy hệ (4.10) được coi là hụt cơ cấu chấp hành
Vòng động lực học mô tả mối quan hệ giữa các lực tác dụng và quỹ đạo của biến khớp, đặc biệt trong hệ xe kéo với nhiều lực liên kết không sinh công Việc phân tích theo các định luật Newton gặp khó khăn, do đó, mô hình Euler – Lagrange thường được áp dụng để giải quyết vấn đề này.
M q qC q q qB q B q A q (4.11) Với điều kiện ràng buộc non-holonomic ở phương trình (4.2) Trong đó:
- r l T là vector mômen cấp đầu vào
- d dr dl T là vector thể hiện thành phần nhiễu bất định bị chặn
- M q( ) 4 4 là ma trận quán tính đối xứng, xác định dương
- C q q( , ) 4 4 là ma trận thể hiện thành phần mômen nhớt và lực hướng tâm
- B q( )R 4 2 là ma trận chuyển đổi đầu vào
- R 2 1 là tích số ràng buộc Lagrange Giá trị A q T ( ) là vector lực ràng buộc ảnh hưởng từ mặt đất tiếp xúc tới bánh xe
Các ma trận trong công thức (2.1) được xác định:
( ) sin( ) cos( ) cos( ) sin( ) cos( ) cos( )
Phương trình (4.10) có thể viết gọn lại thành:
S d Đạo hàm phương theo thời gian ta được:
Thay vào phương trình (4.2) đồng thời nhân hai vế với S T để loại bỏ thành phần
khó đo đạc trong thực tế, phương trình động lực học của hệ sẽ chuyển về dạng:
Phương trình (4.12) mô tả mô hình gia tốc cho hệ xe kéo, trong đó đạo hàm của u theo thời gian thể hiện gia tốc dài của xe tractor và gia tốc góc của trailer.
Chương 4: Mô phỏng kiểm chứng