ĐIỀU KHIỂN PHẢN HỒI TRẠNG THÁI CHO HỆ PHI TUYẾN VỚI PHƯƠNG TRÌNH RICCATI PHỤ THUỘC BIẾN TRẠNG THÁI

TỔNG QUAN VỀ CÁC BÀI TOÁN TỐI ƯU

Vài nét về lịch sử phát triển phương pháp tối ưu

Phương pháp tối ưu hệ thống đã được nghiên cứu và trình bày trong nhiều tài liệu từ những năm 60 của thế kỷ 20, đặc biệt trong lĩnh vực quản lý tài nguyên nước Các mô hình tối ưu được sử dụng để mô phỏng hệ thống có thể được phân loại thành nhiều dạng, bao gồm tối ưu tuyến tính, tối ưu mạng, tối ưu động, tối ưu biến số nguyên/biến gián đoạn và tối ưu phi tuyến Ngoài ra, các lý thuyết như lý thuyết trò chơi, lý thuyết chuỗi Markov, lý thuyết xếp hàng và lý thuyết quản lý hàng hóa tồn kho cũng đóng vai trò quan trọng trong việc phát triển và ứng dụng các phương pháp tối ưu này.

Hai phương pháp tối ưu phổ biến nhất hiện nay là tối ưu tuyến tính và tối ưu động (Yakowits, 1982), với nhiều ứng dụng cụ thể đã được ghi chép và xuất bản Tối ưu tuyến tính, được chú ý từ giai đoạn khởi đầu, đã được coi là một trong những tiến bộ quan trọng nhất của thế kỷ 20, đặc biệt với những bước tiến nổi bật từ những năm 50 Lý thuyết tối ưu tuyến tính đã góp phần quan trọng vào sự phát triển kinh tế toàn cầu và vẫn tiếp tục mở rộng ứng dụng trong các ngành kinh tế.

Lý thuyết tuyến tính giúp mô tả bài toán tối ưu với ràng buộc và hàm mục tiêu tuyến tính, trong khi tối ưu động yêu cầu phân đoạn các quá trình tối ưu thành nhiều giai đoạn, với mỗi giai đoạn có các trạng thái tối ưu riêng biệt Một số ứng dụng của tối ưu động bao gồm nghiên cứu của Young về vận hành hồ chứa (1967) và nghiên cứu hệ thống liên hồ chứa cho lưu vực sông Gunpowder River, Baltimore, Mỹ (Karamouz et al., 1992) Tối ưu động, hay quy hoạch động, là một trong những phương pháp tối ưu quan trọng trong nhiều lĩnh vực.

Page 5 ưu được tập trung chú ý trong nhiều tài liệu nghiên cứu Tối ưu động cung cấp một kỹ thuật có tính hệ thống để xác định tối ưu cho tập hợp các hành động cho một quá trình (các giai đoạn) với trạng thái khác nhau Cùng với tối ưu tuyến tinh thì tối ưu động cũng được giới thiệu rộng rãi trong các chương trình giảng dạy các bậc đại học và trên đại học cùng với các ví dụ ứng dụng sinh động Tuy vậy thực tế ứng dụng cho thấy khi hệ thống nghiên cứu phức tạp việc ứng dụng hai loại tối ưu nêu trên, đặc biệt là tối ưu động, sẽ bất lợi – khó mô tả hệ thống thực.

Sơ lược những phương pháp giải bài toán điều khiển tối ưu

Tối ưu phi tuyến là một khía cạnh đặc biệt quan trọng trong tối ưu hóa, vì nhiều hệ thống thực tế không thể được mô tả bằng các hàm tuyến tính như giả thuyết của tối ưu tuyến tính yêu cầu Hầu hết các bài toán thực tiễn liên quan đến hiện tượng tự nhiên đều mang tính phi tuyến, dẫn đến việc các bài toán tối ưu thường cần phải được mô tả dưới dạng phi tuyến để phản ánh chính xác sự phức tạp của chúng.

Để giải quyết các bài toán điều khiển tối ưu, việc áp dụng các phương pháp số là cần thiết Trong giai đoạn đầu của lĩnh vực điều khiển tối ưu, từ những năm 1950 đến 1980, các phương pháp gián tiếp được ưa chuộng để tiếp cận các bài toán này.

Những phương pháp gián tiếp

Bài toán điều khiển tối ưu có thể được giải quyết thông qua nguyên lý cực đại Pontryagin, cung cấp các điều kiện cần thiết, hoặc bằng cách giải phương trình Hamilton.

Phương pháp Jacobi – Bellman thuộc nhóm phương pháp gián tiếp, được áp dụng cho các bài toán biên trị với bước nhảy và chuyển trạng thái khó giải do bán kính hội tụ địa phương nhỏ Việc xác định điều kiện tối ưu cho bài toán thường phức tạp và đòi hỏi kiến thức vững về giải tích Ngoài ra, các phương pháp này thường tốn thời gian, và nhiều bài toán tối ưu động không thể giải quyết bằng cách thông thường.

Page 6 tích, chẳng hạn khi tồn tại các ràng buộc về quỹ đạo với các biến điều khiển hoặc các biến trạng thái

Những phương pháp trực tiếp

Phương pháp Collocation là một phương pháp trực tiếp hữu ích trong việc giải bài toán tối ưu động, cho phép rời rạc hóa vấn đề dựa trên phương pháp phần tử hữu hạn Phương pháp này thường dễ thực hiện và tiết kiệm thời gian, không yêu cầu người thực hiện phải có kiến thức sâu về giải tích Sau khi rời rạc hóa, bài toán tối ưu phi tuyến hữu hạn có thể được giải quyết bằng các thuật toán quy hoạch phi tuyến hiện có, mang lại bán kính hội tụ địa phương rộng.

Phương pháp trực tiếp trong tối ưu động giúp chuyển đổi bài toán thành dạng rời rạc và tối ưu phi tuyến Một số kỹ thuật phổ biến để rời rạc hóa các phương trình vi phân bao gồm các thuật toán như Euler, hình thang và Runge-Kutta Các phương pháp này thực hiện bằng cách xác định một lưới các điểm N trong khoảng thời gian từ t0 đến tf, với t0 = t1 < t2.

Các phương pháp trực tiếp, chủ yếu là các phương pháp số, được chia thành hai nhóm: phương pháp giải Theo dãy (Sequential) và phương pháp giải Đồng thời (Simultaneous) Trong phương pháp giải Theo dãy, các biến điều khiển được rời rạc hóa thành một tập hữu hạn, từ đó bài toán tối ưu được thực hiện trên không gian với tập biến điều khiển này Vì vậy, các phương pháp này thường được gọi là các phương pháp rời rạc hóa các biến điều khiển.

Phương pháp giải Đồng thời chuyển đổi bài toán điều khiển tối ưu thành bài toán tối ưu phi tuyến hữu hạn thông qua việc rời rạc hóa toàn bộ tín hiệu điều khiển và trạng thái, vì vậy nó được xem là phương pháp rời rạc hóa đầy đủ Nhờ vào những ưu điểm vượt trội so với các phương pháp trước, nhóm phương pháp tối ưu đồng thời trực tiếp đã được áp dụng rộng rãi trong các bài toán điều khiển tối ưu hiện đại.

Người ta cũng đã áp dụng những phương pháp số được coi là khá hiệu quả để

Page 7 giải quyết bài toán quy hoạch phi tuyến với các ràng buộc, chẳng hạn như Quy hoạch toàn phương liên tiếp với Tập tích cực (Active-Set SQP), phương pháp Điểm trong

Các phương pháp trực tiếp trong quy hoạch phi tuyến đã đạt được hiệu quả cao trong việc giải quyết các bài toán liên quan đến ràng buộc quỹ đạo.

Kết luận chương 1

Hiện tại, chưa có phương pháp giải chung nào cho tất cả các bài toán tối ưu phi tuyến Tuy nhiên, các giải pháp cho bài toán phi tuyến đang được cải tiến liên tục nhờ vào việc phát triển và áp dụng một số giả thuyết cho các bài toán tối ưu phi tuyến phổ biến.

ĐIỀU KHIỂN TỐI ƯU

Chất lượng tối ưu

2.1.1 Đặc điểm của bài toán tối ưu

Điều khiển tối ưu là một lĩnh vực quan trọng trong điều khiển tự động, đóng vai trò xác định và thiết lập các quy tắc điều khiển cho hệ thống Mục tiêu của nó là giúp hệ thống đạt được hiệu quả theo các tiêu chí đã được xác định trước, được biểu diễn dưới dạng hàm mục tiêu Q.

Tối ưu hóa đóng vai trò quan trọng trong đời sống, kinh tế và khoa học công nghệ Hai lĩnh vực chính của tối ưu hóa là tối ưu tĩnh và tối ưu động, có mối liên hệ chặt chẽ với nhau.

Tối ưu tĩnh và tối ưu động là hai khái niệm quan trọng trong toán học Tối ưu tĩnh liên quan đến các bài toán tối ưu trong không gian thực hữu hạn chiều R n, xuất phát từ không gian chuẩn Euclide Ngược lại, tối ưu động đề cập đến các bài toán tối ưu trong không gian hàm vô số chiều Do đó, tối ưu động có thể được coi là một trường hợp mở rộng của tối ưu tĩnh trong thực tế.

Trong thực tế tồn tại các bài toán điều khiển tối ưu sau:

- Bài toán tối ưu cực tiểu:

Để tối ưu hóa mô hình, cần xác định các tham số sao cho bình phương sai lệch trung bình giữa mô hình và đối tượng đạt giá trị thấp nhất Điều này rất quan trọng trong các ứng dụng như huấn luyện mạng nơron và nhận dạng đối tượng.

+ Điều khiển một quá trình đạt chỉ tiêu chất lượng, kỹ thuật cho trước sao cho tổn hao năng lượng là nhỏ nhất

+ Tạo ra một sản phẩm đạt chỉ tiêu chất lượng cho trước nhưng chi phí là nhỏ nhất

+ Bài toán tìm đường đi ngắn nhất giữa hai điểm bất kỳ, ví dụ như xác định quỹ đạo chuyển động của cánh tay robot, đường đi đưa thư,

- Bài toán tối ưu cực đại

Để tạo ra sản phẩm với chi phí cố định nhưng đảm bảo chất lượng tối ưu, ví dụ như trong việc tính toán động cơ tên lửa, tiêu chí chất lượng được xác định là khả năng vượt qua khoảng cách lớn nhất với lượng nhiên liệu đã được cung cấp.

+ Bài toán tìm đường căng

- Bài toán tối ưu tác động nhanh: Thời gian xảy ra quá trình là ngắn nhất, ví dụ như điều khiển tên lửa

Để thiết lập một bài toán tối ưu, điều kiện tiên quyết là hệ thống phải có đặc tính phi tuyến và tồn tại cực trị.

Bước quan trọng trong việc thành lập một hệ tối ưu là xác định chỉ tiêu chất lượng

J Nhiệm vụ cơ bản ở đây là bảo đảm cực trị của chỉ tiêu chất lượng J Hàm mục tiêu này có thể là lợi nhuận, thời gian, năng lượng, hoặc bất kì một đại lượng nào hoặc tổng hợp của một số đại lượng mà được đại diện bằng một giá trị vô hướng duy nhất Như khi xây dựng hệ tối ưu tác động nhanh thì yêu cầu đối với hệ là nhanh chóng chuyển từ trạng thái này sang trạng thái khác với thời gian quá độ nhỏ nhất, nghĩa là cực tiểu hóa thời gian quá độ

Chỉ tiêu chất lượng J phụ thuộc vào tín hiệu ra x(t), tín hiệu điều khiển u(t) và thời gian t Bài toán điều khiển tối ưu nhằm xác định tín hiệu điều khiển u(t) để tối ưu hóa chỉ tiêu chất lượng J, đồng thời phải tuân thủ các điều kiện hạn chế nhất định đối với u và x Thông thường, chỉ tiêu chất lượng J có dạng cụ thể.

Trong đó L là một phiếm hàm đối với tín hiệu x, tín hiệu điều khiển u và thời gian t

 Tối ưu hóa tĩnh và động

Chúng ta cần phân biệt giữa tối ưu hóa tĩnh và tối ưu hóa động Tối ưu hóa tĩnh là những bài toán không phụ thuộc vào thời gian, trong khi tối ưu hóa động lại xem xét thời gian như một yếu tố quan trọng cần được tính đến.

2.1.2 Xây dựng bài toán tối ưu

2.1.2.1 Tối ưu hoá không có điều kiện ràng buộc

Hàm chỉ tiêu chất lượng L(u) là một hàm vô hướng phụ thuộc vào vector điều khiển u ∈ R m Mục tiêu của chúng ta là tìm giá trị của u để tối thiểu hóa L(u) Để giải quyết bài toán tối ưu này, chúng ta áp dụng chuỗi Taylor để mở rộng độ biến thiên của hàm.

T u uu dLL du du L du T O (2.1) Với O(3) có thể coi là số hạng thứ 3 Grad của L theo u là một vector m cột:

(2.2) và đạo hàm cấp 2 của L theo u là một ma trận m x m (còn gọi là ma trận

L uu được gọi là ma trận uốn

Điểm cực trị hoặc điểm dừng xảy ra khi sự biến thiên dL với thành phần thứ nhất tiến về 0 trong quá trình điều khiển, đồng nghĩa với việc mọi biến thiên du đều không ảnh hưởng Do đó, để xác định được điểm cực trị, cần đảm bảo rằng điều kiện này được thỏa mãn.

L u = 0 (2.4) Giả sử đang ở tại điểm cực trị, có Lu = 0 như (2.4) Để điểm cực trị trở thành điểm cực tiểu, chúng ta cần có:

2 uu (3) dL du L du O T  (2.5) là xác định dương với mọi sự biến thiên du Điều này được đảm bảo nếu ma trận uốn L uu là xác định dương:

Nếu L uu là xác định âm, điểm cực trị sẽ là điểm cực đại Ngược lại, nếu L uu không xác định, điểm cực trị sẽ là điểm yên ngựa Trong trường hợp L uu bán xác định, cần xem xét các thành phần bậc cao hơn trong (2.1) để xác định loại điểm cực trị.

Lưu được xác định dương nếu tất cả các giá trị riêng của nó là dương, và xác định âm nếu tất cả các giá trị riêng là âm Nó được coi là không xác định khi có cả giá trị riêng dương và âm khác 0 Ngoài ra, lưu sẽ là bán xác định nếu tồn tại ít nhất một giá trị riêng bằng 0.

Luu = 0, thì thành phần thứ hai sẽ không hoàn toàn chỉ ra được loại của điểm cực trị

2.1.2.2 Tối ưu hoá với các điều kiện ràng buộc

Cho hàm chỉ tiêu chất lượng vô hướng L(x,u), với vector điều khiển u∈R m và vector trạng thái x∈R n Bài toán đưa ra là chọn u sao cho hàm chỉ tiêu chất lượng

L(x,u) đạt giá trị nhỏ nhất và thỏa mãn đồng thời các phương trình điều kiện ràng buộc f x u( , )= 0 (2.7)

Vector trạng thái x được xác định từ một giá trị u cho trước bằng mối quan hệ

Để xác định điều kiện cần và đủ cho giá trị cực tiểu của hệ phương trình vô hướng f ∈ R n với f(x,u)=0, ta cần thực hiện các bước tương tự như trong phần trước Đầu tiên, cần khai triển dL dưới dạng chuỗi.

Taylor, sau đó xác định số hạng thứ nhất và thứ hai là Lu và Luu

Thừa số Lagrange và hàm Hamilton

Tại điểm cực trị, đạo hàm dL có giá trị bằng 0 với mọi biến thiên của du khi df cũng bằng 0 Do đó, chúng ta có thể thiết lập các phương trình dL = L du_Tu + L dx_Tx = 0 và df = f du_u + f dx_x = 0 để mô tả mối quan hệ giữa các biến số này.

Các phương pháp điều khiển tối ưu

2.2.1 Phương pháp biến phân cổ điển Euler_Lagrange

Nhiệm vụ của điều khiển tối ưu là giải bài toán tìm được cực trị của phiếm hàm

L[x(t), u(t)] được xác định bằng cách chọn tín hiệu điều khiển u(t) trong các điều kiện hạn chế của đại lượng điều khiển và tọa độ pha Phương pháp biến phân cổ điển Euler-Lagrange là một công cụ toán học quan trọng để xác định cực trị Đường cực trị là các hàm trơn, trong khi phiếm hàm và các điều kiện hạn chế lại là những hàm phi tuyến Vì vậy, phương pháp này không phù hợp với những trường hợp mà tín hiệu điều khiển có thể là các hàm gián đoạn.

 Trường hợp không có điều kiện ràng buộc

Cho hàm u(t) là hàm có đạo hàm bậc nhất liên tục Trong mặt phẳng (u,t), ta có hai điểm (t0, u0) và (t1, u1) Mục tiêu là tìm quỹ đạo nối hai điểm này sao cho tích phân theo quỹ đạo u = u(t) được xác định.

L là hàm có đạo hàm riêng bậc một và bậc hai liên tục với mọi biến của nó Để thống nhất, ở đây ta lấy t 0 = 0 và t 1 = T

Biến đổi của J do u tạo nên:

Phân tích (2.39) theo chuỗi Taylor và chỉ khảo sát thành phần bậc một của J ta được:

Vì u vàu liên hệ với nhau bởi:

Xem u là hàm biến đổi độc lập, biểu thức (2.40) có thể biến đổi để chỉ chứa u bằng cách lấy tích phân những thành phần chứau:

Từ điều kiện đã cho u(0)=(T)=0, phần đầu của vế phải ở biểu thức (2.41) bằng 0

Nếu gia số J của chỉ tiêu chất lượng J tồn tại và nếu J có cực trị đối với u * thì:

  (2.42) Đó là điều kiện cơ bản của phép tính biến phân

Từ các biểu thức (2.41), (2.42) ta có:

Từ đó có thể rút ra phương trình Euler_Lagrange:

Hoặc có thể viết đơn giản:

 Trường hợp có điều kiện ràng buộc:

Nếu ngoài chỉ tiêu chất lượng (2.38) còn có các điều kiện ràng buộc dạng:

 i (u, u˙, t)  0 t [0,T ], i  1, n (2.45) thì chỉ tiêu chất lượng J có dạng:

  (2.46) mà  i (t) với i = 1,2,…,n là hàm Lagrange Vì giới hạn thỏa mãn với mọi t nên hàm Lagrange phụ thuộc thời gian

Tương tự như trên ta có phương trình Euler_Lagrange tổng quát:

Khi điều kiện ràng buộc có dạng:

 (2.49) thì phương trình Euler_Lagrange tổng quát (2.47) có phiếm hàm:

Trong trường hợp này, i là các hệ số không phụ thuộc thời gian

Khi có điều kiện ràng buộc dạng (2.45) hoặc (2.49) phải giải (n+1) phương trình để xác định y*(t) và  i *(t) với i=1,2,…,n

 Phương trình Euler_Lagrange với tín hiệu điều khiển bị hạn chế

Trong thực tế, tín hiệu điều khiển thường bị ràng buộc, ví dụ như u ≤ 1 Để xác định cực trị, cần có điều kiện rằng khi u(t) là đường cực trị, thì u+δu và u-δu phải là những hàm cho phép So sánh giá trị của phiếm hàm tại đường cực trị với giá trị của nó tại u+δu và u-δu cho thấy rằng nếu miền biến đổi của u(t) là kín và u(t) nằm ngoài biên, thì ít nhất một trong hai hàm u+δu hoặc u-δu sẽ nằm ngoài miền cho phép.

Một trong các biện pháp khắc phục khó khăn trên là đường cực trị ở biên và: u  (t) (2.51)

Nếu u  1, điều kiện u  (t) dẫn đến việc (t)  1 Khi thực hiện biến đổi với z 2 = u - , biến z mới không bị hạn chế và biên giới của biến u tương ứng với z = 0 Do đó, chỉ tiêu chất lượng được thiết lập.

J u  L u u t dt có biến mới, từ đó:

Và chỉ tiêu chất lượng có dạng:

Vì không có điều kiện hạn chế nên phương trình Euler_Lagrange có dạng:

2.2.2 Phương pháp quy hoạch động Belman

Phương pháp quy hoạch động được dựa trên nguyên lý tối ưu sơ khai của Belman:

Một chiến lược tối ưu không bị ảnh hưởng bởi các quyết định trước đó, như các quy định điều khiển, nhưng các quyết định còn lại phải được xây dựng dựa trên kết quả của những quyết định trước.

Nguyên lý tối ưu của Belman: “Bất kỳ một đoạn cuối cùng nào của quỹ đạo tối ưu cũng là một quỹ đạo tối ưu”

Nguyên lý này nhấn mạnh việc xác định phương án tối ưu dựa trên một số chỉ tiêu tối ưu Cụ thể, phương án tối ưu cần được xác định từ trạng thái cuối và đi ngược lại để tìm ra giải pháp hiệu quả nhất.

Page 22 Điều kiện áp dụng: nguyên lý tối ưu là một phương pháp số, chỉ áp dụng được khi hệ thống có phân cấp điều khiển và ta biết trước sơ đồ mắt lưới được xây dựng bằng thực nghiệm

2.2.2.2 Phương pháp điều khiển số

Chúng ta có thể rời rạc hóa và giải bài toán tối ưu cho hệ rời rạc, sau đó sử dụng khâu giữ bậc 0 để tạo ra tín hiệu điều khiển số.

Với hàm chỉ tiêu chất lượng:

J  x T T  L x t u t t dt (2.57) Để rời rạc hệ thống với chu kỳ lấy mẫu  giây, ta có thể sử dụng hàm xấp xỉ bậc 1: x k( )(x k  1 x k ) / (2.58)

Để đơn giản hóa, ta định nghĩa các biến x k và u k theo hàm x k(τ) và u k(τ) Định nghĩa hàm rời rạc f k(x, u k) sẽ cho phép ta viết lại biểu thức x k + 1 = f k(x, u k) (2.61) Như vậy, để thực hiện việc rời rạc hóa hàm chỉ tiêu, ta có thể sử dụng các biểu thức đã định nghĩa ở trên.

Sử dụng hàm xấp xỉ bậc 1 cho mỗi đại lượng tích phân:

  (2.64) Định nghĩa hàm rời rạc:

Trong trường hợp hệ thống tuyến tính bất biến theo thời gian với chỉ tiêu chất lượng dạng toàn phương: x  Ax Bu  (2.67)

Sử dụng hàm xấp xỉ bậc nhất để rời rạc hoá hệ thống trở thành: x k  1   ( I A x  ) k  B u  k (2.69)

Trong trường hợp này, chúng ta có thể cải thiện độ chính xác của xấp xỉ Euler (2.69) bằng cách áp dụng phương trình trạng thái chính xác (2.67), kết hợp với bộ lấy mẫu và khâu giữ bậc 1, được biểu diễn qua công thức: x k  1  A x S k  B u S k (2.74).

Hệ thống đã được rời rạc hóa, cho phép áp dụng phương pháp quy hoạch động để tính toán u k * tương tự như trong phần rời rạc Việc áp dụng điều khiển số trong thực tế được thể hiện rõ ràng qua các ứng dụng cụ thể.

Để áp dụng phương pháp quy hoạch động, việc lượng tử hóa biến trạng thái và giá trị điều khiển là cần thiết, giới hạn theo một tập giá trị chấp nhận Mức độ lượng tử cao hơn sẽ mang lại tín hiệu số chính xác hơn; tuy nhiên, khi số lượng giá trị chấp nhận của x_k và u_k tăng, khối lượng tính toán để xác định u*_k cũng tăng theo Điều này có thể tạo ra khó khăn nhanh chóng, ngay cả với các máy tính có công suất lớn.

2.2.3 Nguyên lý cực tiểu Pontryagin_Hamilton

2.2.3.1 Nguyên lý cực tiểu của Pontryagin

Kết hợp hàm chỉ tiêu chất lượng:

Trạng thái cuối phải thỏa mãn:

( ( ), )x T T 0 (2.80) và x(t 0) đã được cho trước Điều kiện để bài toán tối ưu là:

Giả sử hàm điều khiển u(t) bị ràng buộc trong một khoảng giới hạn cho phép, tức là giá trị yêu cầu không vượt quá giới hạn đã định Điều này dẫn đến việc thay thế điều kiện dừng bằng một điều kiện tổng quát hơn.

H x u( , * * , * , )t H x u( , * *  u, * , )t Thỏa tất cả giá trị  u

Dấu * biểu thị chỉ số chất lượng tối ưu, và bất kỳ sự biến thiên nào trong bộ điều khiển tối ưu tại thời điểm t (khi trạng thái và biến trạng thái được duy trì) sẽ làm tăng giá trị của hàm Hamilton Điều kiện này có thể được diễn đạt như sau:

H x u  t H x u  t Thỏa tất cả giá trị u (2.83)

Yêu cầu tối ưu biểu thức (2.83) được gọi nguyên lý cực tiểu Pontryagin: “Hàm

Hamilton phải được tối thiểu hóa đối với mọi giá trị u để đạt được trạng thái tối ưu Cần lưu ý rằng không thể khẳng định chắc chắn rằng biểu thức H(x, u, λ) ≤ H(x, u', λ) luôn đúng.

Chúng ta hãy thảo luận bài toán tối thiểu thời gian tuyến tính với ngõ vào ràng buộc Cho hệ thống: x  Ax Bu  (2.84) với chỉ tiêu chất lượng:

Với T tự do Giả sử hàm điều khiển phải thỏa mãn điều kiện sau: u t( ) 1  t  t T 0,  (2.86)

Điều khiển tối ưu các hệ tuyến tính với phiếm hàm dạng toàn phương

Trong phần này chúng ta sẽ xem xét phương pháp xây dựng bài toán tổng hợp các hệ tuyến tính với chỉ tiêu chất lượng dạng toàn phương

2.3.1 Ổn định Lyapunov đối với hệ thống tuyến tính

Tiêu chuẩn ổn định thứ hai của Lyapunov (điều kiện đủ)

Xét hệ thống được mô tả bởi phương trình trạng thái: x f x x( , 1 2 , ,x n )

Để tìm một hàm V(x) xác định dấu dương cho mọi biến trạng thái x1, x2,…, xn, cần đảm bảo rằng đạo hàm dV(x)/dt tuân theo phương trình vi Việc này giúp xác định sự ổn định của hệ thống và đóng vai trò quan trọng trong phân tích động lực học.

Page 35 phân của chuyển động bị nhiễu cũng là hàm xác định dấu, song trái dấu với hàm V(x) thì chuyển động không bị nhiễu sẽ ổn định tiệm cận

V x V x  : hệ thống ổn định tiệm cận

V x V x  : hệ thống không ổn định

Xét hệ tuyến tính mô tả bởi phương trình trạng thái: xAx (2.111)

Yêu cầu cực tiểu hoá chỉ tiêu chất lượng J:

 (2.112) với Q là ma trận vuông xác định dương

Chọn hàm năng lượng V(x) xác định dương:

V x( ) x Sx T (2.113) trong đó ma trận S là ma trận vuông xác định dương V x ( )có dạng:

Do V(x) xác định dương, nên để hệ thống ổn định thì V x( )phải là xác định âm

Ta chọn V x( ) x Qx T (do Q là ma trận xác định dương nên V x( )sẽ là xác định âm)

Điều kiện cần và đủ để trạng thái cân bằng x = 0 ổn định tiệm cận là cho trước một ma trận xác định dương Q và ma trận A ổn định, tồn tại một ma trận xác định dương S thỏa mãn phương trình Q = - (A^T S + S A).

Phương trình (2.115) được gọi là phương trình Lyapunov

Khi S không thay đổi theo thời gian S0, ta có phương trình đại số

Chỉ tiêu chất lượng J được tính như sau:

Khi tất cả các phần tử của ma trận A âm, ta có x(∞) → 0 Do đó:

2.3.2 Điều khiển tối ưu hệ tuyến tính với chỉ tiêu chất lượng dạng toàn phương _ Phương trình Riccati đối với hệ liên tục

Xét hệ thống có tác động ngoài (u ≠ 0): x  Ax Bu  (2.118)

Chúng ta cần tìm ma trận K của vector điều khiển tối ưu: u t( ) Kx t( ) (2.119) thỏa mãn chỉ tiêu chất lượng J đạt giá trị cực tiểu:

Trong bài viết, Q là ma trận xác định dương hoặc bán xác định dương, trong khi R là ma trận xác định dương Lưu ý rằng thành phần thứ hai ở phía bên phải của phương trình (2.120) xác định lượng năng lượng tiêu tốn của tín hiệu điều khiển.

Chúng ta sẽ chứng minh luật điều khiển tuyến tính cho bởi phương trình (2.119) là luật điều khiển tối ưu Khi đó, nếu ma trận K được xác định để

Page 37 tối thiểu hoá chỉ tiêu chất lượng J thì luật điều khiển u(t) sẽ tối ưu với mọi trạng thái ban đầu x(0)

Từ (2.118) và (2.119) ta có: x  Ax BKx    A BK x   (2.121) Thay u(t) = -Kx(t) vào phương trình (2.120):

Bây giờ ta chọn hàm năng lượng:

V x( )x Sx T ( )V x  0, x (2.123) với S là ma trận vuông xác định dương

Do V(x) xác định dương, nên để hệ thống ổn định thì V x ( )phải là xác định âm Ta đặt:

(do Q và R là ma trận xác định dương nên ma trận (Q+K T RK ) cũng là xác định dương, từ đó V x( )sẽ là xác định âm)

Theo tiêu chuẩn ổn định thứ hai của Lyapunov, nếu ma trận (A-BK) ổn định thì sẽ tồn tại một ma trận xác định dương S thoả mãn phương trình (2.125)

Chỉ tiêu chất lượng bây giờ có thể được xác định như sau:

J x Qx u Ru dt x Sx x Sx x Sx

 J x(0) T Sx(0) Đặt R = T T T, phương trình (2.125) trở thành:

Phương trình trên có thể viết lại như sau:

(2.126) Chỉ tiêu chất lượng J đạt giá trị cực tiểu khi biểu thức: x T   TK  (T ) T  1 B S T     T TK  (T ) T  1 B S x T   đạt giá trị cực tiểu Khi đó:

Phương trình (2.127) cung cấp ma trận tối ưu K, cho phép xác định luật điều khiển tối ưu cho bài toán điều khiển dạng toàn phương Luật điều khiển này được biểu diễn bằng phương trình tuyến tính, cụ thể là u(t) = -Kx(t) = -R B S x(t - 1 T) (2.128).

Ma trận S khi đó phải thỏa mãn phương trình (2.130) được viết lại như sau:

A S T SA SBR B S Q  1 T   S (2.129) Phương trình (2.129) được gọi là phương trình Riccati

Khi S không thay đổi theo thời gian S= 0, ta có phương trình đại số Riccati (ARE: Algebraic Riccati Equation ):

Phương trình Riccati là công cụ quan trọng trong việc tổng hợp các hệ tuyến tính với chỉ tiêu chất lượng dạng toàn phương Phương pháp này không chỉ đảm bảo tính ổn định của hệ thống thông qua việc lựa chọn hàm năng lượng V(x) theo tiêu chuẩn ổn định thứ hai của Lyapunov, mà còn giúp cực tiểu hóa chỉ tiêu chất lượng J theo yêu cầu của bài toán.

Khi áp dụng phương trình Riccati, việc lựa chọn ma trận trọng lượng phù hợp cho chỉ tiêu chất lượng là rất quan trọng, vì nó ảnh hưởng lớn đến kết quả tính toán Ngoài ra, trong hệ rời rạc, cần đảm bảo sự hội tụ của K k; nếu không, cần tăng số trạng thái, điều này sẽ làm tăng khối lượng tính toán, chỉ phù hợp khi sử dụng máy tính để giải quyết.

THIẾT KẾ BỘ ĐIỀU KHIỂN PHẢN HỒI TRẠNG THÁI TỐI ƯU CHO HỆ PHI TUYẾN VÀ ÁP DỤNG VÀO ĐỐI TƯỢNG CỤ THỂ

Phương trình Riccati phụ thuộc biến trạng thái

3.1.1 Giới thiệu sơ lược về phương trình Riccati phụ thuộc biến trạng thái

Phương trình Riccati phụ thuộc biến trạng thái (SDRE) là một phương pháp hiệu quả để thiết kế bộ điều khiển phản hồi phi tuyến và bộ ước lượng cho các hệ phi tuyến Phương pháp này cho phép xây dựng các bộ phản hồi phi tuyến gần đúng với các giải pháp điều khiển tối ưu vô hạn, có khả năng thực hiện trong thời gian thực cho nhiều ứng dụng Kỹ thuật SDRE sử dụng tham số hóa để biến đổi hệ thống phi tuyến thành cấu trúc tuyến tính với các ma trận có hệ số phụ thuộc trạng thái Mặc dù lý thuyết trước đây đã đề cập đến việc điều chỉnh bộ phi tuyến và tính ổn định tiệm cận của hệ thống với phản hồi đầy đủ trạng thái, nhưng vẫn chưa có thử nghiệm nào chứng minh sự hội tụ tiệm cận của bộ ước lượng và hệ thống bù.

Luận văn này trình bày phương pháp số xấp xỉ Taylor nhằm giải quyết phương trình Riccati phụ thuộc trạng thái Phương pháp chuỗi Taylor chỉ áp dụng hiệu quả cho một số lớp hệ thống, đặc biệt là những hệ thống có ma trận điều khiển không thay đổi.

3.1.2 Phương pháp xấp xỉ Taylor

Phương pháp xấp xỉ Taylor được sử dụng để tổng hợp các bộ điều khiển cho các hệ thống có dạng:

Khi ma trận điều khiển là hằng số, phương trình Ricacti phụ thuộc trạng thái (SDRE) có dạng:

Trong đó ma trận Q và R là các ma trận từ hàm giá trị

Chúng ta có thể viết lại ma trận A(x) dưới dạng tổng của một ma trận hằng số Â và một ma trận phụ thuộc vào trạng thái ΔA(x) Việc chọn Â được thực hiện sao cho cặp (Â, B) là điều khiển được Để xây dựng biểu diễn chuỗi, các biến tạm thời sẽ được thiết lập khi hoàn thành chuỗi.

Chúng ta có thể biểu diễn nghiệm của SDRE dưới dạng chuỗi Taylor:

Trong đó với mỗi ma trận Ln là đối xứng như một kết quả của tính đối xứng của ( ) x

ThayA x( )và ( )x vào biểu thức (3.1) ta được:

Viết lại phương trình trên dưới dạng hàm của và cho các hệ số bằng 0, ta tìm được các ma trận Ln theo phương pháp lặp như dưới đây:

Lưu ý rằng (3.2) là ARE tương ứng với (Â,B), trong khi (3.3) và (3.4) là phương trình Lyapunov phụ thuộc trạng thái Thuật toán này hội tụ đến nghiệm của SDRE với giả định rằng A(x) và B(x) là liên tục Phương pháp này được đơn giản hóa hơn nữa nếu ∆A(x) = g(x)∆AC, trong đó ∆AC là một ma trận hằng số.

Với ( L n ) C là một ma trận liên tục, chúng ta có được những phương trình hồi quy đơn giản hơn:

Khi A(x) thuộc loại này, chúng ta có thể xấp xỉ (x) bằng các ma trận hằng số được tính toán offline thông qua việc giải một phương trình ARE và một chuỗi các phương trình Lyapunov với các ma trận là hằng số.

Khi việc giải quyết các phương trình Lyapunov trong thời gian thực không khả thi và không thể biểu diễn được ΔA x() theo dạng đã nêu, chỉ có L0 và L1 có thể được tính toán offline Để thực hiện điều này, chúng ta cần viết lại công thức.

Trong đó f j (x) là phần phi tuyến của A(x)và ( A )  j C là các hệ số ma trận hằng số tương ứng Nếu chúng ta giả sử L1 có thể viết:

Nhóm f j (x) với mỗi phần tử j, và thiết lập các hệ số bằng không, chúng ta có thể xấp xỉ nghiệm cho SDRE bằng cách giải các phương trình sau:

Bộ điều khiển xấp xỉ tương được cho bởi:

Trong đó u 1 thể hiện rằng việc tính toán được lấy đến thành phần bậc 1 (cùng với L0) của chuỗi Taylor.

Áp dụng cho động cơ đồng bộ nam châm vĩnh cửu

3.2.1 Mô hình động cơ đồng bộ nam châm vĩnh cửu

Trong hệ quy chiếu d-q quay đồng bộ, ba pha dao động của động cơ đồng bộ nam châm vĩnh cửu (PMSM) được mô tả thông qua các phương trình phi tuyến.

4 6 qs L qs qs qs ds ds ds ds qs k i k k T i k i k k V i i k i k V i

 - vận tốc góc của rotor điện i qs - cường độ dòng điện trục q i ds - cường độ dòng điện trục d

T L - mômen cản p- hệ số điện cực

B- hệ số ma sát trượt

Sai số tốc độ, sai số dòng điện trục q và dòng điện đặt trục q có thể được định nghĩa như sau:

 - sai số tốc độ i qsd - dòng điện đặt trục q i qs - sai số dòng điện trục q

Hệ phương trình được thể hiện theo sai số động học:

( ) x A x xBu (3.8) Với x[i i q d s s ] , T u[u u fbq fb d ] T và:

Ma trận A(x) liên tục với mọi x và B là một ma trận hằng số Cuối cùng bộ phản hồi tối ưu được cho bởi biểu thức: u K x x( )  R B L x x  1 T ( ) (3.10)

Trong đó K(x) là một ma trận khuếch đại và L(x) là đối xứng, xác định dương và là nghiệm của SDRE sau:

Trong bài viết này, chúng ta khám phá các khối được suy ra từ tính chất đối xứng Ma trận Q thuộc R^3x3 là một ma trận đối xứng xác định dương, trong khi ma trận R cũng thuộc R^3x3 là một ma trận trọng số đối xứng liên tục.

3.2.2 Thiết kế bộ điều khiển xấp xỉ tối ưu bằng phương pháp Taylor Để cho các đầu vào điều khiển được, V qs và V ds được định nghĩa: qs ffq fbq

Trong hệ thống điều khiển, u ffq u fbq đại diện cho thành phần điều khiển truyền thẳng và phản hồi trên trục q, trong khi u ffd u fbd tương ứng với thành phần điều khiển truyền thẳng và phản hồi trên trục d.

Các bộ điều khiển truyền thẳngu ffd và u ffq được định nghĩa là:

Giải phương trình SDRE (3.11) bằng phương pháp giải tích gặp khó khăn do A(x) là ma trận phụ thuộc trạng thái Do đó, trong phần này, chúng tôi sẽ áp dụng phương pháp số sử dụng chuỗi Taylor để tính xấp xỉ nghiệm cho phương trình SDRE (3.11).

Bằng cách thêm vào biến số mới ε, ma trận phụ thuộc trạng thái A(x) có thể viết thành:

A x( ) A 0   A x( ) (3.12) Nghiệm của phương trình SDRE (3.11) có thể biểu diễn thành chuỗi Taylor sau đây:

Trong đó mỗi ma trận L n (x) đều đối xứng vì L(x) đối xứng

Thay (3.12) và (3.13) cho A(x) và L(x) vào phương trình SDRE (3.11), ta có phương trình dưới đây:

(3.14) Bằng cách sắp xếp theo bậc của ε sau đó gán các giá trị hệ số bằng 0, phương trình tính tất cả ma trận Ln có dạng sau:

Lưu ý rằng (3.15) là phương trình đại số Riccati tương ứng với (A 0 ,B), trong khi

(3.16) và (3.17) là phương trình Lyapunov phụ thuộc trạng thái Ta hiểu rằng phương pháp này hội tụ cục bộ tới nghiệm của phương trình SDRE (3.11) vì A(x) liên tục và

B là hằng số Để chuyển (3.16) và (3.17) thành phương trình đại số Lyapunov, số gia ma trận phụ thuộc trạng thái được viết thành:

Bằng cách đặt L x n ( )( ) n L C n với L C n là ma trận hằng số, (3.15) – (3.16) được biểu diễn như sau:

Do đó, lời giải cho phương trình SDRE có thể được ước lượng bằng cách giải quyết các vấn đề từ (3.19) đến (3.21) Cuối cùng, luật điều khiển phản hồi gần tối ưu được trình bày qua công thức.

Với K n  R B L  1 T C n và N số lượng của các phần tử trong loạt phép tính ẩn

Hình 3.1 Sơ đồ khối bộ điều khiển tốc độ tối ưu dựa trên phương pháp SDRE

3.2.3 Xây dựng hệ thống điều khiển trên Matlab – Simulink Để khẳng định hiệu quả tối ưu của bộ điều khiển đề xuất dựa trên tối ưu thiết kế SDRE, chúng ta hãy xem xét một nguyên mẫu PMSM bao gồm một PMSM, phanh

Page 49 điện, một bộ biến tần điều chế độ rộng xung 3 pha PWM và một mạch nghịch đảo

TMS320F28335DSPđược mô phỏng trên Matlab – Simulink với các dữ liệu cho trước như sau:

Công suất định mức Prated = 1hp, dòng điện định mức Irated = 3.94A, mômen định mức Trated = 3.9 N.m, p = 12, Rs = 0,99, Ls = 5.82 mH,  m =7.92.10 -2 V.s/rad,

J = 12.08.10 -4 kg.m 2 , và B = 3.10 -4 N.m.s/rad và các hệ số k lần lượt là: k1 = 3539.6, k2 = 0.2484, k3 = 34968.8, k40.1, k5.6, k61.82

Hình 3.2 Sơ đồ mô phỏng trên Simulink

Sơ đồ hệ thống bao gồm các khối chính như khối điều khiển thiết kế dựa trên SDRE và khối động cơ PMSM Bên cạnh đó, còn có các khối điều khiển truyền thẳng u ffq và u ffd.

Mô phỏng khối điều khiển:

Hình 3.3 Khối điều khiển SDRE

Bằng việc giải phương trình (3.19) và các phương trình Lyapunov (3.20), (3.21) các ma trận điều khiển tối ưu tìm được là:

Mô phỏng khối động cơ bằng Simulink:

Hình 3.4 Khối động cơ DC

Đề xuất thiết kế SDRE được xây dựng dựa trên việc tối ưu hóa ước tính tải có mômen xoắn TL, kết hợp với việc điều chỉnh tốc độ điều khiển Hệ thống này cân nhắc giữa hiệu quả và hiệu suất điều khiển, với tần số lấy mẫu và tần số PWM được thiết kế ở mức 5kHz.

Một không gian vectơ PWM được sử dụng để điều chỉnh dòng pha chảy vào PMSM Kết quả mô phỏng của hai phương pháp dựa trên SDRE khi n = 0 và n = 2 được trình bày để so sánh Cần lưu ý rằng, khi n = 0, bộ điều khiển được đề xuất tương tự như bộ điều khiển toàn phương tuyến tính LQR, mặc dù có một sự khác biệt nhỏ trong uffq và uffd.

- Tốc độ mong muốn ( d ): 50 rad/s → 100 rad/s

- Thông số động cơ danh định

- Tốc độ mong muốn ( d ): -50 rad/s → 50 rad/s

- Tốc độ mong muốn ( d ): 50 rad/s

Dưới đây là kết quả sau khi mô phỏng trên Matlab Simulink lần lượt theo 2 phương pháp đã nêu: khi n = 0 và n = 2

Hình 3.5 Đáp ứng vận tốc  khi n = 0 ở trường hợp 1

Nhận xét: Các hình từ 3.5 đến hình 3.7 hiển thị kết quả mô phỏng của phương pháp đề xuất khi n = 0 trong những trường hợp từ 1 đến 3

Mặc dù sai số tốc độ trong các trường hợp này rất nhỏ, nhưng độ vọt lố của phương pháp này lại khá rõ rệt và thời gian xác lập tương đối lớn.

Khi mômen tải đột ngột thay đổi từ 1N.m lên 2N.m, hiện tượng quá tốc độ xảy ra với biên độ lớn (khoảng 10 rad/s), tuy nhiên, quá trình trở về trạng thái ổn định diễn ra tương đối nhanh chóng.

Phương pháp đề xuất khi n = 0 có những ưu điểm nhất định với sai số tốc độ rất nhỏ, nhưng vẫn tồn tại vấn đề về độ vọt lố và thời gian xác lập lớn Do đó, để kiểm chứng sự ưu việt của phương pháp này, chúng ta tiến hành tăng n lên 2.

Nhận xét: Các hình từ 3.8 đến hình 3.10 hiển thị kết quả mô phỏng của phương pháp đề xuất khi n = 2 trong những trường hợp từ 1 đến 3 đã nêu trên

Trong nhiều trường hợp, sai số tốc độ trong trạng thái ổn định gần như bằng không, không xảy ra hiện tượng vọt lố, và thời gian xác lập rất ngắn, chỉ 0,009 giây so với 0,6 giây của phương pháp đề xuất khi n = 0.

Tốc độ động cơ  rất ổn định trong suốt thời gian thay đổi mômen tải từ 1N.m lên 2N.m, với sai số chỉ khoảng 0,6 rad/s trước khi trở về trạng thái ổn định Phương pháp thiết kế SDRE dựa trên quan sát tối ưu đã ước tính chính xác mômen xoắn tải TL trong cả ba trường hợp.

Tiêu đề	Điều Khiển Phản Hồi Trạng Thái Cho Hệ Phi Tuyến Với Phương Trình Riccati Phụ Thuộc Biến Trạng Thái
Tác giả	Đoàn Ngọc Anh
Người hướng dẫn	TS. Vũ Thị Thúy Nga
Trường học	Trường Đại Học Bách Khoa Hà Nội
Chuyên ngành	Điều Khiển Và Tự Động Hóa
Thể loại	Luận Văn Thạc Sĩ Kỹ Thuật
Năm xuất bản	2016
Thành phố	Hà Nội

Định dạng
Số trang	65
Dung lượng	1,49 MB