Nội dung của bài viết này nhằm trình bày phương pháp điều khiển dự báo MPC thích nghi - bền vững cho mô hình hệ phi tuyến trong đó khâu phi tuyến không biết trước thỏa mãn điều kiện liên tục Lipschitz.
TẠP CHÍ ISSN: 1859-316X KHOA HỌC CƠNG NGHỆ HÀNG HẢI KHOA HỌC - CÔNG NGHỆ JOURNAL OF MARINE SCIENCE AND TECHNOLOGY ĐIỀU KHIỂN DỰ BÁO TUBE-MPC THÍCH NGHI CHO HỆ PHI TUYẾN CĨ KHÂU PHI TUYẾN KHƠNG BIẾT TRƯỚC THỎA MÃN ĐIỀU KIỆN LIÊN TỤC LIPSCHITZ ADAPTIVE TUBE-MPC FOR NONLINEAR SYSTEMS WITH UNKNOWN NONLINEARITY SATISFYING LIPSCHITZ CONTINUITY NGUYỄN TIẾN BAN1*, NGUYỄN HOÀNG HẢI2 Khoa Điện cơ, Trường Đại học Hải Phịng Viện Cơ khí, Trường Đại học Hàng hải Việt Nam *Email liên hệ: bannguyentien@gmail.com Tóm tắt Bài báo trình bày phương pháp điều khiển dự báo MPC thích nghi - bền vững cho mơ hình hệ phi tuyến khâu phi tuyến khơng biết trước thỏa mãn điều kiện liên tục Lipschitz MPC phương pháp điều khiển dựa vào mơ hình hệ Vì thế, mơ hình hệ khơng biết rõ ảnh hưởng đến chất lượng điều khiển, chí khơng thể tìm lời giải Ý tưởng phương pháp dựa vào liệu thu trình vận hành điều kiện liên tục Lipschitz hàm phi tuyến chưa biết, xây dựng hàm chặn hàm chặn hàm chưa biết này, qua sai số hàm xấp xỉ hàm số thực tế chứng minh nằm khoảng xác định Dựa vào khoảng bị chặn xác định này, toán điều khiển đưa phương pháp điều khiển bền vững TubeMPC hồn tồn tìm lời giải Từ khóa: MPC - Bộ điều khiển dự báo, điều khiển phi tuyến, LMI, điều khiển tối ưu, điều khiển thích nghi, TubeMPC, tính liên tục Lipschitz Abstract This paper proposes a method to design an adaptive-robust model predictive controller for nonlinear systems in which the unknown nonlinearity is assumed to be Lipschitz continuous MPC is a model-based control strategy, which means the control performance can be severely affected by the uncertainties inside the system The key idea is that by using the data collected during the operation, we can establish upper bound and lower bound functions of the unknown nonlinearities, which can provide a computable bound for the unknown nonlinearities With this information, we can formulate the problem into a TubeMPC, which can be solved by current available methods SỐ 65 (01-2021) Keywords: MPC, Nonlinear Control, LMI, Optimal control, Adaptive Control, TubeMPC, Lipschitz Continuity Mở đầu Điều khiển dự báo MPC (Model Predictive Control) ([1, 3, 4, 5]) ngày trở nên phổ biến nghiên cứu thực tế nhờ vào tính ưu việt so với phương pháp điều khiển đương đại khác, cho phép đưa vào trình tìm lời giải toán điều khiển giới hạn hệ thống Ý tưởng điều khiển dự báo MPC bước tính, điều khiển MPC giải tốn tối ưu tìm lời giải (u(0), u(1),…, u(h)), sau sử dụng tín hiệu u(0) để điều khiển đối tượng Tiếp theo, trạng thái x(k) hệ cập nhật trình lặp lại MPC áp dụng hiệu cho hệ tuyến tính phi tuyến Trong lời giải cho tốn MPC với hệ tuyến tính trọn vẹn, MPC cho hệ phi tuyến nghiên cứu Một vấn đề toán điều khiển tham số toán thường rõ Việc không chắn đồng thời làm tăng độ phức tạp cho việc tìm lời giải cho tốn điều khiển phi tuyến nói chung Một cách tiếp cận với hệ phi tuyến có tham số không tường minh sử dụng phương pháp điều khiển bền vững Vấn đề điều khiển dự báo MPC với trường hợp nghiên cứu nhiều cách tiếp cận khác nhau, bao gồm phương pháp TubeMPC, Worst-case Scenerio-based MPC ([1, 3, 4, 5]) Tuy nhiên, tất phương pháp điều khiển bền vững nói chung dẫn đến conservatism, tức ước lượng ngưỡng giá trị an toàn cao cần thiết không đủ thông tin, khiến cho tập xác định lời giải bị thu hẹp, chí khơng tìm lời giải, thực tế lời giải cho toán tồn với giá trị ước lượng tốt Một hướng điều khiển bền vững 39 TẠP CHÍ KHOA HỌC - CƠNG NGHỆ JOURNAL OF MARINE SCIENCE AND TECHNOLOGY cập nhật giá trị cận giới hạn tham số khơng tường minh q trình điều khiển, trình điều khiển thu thập thêm thông tin hệ thống Sử dụng thơng tin để tính tốn lại ước lượng ban đầu, qua giảm conservatism tốn Cách tiếp cận gọi thích nghi (adaptive), từ phổ biến thời điểm “học“ (learning) Trong báo này, đối tượng điều khiển nghiên cứu hệ điều khiển phi tuyến bao gồm hệ tuyến tính nối với hàm phi tuyến khơng nhớ (memoryless), hàm phi tuyến trước, biết số Lipschitz hàm số Cần tìm tín hiệu điều khiển để tối ưu hàm mục tiêu lượng đưa hệ vị trí đảm bảo hệ ổn định, đồng thời tín hiệu điều khiển trạng thái hệ phải nằm giới hạn kỹ thuật cho phép Đã có nghiên cứu trước áp dụng MPC cho hệ phi tuyến tương tự, ví dụ [3, 4] Những phương pháp đảm bảo tính bền vững cho hệ dù khơng biết rõ hàm phi tuyến Tuy nhiên, hạn chế phương pháp xây dựng dựa LMIs (Linear Matrix Inequalities), tốn đưa tìm elipsoid nằm polytope tạo constraints (giới hạn) khơng giải thẳng tốn NLP (Nonlinear Programming), nên dẫn đến conservatism Trong phương pháp đề xuất đây, thông tin sử dụng để xây dựng hàm số chặn chặn hàm phi tuyến nhằm giảm phần không tường minh xuống, đồng thời toán đưa dạng NLP, qua giảm conservatism Tiếp theo báo bố cục sau: Phần trình bày rõ vấn đề cần giải dạng toán học Phần trình bày ý tưởng phương pháp Phần trình bày ví dụ minh họa kết mô Cuối cùng, phần kết luận định hướng nghiên cứu Vấn đề cần giải Hệ phi tuyến xem xét báo hệ phi tuyến phổ biến, ví dụ hệ thống tay máy robot linh hoạt (xem [9]), mơ tả phương trình: x( k 1) Ax(k)+G (z(k))+Bu(k), z(k)=Hx(k) (1) Trong x, u vector biến trạng thái tín hiệu điều khiển A, B ma trận trạng thái ma trận tín hiệu vào, có chiều n × n n × m G H ma trận biết hàm số 𝛾(𝑧): 𝐑 ⟶ 𝐑 khâu phi tuyến rõ, giả thiết có 40 ISSN: 1859-316X KHOA HỌC CƠNG NGHỆ HÀNG HẢI số Lipschitz 𝐿 ≥ hàm phi tuyến biết trước, có nghĩa với 𝑧1 , 𝑧2 ta ln có: ||𝛾(𝑧1 ) − 𝛾(𝑧2 )|| ≤ 𝐿||𝑧1 − 𝑧2 ||∀𝑧1 , 𝑧2 ∈ 𝑅(2a) Và: (0) (2b) Yêu cầu toán tín hiệu điều khiển trạng thái hệ ln phải nằm giới hạn cho trước, giả thiết hai tập giới hạn X U tập lồi: (3) x(k) X, u(k) U , k Giả thiết trạng thái hệ 𝑥(𝑘) quan sát hệ điều khiển hồn tồn Bài tốn đặt tìm tín hiệu điều khiển u để tối ưu lượng tiêu thụ hệ, hay nói cách khác phiếm hàm mục tiêu J đại diện cho lượng hệ đạt giá trị nhỏ Sử dụng liệu để xây dựng hàm chặn hàm chặn Phần trình bày cách xây dựng hàm chặn hàm chặn cho hàm phi tuyến 𝛾(𝑧) chưa biết Giả thiết trình vận hành, thu liệu tương ứng hàm số 𝛾(𝑧) dạng số (𝑧𝑖 , 𝛾𝑖 ) với 𝑖 = 1, … , 𝑙, gọi tập liệu 𝒟 Giả thiết thực theo giả thiết trạng thái hệ 𝑥(𝑘) quan sát thời điểm k, ta xác định 𝑧(𝑘) giá trị 𝛾(𝑧) từ (1) Đồng thời giả thiết bỏ qua sai lệch đo đạc thu thập liệu Không làm tính tổng quát, ta xét với liệu 𝑧 > Trường hợp 𝑧 < thực tương tự Giả thiết liệu xếp theo thứ tự < 𝑧1 < 𝑧2 < ⋯ 𝑧𝑙 Gọi hàm 𝛾̅ 𝛾 hàm chặn hàm chặn hàm phi tuyến 𝛾(𝑧) chưa biết, xây dựng dựa vào giả thiết số Lipschitz (2) sau Xét điểm (𝑧𝑖 , 𝛾𝑖 ), hàm số 𝛾(𝑧) qua điểm nên hàm số bắt buộc phải nằm vùng màu trắng Hình Tập hợp tất điểm mà hàm số 𝛾(𝑧) phải qua, ta thấy bắt buộc hàm số phải nằm miền nằm hai hàm số liên tục có dạng cưa Hình 1c Vì giá trị (𝑧𝑖 , 𝛾𝑖 ) xác định khoảng từ [0, 𝑧𝑙 ] nên hàm chặn chặn hoàn toàn xác định miền Ký hiệu: d max z z1 ZiD d max zi 1 z1 i 1, 2, , i 1 ZiD Theo ký hiệu ta có: SỐ 65 (01-2021) TẠP CHÍ ISSN: 1859-316X KHOA HỌC CÔNG NGHỆ HÀNG HẢI KHOA HỌC - CÔNG NGHỆ JOURNAL OF MARINE SCIENCE AND TECHNOLOGY d d z max zi i0,i Với cách xây dựng hai hàm chặn chặn 𝛾̅ 𝛾 trên, hiệu số hai hàm này W (z)- (z) Ld W bị chặn bởi: với W=2Ld Nếu ta chọn hàm nằm hai hàm chặn chặn dưới, tức (z) (z) (z) , hiển nhiên ta có: (z)- (z) W (4) Và W hoàn toàn xác định Như vậy, thay cần hàm số 𝛾(𝑧), mà ta khơng biết, để tính tốn tín hiệu điều khiển, ta chọn hàm 𝛾̃ nằm hai hàm số chặn chặn để đưa vào điểu khiển, đưa toán MPC bền vững với sai số hàm phi tuyến W ước lượng Tiếp theo trình bày phương pháp điều khiển TubeMPC áp dụng cho trường hợp toán Hình 1a Nếu ta biết điểm (𝒛𝒌 , 𝜸𝒌 ) hàm số chưa biết, điều kiện liên tục Lipschitz với số Lipschitz L cho ta biết hàm số nằm miền có màu trắng, khơng thể nằm miền có màu xanh Ranh giới miền màu xanh đậm có hệ số góc L Hình 1c Khi ta có thêm nhiều điểm khác, miền mà hàm số tồn (vùng màu trắng) hẹp lại, bị chặn hai hàm liên tục có dạng cưa màu hồng màu xanh hình vẽ Hiệu số hai hàm xác định qua công thức (4) TubeMPC cho toán điều khiển bền vững Ý tưởng toán điều khiển TubeMPC đối tượng điều khiển thực tế có sai số khơng biết, biết chặn sai số đó, phương pháp MPC cần phải có mơ hình tường minh đối tượng Giải pháp phương pháp TubeMPC ta chọn mơ hình đối tượng danh nghĩa (nominal system) xây dựng điều khiển MPC dựa mơ hình danh nghĩa này, đồng thời đảm bảo sai số trạng thái mơ hình danh nghĩa so với trạng thái mơ hình thực tế nằm giới hạn cho phép Tưởng tượng hình học giống ta giữ sai số 𝑒(𝑡) nằm ống (tube), lý gọi TubeMPC Sau ta xét mơ hình đối tượng danh nghĩa sau: x(k 1) Ax(k) G ( z (k)) Bu (k), (5) z(k) Hx(k) Trong đó, ma trận A, B, C, G, H ma trận mơ hình đối tượng thực tế (1), có hàm phi tuyến 𝛾̃ khác với mơ hình thực tế Sự khác biệt dẫn đến trạng thái hệ danh nghĩa 𝑥̃ khác với trạng thái 𝑥 hệ thực tế Phiếm hàm mục tiêu hàm kết thúc định nghĩa: E(x) : xT Px F(x, u) : x TQx u TRu Hình 1b Nếu ta biết thêm điểm (𝒛𝒌+𝟏 , 𝜸𝒌+𝟏 ) hàm số chưa biết, tiếp tục áp dụng điều kiện liên tục Lipschitz cho ta biết hàm số nằm miền có màu trắng, khơng thể nằm miền có màu xanh SỐ 65 (01-2021) Trong Q, R, P ma trận xác định dương có kích thước tương ứng Bài toán tối ưu cần giải cho bước tính là: N F (x( k ), u (k)) E(x(k N)) u(k ) (6) k 41 TẠP CHÍ KHOA HỌC - CƠNG NGHỆ JOURNAL OF MARINE SCIENCE AND TECHNOLOGY x(k 1) A x(k ) G ( H x(k )) Bu(k ), 𝑥̃(𝑘) ∈ 𝑋 ⊖ 𝑅(𝑘), 𝑢̃(𝑘) ∈ 𝑈 ⊖ 𝐾𝑒 𝑅(𝑘), 𝑥̃(𝑘 + 𝑁) ∈ 𝐸 ⊖ 𝑅(𝑘 + 𝑁) Ký hiệu ⊖ phép trừ Minkowski hai tập Nếu so sánh điều kiện ràng buộc hệ thực tế (3) với hệ danh nghĩa (6) thấy tập xác định hệ danh nghĩa hẹp phải trừ tập ℛ(𝑘) Tập ℛ(𝑘) xuất phải tính đến sai lệch W hàm phi tuyến Cụ thể, cho phép trạng thái 𝑥̃ hệ danh nghĩa thuộc tập X, 𝑥̃ biên X, sai số tạo nên tính khơng xác hàm phi tuyến 𝛾̃, chắn trạng thái thực tế 𝑥 thuộc tập X Vì vậy, tập ℛ(𝑘) phải tính tốn cho khơng thời điểm 𝑘 tại, mà tất trạng thái từ 𝑘 đến 𝑘 + 𝑁, (6) thỏa mãn chắn trạng thái thực tế 𝑥 thuộc tập X Để tính tốn tập ℛ(𝑘) đảm bảo sai số hệ danh nghĩa hệ thực tế hữu hạn, xét sai số trạng thái hai hệ: 𝑒(𝑘) = 𝑥(𝑘) − 𝑥̃(𝑘) (7) Tín hiệu điều khiển cho hệ có dạng: 𝑢(𝑘) = 𝑢̃(𝑘) + 𝐾𝑒 𝑒(𝑘) (8) Trong thành phần 𝑢̃ tính tốn từ điều khiển MPC dành cho hệ danh nghĩa, thành phần lại để ổn định hệ sai số với 𝐾𝑒 tham số chọn Hệ sai số thu sử dụng tín hiệu điều khiển (8) cho hệ (6), trừ hệ (1) cho hệ (6) ta có: 𝑒(𝑘 + 1) = (𝐴 + 𝐵𝐾𝑒 )𝑒(𝑘) + 𝐺𝑑(𝑘), Trong đó, 𝑑(𝑘) = 𝛾(𝑧(𝑘)) − 𝛾̃(𝑧̃ (𝑘)) ISSN: 1859-316X KHOA HỌC CÔNG NGHỆ HÀNG HẢI bất biến (invariant set) điều khiển phi tuyến ([2]) Một cách để giải toán đưa tốn LMI để tính xấp xỉ (outer approximation) tập dạng ellipsoid đề cập [8] Cụ thể toán đưa tìm giá trị Ω > Θ để hệ LMI sau có nghiệm: ̃ + 𝜏2 ≤ 1, 𝑊 ̃ = 2𝑊 𝜏1 𝑊 (12) Khi 𝐾𝑒 xác định cơng thức: 𝐾𝑒 = ΘΩ−1 (13) Vì tốn đưa hồn tồn toán Tube MPC tiêu chuẩn đề cập [6] nên dẫn đến kết sau Xét đối tượng điều khiển (1) thỏa mãn điều kiện (2) Nếu toán tối ưu (6) tồn lời giải 𝑢̃(𝑘) hệ thống thực tế (1) điều khiển tín hiệu (8) thỏa mãn điều kiện (3) giới hạn trạng thái tín hiệu điều khiển ([6]) Vì tốn đưa hồn tồn toán Tube MPC tiêu chuẩn đề cập [6] nên kết trực tiếp có từ kết [6] Ví dụ kết mơ (9) Tiếp theo trình bày tiêu chí chọn tham số 𝐾𝑒 cho hệ (9) Chú ý 𝑑(𝑘) bị chặn bởi: ||𝛾(𝑧) − 𝛾̃(𝑧̃ )|| ≤ ||𝛾(𝑧) − 𝛾(𝑧̃ )|| + ||𝛾(𝑧̃ ) − 𝛾̃(𝑧̃ )|| (10) Số hạng trái chặn (sử dụng tính liên tục Lipschitz (2)): ||𝛾(𝑧) − 𝛾(𝑧̃ )|| ≤ 𝐿||𝑧 − 𝑧̃ || ≤ 𝐿||𝐻||||𝑥 − 𝑥̃|| = 𝐿||𝐻||||𝑒|| Và số hạng thứ hai (10) bị chặn (4) Từ đó, ta có chặn tín hiệu 𝑑(𝑘): ||𝑑(𝑘)|| ≤ 𝐿̃||𝑒(𝑘)|| + 𝑊 (11) với 𝐿̃ = 𝐿||𝐻|| Như vậy, xét hệ sai số (9) hệ có trạng thái 𝑒(𝑘) tín hiệu nhiễu 𝑑(𝑘) 𝑑(𝑘) bị chặn (11), câu hỏi đặt làm để chọn 𝐾𝑒 cho 𝑒(𝑘) không tiến đến vơ (khi đó, sai lệch trạng thái hệ thực tế hệ danh nghĩa lớn) Đồng thời, chọn 𝐾𝑒 để 𝑒(𝑘) hữu hạn, làm để tính giá trị cực đại 𝑒(𝑘) đó, từ giá trị cực đại 𝑒(𝑘) ta tính giá trị cực đại cho phép 𝑥̃ theo quan hệ (7), hay nói cách khác tính tập ℛ(𝑘) Bài tốn tốn tính tập 42 Hình Mơ hình tay máy robot Trong phần ví dụ trình bày để minh họa phương pháp thiết kế điều khiển dự báo bền vững trình bày Xét đối tượng điều khiển tay máy robot ([9]) (Hình 2) mơ tả phương trình tốn sau: 𝑥1 (𝑘 + 1) = 𝑥1 (𝑘) + 0.05 𝑥2 (𝑘) 𝑥2 (𝑘 + 1) = −2,43𝑥1 (𝑘) − 0,9375𝑥2 (𝑘) + 2.43𝑥3 (𝑘) + 1,08𝑢(𝑘) 𝑥3 (𝑘 + 1) = 𝑥3 (𝑘) + 0,05𝑥4 (𝑘) 𝑥4 (𝑘 + 1) = 0,975𝑥1 (𝑘) − 0,835𝑥3 (𝑘) + 𝑥4 (𝑘) − 0.1665𝑔(𝑥3 (𝑘)) Trong hàm số g(z) hàm phi tuyến, có dạng: 𝑔(𝑧) = 0,25(𝑧 + 𝑠𝑖𝑛(𝑧)) Như hàm g(x) nằm miền ≤ 𝑔(𝑧) ≤ 0.5𝑧, thỏa mãn điều kiện (2) với L=0,5 Trạng thái ban đầu hệ x0=(1;0,2;0;0) Yêu SỐ 65 (01-2021) TẠP CHÍ ISSN: 1859-316X KHOA HỌC CÔNG NGHỆ HÀNG HẢI JOURNAL OF MARINE SCIENCE AND TECHNOLOGY cầu điều khiển gốc tọa độ với: |𝑢| < 1,5, |𝑥1 | < 𝜋⁄2 , |𝑥3 | < 𝜋⁄2 Phiếm hàm mục tiêu có Q= 0,01diag(1;0,1;1;0,1), R= 0,01 Dữ liệu giả thiết có sẵn từ lần hoạt động trước Giải hệ LMI (12,13) ta thu 𝐾𝑒 = [−4,8; −1,2; 2,6; −0.5] Các tập giới hạn (6) tính toolbox MPT3 (https://www.mpt3.org/) Matlab Bài toán bền vững MPC (6) giải toolbox dompc (www.do-mpc.com) Python Kết mơ thể Hình cho thấy tín hiệu điều khiển u ln nằm giới hạn cho phép từ -1,5 đến 1,5 ràng buộc giới hạn trạng thái x1 x3 thỏa mãn Như phương pháp điều khiển đề xuất giải hồn tồn tốn điều khiển đề KHOA HỌC - CƠNG NGHỆ mơ hình đối tượng nên việc tận dụng liệu thu trình vận hành để học thêm mơ hình hệ góp phần nâng cao chất lượng điều khiển Bằng chứng minh toán học rõ ràng ví dụ minh họa mơ phỏng, báo cho thấy phương pháp thiết kế điều khiển giải toán đề Bài báo bước đầu nghiên cứu mở rộng sau Một hướng nghiên cứu mở rộng cho toán liệu đo đạc khơng xác, có kèm theo nhiễu đo Việc khơng bỏ qua sai số đo đạc góp phần cải thiện chất lượng điều khiển TÀI LIỆU THAM KHẢO [1] Basil Kouvaritakis, Mark Cannon: Model Predictive Control, Springer, 2016 [2] Stephen Boyd, Laurent El Ghaoui, Eric Feron, Venkataramanan Balakrishnan: Linear matrix inequalities in system and control theory, SIAM, 1994 [3] Rolf Findeisen, Frank Allgöwer, Lorenz T Biegler: Assessment and Future Directions of Nonlinear Model Predictive Control (Lecture Notes in Control and Information Sciences), Springer, 2007 [4] Sasa V Rakovic, William S Levine: Handbook of Model Predictive Control, Birkhause, 2019 [5] Lars Grune, Jurgen Pannek: Nonlinear Model Predictive Control: Theory and Algorithms, Springer, 2017 [6] D.Q Mayne, E.C Kerrigan, E Van Wyk, and P Falugi, Tube-based robust nonlinear model predictive control, International Journal of Robust and Nonlinear Control, Vol.21(11), pp.1341-1353, 2011 [7] G Beliakov, Interpolation of Lipschitz functions, Journal of Computational and Applied Mathematics, Vol.196(1), pp.20-44, 2006 [8] J Lofberg, Min-Max Approaches to Robust ModelPredictive Control, Dissertation, Link ̈oping University, 2003 Hình Kết mơ trạng thái tín hiệu điều khiển hệ Kết luận Bài báo trình bày phương pháp điều khiển dự báo thích nghi - bền vững dành cho hệ phi tuyến có hàm số phi tuyến chưa biết với giả thiết hàm số liên tục Lipschitz với số L điều kiện ràng buộc trạng thái tín hiệu điều khiển Vì phương pháp điều khiển dự báo MPC phụ thuộc vào SỐ 65 (01-2021) [9] C Bohm, S Yu, R Findeisen, and F Allgower, Predictive control for Lure systems subject to constraints using LMIs, 2009 European Control Conference (ECC), pp.3389-3394, 2009 Ngày nhận bài: Ngày nhận sửa: Ngày duyệt đăng: 25/12/2020 09/01/2021 18/01/2021 43 ... tín hiệu điều khiển hệ Kết luận Bài báo trình bày phương pháp điều khiển dự báo thích nghi - bền vững dành cho hệ phi tuyến có hàm số phi tuyến chưa biết với giả thiết hàm số liên tục Lipschitz. .. tượng điều khiển (1) thỏa mãn điều kiện (2) Nếu toán tối ưu (6) tồn lời giải