Mô hình hệ thống robot bầy đàn

Một phần của tài liệu LUẬN ÁN TIẾN SĨ NGHIÊN CỨU GIẢI THUẬT HỌC CỦNG CỐ TRONG ĐIỀU KHIỂN THÍCH NGHI BỀN VỮNG CHO HỆ PHI TUYẾN (Trang 120)

Xét một robot di động dạng xe (Wheeled Mobile Robot (WMR) ở nút 𝑠𝑖. Khối lượng của robot này tập trung tại trọng tâm bao gồm khối lượng khung không kể các bánh xe và khối lượng các bánh xe. Khoảng cách dẫn động của hai bánh xe chủ động là 𝑏 𝑖.

Đường kính của mỗi bánh xe là 𝑟 𝑖. Khoảng cách giữa tâm và trục dẫn động là 𝑙 𝑖. Không mất tính tổng quát có thể giả sử rằng 𝑙 𝑖 = 0. Robot thứ 𝑖 được xem như là hệ

thống cơ khí với không gian cấu hình 𝑛 chiều với tọa độ suy rộng

𝑞𝑖 = 𝑞1𝑖, 𝑞2𝑖, … , 𝑞𝑛𝑖 ∈ ℝ𝑛 chịu 𝑚 ràng buộc với 𝑚 < 𝑛 được biểu diễn dưới dạng

𝐴 𝑞𝑖 𝑞 𝑖 = 0 với 𝐴 𝑞𝑖 ∈ ℝ𝑚 ×𝑛 là ma trận đủ hạng [36]. Giả sử rằng 𝑆 𝑞𝑖 ∈ ℝ𝑛 × 𝑛−𝑚 cũng là ma trận đủ hạng được tạo thành từ trường véc tơ trơn và độc lập tuyến tính trong không gian rỗng của 𝐴 𝑞𝑖 sao cho 𝐴 𝑞𝑖 𝑆(𝑞𝑖) = 0. Gọi 𝜗𝑖 𝑡 = 𝜐𝑖𝑇 𝜔𝑖𝑇 𝑇 ∈ ℝ𝑛−𝑚 là véc tơ vận tốc, phương trình chuyển động của WMR dựa vào hai ràng buộc của 𝐴 𝑞𝑖 có thể viết thành [36], [65]:

𝑞 𝑖 = 𝑆 𝑞𝑖 𝜗𝑖(𝑡) (6.41)

Để có phương trình động học robot, công thức Lagrange được sử dụng như sau:

𝑑 𝑑𝑡

𝜕𝐿𝑖

𝜕𝑞 𝑖 −𝜕𝐿𝑖

𝜕𝑞 𝑖 = 𝐹𝑇𝑖 (6.42)

trong đó 𝐹𝑇𝑖 là véc tơ lực suy rộng. 𝐿𝑖 là hàm Lagrange, do robot chuyển động trên nền phẳng nên 𝐿𝑖 chỉ chứa động năng [36], [65]:

𝐿 =1 2 𝜗𝑖𝑘 𝑇𝑚𝑖𝑘𝜗𝑖𝑘 + 𝜔𝑖𝑘𝑇 𝐼𝑖𝑘𝜔𝑖𝑘 𝑛 𝑘=1 (6.43) trong đó 𝜗𝑖𝑘, 𝜔𝑖𝑘, 𝑚𝑖𝑘 và 𝐼𝑖𝑘 lần lượt là các thành phần của véc tơ vận tốc dài, vận tốc

103

quay, khối lượng và mô men quán tính. Kết quả là phương trình động học của robot trở thành:

𝑀𝑖 𝑞𝑖 𝑞 i + 𝐶𝑖 𝑞𝑖, 𝑞 i 𝑞 i + 𝐵𝑖 𝑞𝑖 𝐹𝑖 𝑞 i + 𝐵𝑖 𝑞𝑖 𝜏𝑖𝑑 = 𝐵𝑖 𝑞𝑖 𝜏𝑖 − 𝐴𝑇(𝑞𝑖)𝜆𝑖 (6.44) trong đó 𝑀𝑖 𝑞𝑖 ∈ ℝ𝑛×𝑛 là ma trận đối xứng xác định dương, 𝐶𝑖 𝑞𝑖, 𝑞 i ∈ ℝ𝑛 ×𝑛

là ma trận Coriolis, 𝐹𝑖 𝑞 i ∈ ℝ𝑛 là véc tơ lực trọng trường và lực ma sát, 𝜏𝑖𝑑 ∈ ℝ𝑛−𝑚 là nhiễu bị chặn bao gồm nhiễu ngoài và sai số mô hình. 𝐵𝑖 𝑞𝑖 ∈ ℝ𝑛× 𝑛−𝑚 là ma trận chuyển đổi, 𝜏𝑖 ∈ ℝ𝑛 −𝑚 là véc tơ mô men điều khiển, 𝜆𝑖 ∈ ℝ𝑚là véc tơ lực ràng buộc. Đạo hàm phương trình (6.41) ta có:

𝑞 𝑖 = 𝑆 𝑞𝑖 𝜗𝑖 + 𝑆 𝑞𝑖 𝜗 𝑖 (6.45)

Thay (6.41), (6.45) vào (6.44) và nhân hai vế cho 𝑆𝑇(𝑞𝑖) với chú ý rằng 𝐴 𝑞𝑖 𝑆(𝑞𝑖) = 0 ta có:

𝑀𝑖 𝑞𝑖 𝜗 𝑖(𝑡) + 𝐶 𝑖 𝑞𝑖, 𝑞 𝑖 𝜗𝑖(𝑡) + 𝐹 𝑖 𝑞 𝑖 + 𝜏 𝑑𝑖 = 𝐵 𝑖 𝑞𝑖 𝜏𝑖 (6.46)

trong đó 𝑀𝑖 𝑞𝑖 = 𝑆𝑇𝑀𝑖𝑆, 𝐶 𝑖 𝑞𝑖, 𝑞 𝑖 = 𝑆𝑇𝑀𝑖𝑆 + 𝑆𝑇𝐶𝑖𝑆, 𝐵 𝑖 𝑞𝑖 = 𝑆𝑇𝐵𝑖 𝑞𝑖 , 𝐹 𝑖 𝑞 𝑖 = 𝑆𝑇𝑀𝑖𝑆 𝜗𝑖 + 𝐵 𝑖 𝑞𝑖 𝐹𝑖, 𝜏 𝑑𝑖 = 𝐵 𝑖 𝑞𝑖 𝜏𝑑𝑖. Các tham số trong mô hình (6.46) có một số tính chất quan trọng như sau:

Tính chất 6.4: 𝑀𝑖 𝑞𝑖 là ma trận đối xứng xác định dương bị chặn thỏa điều kiện

𝑚𝑖𝑚𝑖𝑛 ≤ 𝑀𝑖 𝑞𝑖 ≤ 𝑚𝑖𝑚𝑎𝑥 với 𝑚𝑖𝑚𝑖𝑛 và 𝑚𝑖𝑚𝑎𝑥 là các hằng số dương.

Tính chất 6.5: 𝐶 𝑖 𝑞𝑖, 𝑞 𝑖 bị chặn thỏa điều kiện 𝑐𝑖𝑚𝑖𝑛 ≤ 𝐶 𝑖 𝑞𝑖, 𝑞 𝑖 ≤ 𝑐𝑖𝑚𝑎𝑥 với

𝑐𝑖𝑚𝑖𝑛và 𝑐𝑖𝑚𝑎𝑥 là các hằng số dương.

Tính chất 6.6 [65]: 𝐹 𝑖 𝑞 𝑖 bị chặn thỏa điều kiện 𝐹 𝑖 𝑞 𝑖 ≤ 𝑓 𝑖𝑚𝑎𝑥 𝑞i , với

𝑓 𝑖𝑚𝑎𝑥 là hằng số dương.

Tính chất 6.7 ([13], [40], [125],[23]): Nhiễu mô men 𝜏 𝑑𝑖 có năng lượng hữu hạn, nghĩa là 𝜏 𝑑𝑖 ∈ 𝐿2[0, 𝑇], 0 < 𝑇 < ∞, 𝜏 𝑑𝑖 bị chặn sao cho 𝜏 𝑑𝑖 ≤ 𝜏 𝑑𝑖𝑚𝑎𝑥 với

𝜏 𝑑𝑖𝑚𝑎𝑥 là hằng số dương.

Định nghĩa 6.1: Định nghĩa các hàm 𝑓𝑞𝑖 𝑞𝑖 = 0𝑛×1, 𝑔𝑞𝑖 𝑞𝑖 = 𝑆 𝑞𝑖 ∈ ℝ𝑛 ×(𝑛−𝑚 ), 𝑓𝜗𝑖 𝑞𝑖, 𝜗𝑖 = −𝑀𝑖−1 𝑞𝑖 𝐶 𝑞𝑖, 𝑞 𝑖 𝜗𝑖 + 𝐹 𝑖(𝑞 𝑖) ∈ ℝ𝑛−𝑚,𝑔𝜗𝑖 𝑞𝑖, 𝜗𝑖 = 𝑀𝑖−1 𝑞𝑖

104

Sử dụng các phương trình (6.41) và (6.46), ta có phương trình không gian trạng thái của robot 𝑖dưới dạng hệ phi tuyến hồi tiếp chặt:

𝑞 𝑖 = 𝑓𝑞𝑖 𝑞𝑖 + 𝑔𝑞𝑖 𝑞𝑖 𝜗𝑖

𝜗 𝑖 = 𝑓𝜗𝑖 𝑞𝑖, 𝜗𝑖 + 𝑔𝜗𝑖 𝑞𝑖, 𝜗𝑖 𝜏𝑖 + 𝑘𝜗𝑖 𝑞𝑖, 𝜗𝑖 𝜏 𝑑𝑖

(6.47) Từ định nghĩa 6.1, kết hợp với tính chất từ 6.4 đến 6.7, ta có một số tính chất cần thiết về các thành phần động học trong mô hình (6.47) dùng để thiết kế luật điều khiển sau này như sau:

Tính chất 6.8: Theo định nghĩa 6.1 thì 𝑔𝑞𝑖 𝑞𝑖 là ma trận bị chặn thỏa điều kiện

𝑔𝑖𝑚𝑖𝑛 ≤ 𝑔𝑞𝑖 𝑞𝑖 ≤ 𝑔𝑖𝑚𝑎𝑥 với 𝑔𝑖𝑚𝑖𝑛 và 𝑔𝑖𝑚𝑎𝑥 là các hằng số dương.

Tính chất 6.9: 𝐵 𝑖(𝑞𝑖) là ma trận không suy biến chứa tham số hằng, đó là bán kính 𝑟 𝑖 của các bánh xe và độ rộng khung robot 𝑏 𝑖 [65].

Tính chất 6.10: Theo định nghĩa 6.1 thì 𝑔𝜗𝑖 𝑞𝑖, 𝜗𝑖 bị chặn thỏa điều kiện

𝑚𝑖𝑚𝑎𝑥−1 𝐵 𝑖 ≤ 𝑔𝜗𝑖(𝑞𝑖, 𝜗𝑖) ≤ 𝑚𝑖𝑚𝑖𝑛−1 𝐵 𝑖. Kết hợp với tính chất 6.4, ta có 𝑔𝜗𝑖 𝑞𝑖, 𝜗𝑖 ≠ 0.

Tính chất 6.11: Theo định nghĩa 6.1 thì 𝑘𝜗𝑖(𝑞𝑖, 𝜗𝑖) bị chặn thỏa điều kiện

𝑚𝑖𝑚𝑎𝑥−1 ≤ 𝑘𝜗𝑖(𝑞𝑖, 𝜗𝑖) ) ≤ 𝑚𝑖𝑚𝑖𝑛−1 . Kết hợp với tính chất 6.4 ta có 𝑘𝜗𝑖(𝑞𝑖, 𝜗𝑖) ≠ 0.

Tính chất 6.12: Từ phương trình (6.41) và theo các Tính chất 6.4, 6.5 thì 𝑓𝜗𝑖 𝑞𝑖, 𝜗𝑖 thỏa điều kiện 𝑓𝜗𝑖 𝑞𝑖, 𝜗𝑖 ≤ 𝑚𝑖𝑚𝑖𝑛−1 𝑐𝑖𝑚𝑎𝑥 + 𝑓 𝑖𝑚𝑎𝑥𝑠𝑖𝑚𝑎𝑥 𝜗𝑖 , trong đó

𝑠𝑖𝑚𝑎𝑥 là chặn trên của 𝑆(𝑞𝑖) .

Tính chất 6.13[36]: 𝑓𝜗𝑖 𝑞𝑖, 𝜗𝑖 , 𝑔𝜗𝑖 𝑞𝑖, 𝜗𝑖 , 𝑔𝑞𝑖 𝑞𝑖 , 𝑘𝜗𝑖(𝑞𝑖, 𝜗𝑖) , là các hàm phi tuyến trơn.

Giả thiết 6.8: Robot dẫn đầu (robot ảo) phát ra quỹ đạo trơn bị chặn 𝑞0 thỏa ràng buộc 𝑞 0 = 𝑆(𝑞0)𝜗0 với 𝜗0 là véc tơ vận tốc giả sử trơn, liên tục.

Giả thiết 6.9: Chỉ có các robot lận cận robot dẫn đầu mới có thể nhận được thông tin về vị trí 𝑞0 và vận tốc 𝜗0.

Ma trận kết nối giữa robot 𝑖 và robot dẫn đầu được định nghĩa:

𝑍 = diag 𝑧1, … , 𝑧𝑁 (6.48)

105

Hình 6.3 Sơ đồ điều khiển nhiều robot hợp tác sử dụng ORADP mở rộng

Phương trình (6.47) có dạng phương trình hệ phi tuyến MIMO (6.1) với hai hệ con, trong đó hệ con thứ nhất có trạng thái 𝑥𝑖1 = 𝑞𝑖 ∈ ℝ𝑛 và hệ con thứ hai 𝑥𝑖2 =

𝜗𝑖 ∈ ℝ𝑛−𝑚. Ngoài ra, các thành phần động học tương ứng trong (6.47) có các tính chất vật lý hoàn toàn thỏa mãn về giả thiết của hệ thống phi tuyến MIMO (6.1). Vậy, đồ thị truyền thông phân tán, các thủ tục biến đổi từ phương trình (6.5) đến (6.13) có thể sử dụng để tìm động học bám hợp tác trong bài toán robot bầy đàn và sau đó giải thuật ORADP mở rộng cho nhiều hệ phi tuyến MIMO hợp tác có thể áp dụng trực tiếp được cho bài toán điều khiển thích nghi bền vững đồng bộ hóa robot bầy đàn.

Một phần của tài liệu LUẬN ÁN TIẾN SĨ NGHIÊN CỨU GIẢI THUẬT HỌC CỦNG CỐ TRONG ĐIỀU KHIỂN THÍCH NGHI BỀN VỮNG CHO HỆ PHI TUYẾN (Trang 120)

Tải bản đầy đủ (PDF)

(175 trang)