Nghiên cứu phát triển một số thuật toán diều khiển rô bốt di động có tính đến ảnh hưởng của trượt bánh xeNghiên cứu phát triển một số thuật toán diều khiển rô bốt di động có tính đến ảnh hưởng của trượt bánh xeNghiên cứu phát triển một số thuật toán diều khiển rô bốt di động có tính đến ảnh hưởng của trượt bánh xeNghiên cứu phát triển một số thuật toán diều khiển rô bốt di động có tính đến ảnh hưởng của trượt bánh xeNghiên cứu phát triển một số thuật toán diều khiển rô bốt di động có tính đến ảnh hưởng của trượt bánh xeNghiên cứu phát triển một số thuật toán diều khiển rô bốt di động có tính đến ảnh hưởng của trượt bánh xeNghiên cứu phát triển một số thuật toán diều khiển rô bốt di động có tính đến ảnh hưởng của trượt bánh xeNghiên cứu phát triển một số thuật toán diều khiển rô bốt di động có tính đến ảnh hưởng của trượt bánh xeNghiên cứu phát triển một số thuật toán diều khiển rô bốt di động có tính đến ảnh hưởng của trượt bánh xeNghiên cứu phát triển một số thuật toán diều khiển rô bốt di động có tính đến ảnh hưởng của trượt bánh xe
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-
Nguyễn Văn Tính
NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ THUẬT TOÁN ĐIỀU KHIỂN RÔ BỐT DI ĐỘNG CÓ TÍNH ĐẾN ẢNH
HƯỞNG CỦA TRƯỢT BÁNH XE
LUẬN ÁN TIẾN SĨ KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA
Hà Nội – 2018
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-
Nguyễn Văn Tính
NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ THUẬT TOÁN ĐIỀU KHIỂN RÔ BỐT DI ĐỘNG CÓ TÍNH ĐẾN ẢNH
HƯỞNG CỦA TRƯỢT BÁNH XE
Chuyên ngành: Kỹ thuật điều khiển và tự động hóa
Mã số: 9.52.02.16
LUẬN ÁN TIẾN SĨ KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1 TS Phạm Minh Tuấn
Hà Nội – 2018
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan rằng đây là công trình nghiên cứu của riêng tôi Các kết quả được viết chung với các tác giả khác đều được sự đồng ý của họ trước khi đưa vào luận án Các kết quả trong luận án là trung thực và chưa từng công bố trong bất kỳ công trình nào khác
Tác giả luận án
Nguyễn Văn Tính
Trang 4thành luận án đúng tiến độ và chất lượng theo quy định của Bộ Giáo dục và Đào tạo
Tôi xin gửi lời cảm ơn chân thành tới Ban Lãnh đạo Học viện Khoa học và Công nghệ, Viện Công nghệ thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt Nam, Phòng Công nghệ tự động hóa đã tạo điều kiện thuận lợi cho Tôi trong quá trình học tập và nghiên cứu khoa học hàn lâm của Tôi
Tôi xin cảm ơn các cán bộ đồng nghiệp Phòng Công nghệ Tự động hóa - Viện Công nghệ thông tin Đặc biệt, Tôi muốn gửi lời tri ân để bày tỏ lòng ngưỡng mộ và kính trọng sâu sắc tới PGS.TS Thái Quang Vinh, một Cán bộ đồng nghiệp bậc tiền bối rất bao dung và đáng kính đã luôn động viên Tôi trong những lúc gian nan sóng gió để Tôi luôn vững tâm và kiên định trên con đường nghiên cứu khoa học hàn lâm, tạo mọi điều kiện thuận lợi nhất để Tôi có thể tập trung nghiên cứu khoa học và học tập tiếp thu kiến thức hàn lâm trong quá trình làm nghiên cứu sinh tiến sĩ
Cuối cùng, tôi xin chân thành cảm ơn đến gia đình, người thân, các bạn đồng nghiệp - những người luôn dành cho tôi những tình cảm nồng ấm, luôn động viên và
sẻ chia những lúc khó khăn trong cuộc sống và tạo điều kiện tốt nhất để tôi có thể hoàn thành quá trình nghiên cứu tiến sĩ
Hà Nội, ngày 24 tháng 10 năm 2018
Tác giả luận án
Nguyễn Văn Tính
Trang 5MỤC LỤC
DANH MỤC CÁC BẢNG 7
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ 8
DANH MỤC CÁC KÝ HIỆU 10
DANH MỤC CÁC CHỮ VIẾT TẮT 12
MỞ ĐẦU 13
Tính cấp thiết của đề tài 13
Các vấn đề nghiên cứu của luận án 13
Đối tượng nghiên cứu 14
Mục đích nghiên cứu 14
Phương pháp nghiên cứu 14
Ý nghĩa khoa học và thực tiễn của đề tài 14
Bố cục của luận án 15
CHƯƠNG 1 TỔNG QUAN VÀ MÔ HÌNH TOÁN HỌC 16
1.1 Đặt vấn đề 16
1.2 Tình hình nghiên cứu trong nước 18
1.3 Tình hình nghiên cứu ngoài nước 19
1.4 Mô hình động học 21
1.5 Mô hình động lực học 23
1.6 Kết luận Chương 1 26
CHƯƠNG 2 THIẾT KẾ LUẬT ĐIỀU KHIỂN BÁM THÍCH NGHI DỰA TRÊN MẠNG NƠ RON BA LỚP 28
2.1 Đặt vấn đề 28
2.2 Cấu trúc mạng nơ ron ba lớp 29
2.3 Phát biểu bài toán 30
2.4 Mô tả biến đầu ra và FTE 31
2.5 Cấu trúc bộ điều khiển 33
2.7 Kết quả mô phỏng 38
2.8 Kết luận Chương 2 41
Trang 6CHƯƠNG 3 THIẾT KẾ LUẬT ĐIỀU KHIỂN BACKSTEPPING DỰA TRÊN
MẠNG SÓNG GAUSSIAN 43
3.1 Đặt vấn đề 43
3.2 Mô tả cấu trúc của mạng sóng Gaussian 45
3.3 Thiết kế luật điều khiển động học 46
3.4 Thiết kế luật điều khiển động lực học 47
3.5 Phân tích tính ổn định 50
3.6 Kết quả mô phỏng 55
3.7 Kết luận chương 3 59
CHƯƠNG 4 THIẾT KẾ LUẬT ĐIỀU KHIỂN THÍCH NGHI BACKSTEPPING HỘI TỤ HỮU HẠN Ở CẤP ĐỘ ĐỘNG LỰC HỌC 60
4.1 Đặt vấn đề 60
4.2 Mô tả cấu trúc của RBFNN 62
4.3 Thiết kế luật điều khiển động học 64
4.4 Thiết kế luật điều khiển động lực học 65
4.5 Phân tích tính ổn định 67
4.6 Kết quả mô phỏng 72
4.7 Kết luận Chương 4 77
KẾT LUẬN VÀ KIẾN NGHỊ 79
Những nội dung nghiên cứu chính của luận án 79
Những đóng góp của luận án 79
Định hướng nghiên cứu phát triển 80
DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ 81
TÀI LIỆU THAM KHẢO 82
PHỤ LỤC SƠ ĐỒ KHỐI MATLAB/SIMULINK CỦA CÁC HỆ THỐNG ĐIỀU KHIỂN VÒNG KÍN 87
Trang 7DANH MỤC CÁC BẢNG
Bảng 2.1 Các tham số của rô bốt di động [21] 39 Bảng 2.2 So sánh các điểm khác biệt giữa hai phương pháp điều khiển 42
Trang 8DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 1.1 Mối liên hệ giữa các bài toán nghiên cứu trong lĩnh vực rô bốt di động 17
Hình 1.2 Mô tả góc trượt trên xe tự hành kiểu 4 bánh bị trượt bánh xe 20
Hình 1.3 Một rô bốt di động và hiện tượng trượt bánh xe 21
Hình 2.1 Cấu trúc của mạng nơ ron 3 lớp 28
Hình 2.2 Tọa độ của mục tiêu trong hệ tọa độ gắn thân rô bốt M-XY 30
Hình 2.3 Sơ đồ khối của toàn bộ hệ thống điều khiển vòng kín 32
Hình 2.4 Đồ thị của các tốc độ trượt theo thời gian 38
Hình 2.5 So sánh hiệu năng bám giữa hai phương pháp trong Ví dụ 4.1 40
Hình 2.6 So sánh các sai lệch bám vị trí trong Ví dụ 4.1 40
Hình 2.7 Các mô men quay trong Ví dụ 4.1 giữa hai phương pháp điều khiển 41
Hình 3.1 Sơ đồ khối của phương pháp điều khiển trong chương 3 44
Hình 3.2 Cấu trúc của mạng sóng Gaussian – GWN 44
Hình 3.3 So sánh các quỹ đạo trong ví dụ 3.1 56
Hình 3.4 So sánh các sai lệch bám vị trí e1,2 trong Ví dụ 3.1 giữa hai phương pháp điều khiển trong Chương 2 và Chương 3 57
Hình 3.5 So sánh mô men quay giữa hai phương pháp điều khiển 58
Hình 3.6 Đánh giá hiệu quả của biện pháp xử lý chattering ở cả hai bánh xe 58
Hình 4.1 Khả năng đáp ứng của động cơ đối với đầu ra của bộ điều khiển 60
Hình 4.2 Sơ đồ khối của phương pháp điều khiển trong Chương 4 63
Hình 4.3 Cấu trúc mạng nơ ron RBFNN 63
Hình 4.4 So sánh hiệu năng bám quỹ đạo giữa phương pháp điều khiển mới này với phương pháp điều khiển ở Chương 3 73
Hình 4.5 So sánh sai lệch vị trí giữa 2 phương pháp điều khiển 75
Hình 4.6 so sánh sai lệch bám vận tốc góc ở bánh PHẢI và bánh TRÁI giữa hai phương pháp điều khiển 76
Hình 4.7 So sánh các mô men quay của hai phương pháp điều khiển 77
Hình P.1 Sơ đồ khối Matlab/Simulink mô tả mô hình của rô bốt di động 87
Hình P.2 Sơ đồ khối mô tả mô hình động lực học của rô bốt di động 87
Hình P.3 Sơ đồ khối mô tả mô hình động học của rô bốt di động 88
Hình P.4 Sơ đồ khối Matlab/Simulink của luật điều khiển ở Chương 2, 3, 4 88
Hình P.5 Sơ đồ khối của bộ điều khiển trong Chương 2 89
Trang 9Hình P.6 Sơ đồ khối của mạng nơ ron 3 lớp (với tên nhãn neural network) trong
Chương 2 89
Hình P.7 Sơ đồ khối bộ điều khiển kiểu backstepping ở các Chương 3 và 4 90 Hình P.8 Sơ đồ khối bộ điều khiển ở vòng động lực học phía trong ở Chương 3 90 Hình P.9 Sơ đồ khối mô tả thành phần bền vững cấp động lực học ở Chương 3 91 Hình P.10 Sơ đồ khối của bộ điều khiển động học phía ngoài trong Chương 3 91 Hình P.11 Sơ đồ khối của thành phần bền vững động học trong Chương 3 91 Hình P.12 Sơ đồ khối của bộ điều khiển ở vòng động lực học trong Chương 4 92 Hình P.13 sơ đồ khối của thành phần bền vững động lực học trong Chương 4 92 Hình P.14 Sơ đồ khối của bộ điều khiển động học phía ngoài ở Chương 4 93 Hình P.15 Sơ đồ khối của thành phần bền vững động học ở Chương 4 93
Trang 10b Một nửa khoảng cách giữa hai bánh xe chủ động m
Vận tốc tịnh tiến của rô bốt di động khi không tồn tại
M trung điểm của trục nối hai bánh xe chủ động
G Trọng tâm của phần cứng rô bốt di động
Trang 11R
Tọa độ của trượt ngang dọc theo trục bánh xe m
I Mô men quán tính của phần cứng quanh trục thẳng đứng
đi xuyên qua trọng tâm G
Trang 12DANH MỤC CÁC CHỮ VIẾT TẮT
GWN Gaussian Wavelet Network- mạng sóng Gaussian
RBFNN Radial Basis Function Neural Network
UUB Uniformly Ultimately Bounded (Bị chặn đều bền vững)
WMR Wheeled Mobile Robot – rô bốt di động kiểu bánh xe
FTE Filtered Tracking Errors – Các sai số bám được lọc
Trang 13MỞ ĐẦU
Tính cấp thiết của đề tài
Có một sự thật không thể phủ nhận rằng các rô bốt di động có khả năng làm
việc trong một phạm vi rộng và có thể thao tác tự động một cách thông minh mà không cần bất cứ sự tác động nào từ con người Đặc biệt, chúng có khả năng thay thế con người trong các nhiệm vụ khó khăn và nguy hiểm như tìm kiếm cứu nạn, cứu hỏa, tìm kiếm và tháo gỡ bom mìn, vận chuyển vật liệu trong môi trường độc hại, thám hiểm, trinh sát, giám sát an ninh, vân vân … với chi phí rẻ hơn nhiều so với người Bởi vậy, chúng được ứng dụng ngày càng phổ biến trong các lĩnh vực như công nghiệp, giải trí, chăm sóc sức khỏe, logistics, …
Có rất nhiều loại rô bốt di động khác nhau như rô bốt di động kiểu chân sinh học, rô bốt di động kiểu bánh xích, rô bốt di động kiểu bánh xe, … Mỗi loại đều có những đặc điểm phi tuyến cố hữu riêng và trong từng ứng dụng cụ thể đều có những
ưu, nhược điểm nhất định Cụ thể, ưu điểm của rô bốt di động kiểu chân là có khả năng di chuyển trên địa hình gồ ghề như cầu thang, đồi núi, … nhưng lại phức tạp về mặt cấu trúc cũng như phương pháp điều khiển, chẳng hạn như mỗi chân rô bốt phải
có số bậc tự do đủ lớn để tạo ra khả năng di động, phải có khả năng nâng hạ trọng lượng của chính rô bốt, vân vân Rô bốt di động kiểu bánh xích và kiểu bánh xe không
có khả năng leo trèo vượt địa hình gồ ghề như kiểu chân nhưng lại có cấu trúc đơn giản cũng như có khả năng vận chuyển hàng hóa khối lượng lớn với chi phí năng lượng rẻ hơn So với rô bốt kiểu bánh xích, rô bốt kiểu bánh xe được ứng dụng phổ
biến hơn rất nhiều trong thực tiễn Do vậy, đề tài này tập trung nghiên cứu các bài toán thiết kế các luật điều khiển cho rô bốt di động kiểu bánh xe
Các vấn đề nghiên cứu của luận án
Tác giả tập trung nghiên cứu các phương pháp điều khiển mới để bù trượt cho
rô bốt di động khi tồn tại trượt bánh xe, bất định mô hình, và nhiễu ngoài
Trang 14Đối tượng nghiên cứu
Để dễ dàng kiểm chứng tính đúng đắn và hiệu năng của các luật điều khiển được đề xuất, rô bốt di động 03 bánh xe được lựa chọn làm đối tượng nghiên cứu Cụ thể, rô bốt di động kiểu 03 bánh xe này bao gồm 02 bánh chủ động điều khiển vi phân, 01 bánh thụ động được sử dụng để làm điểm tựa tạo thế cân bằng trọng lực
Mục đích nghiên cứu
Đề xuất một số phương pháp điều khiển mới để bù ảnh hưởng tiêu cực của bất định mô hình, nhiễu ngoài, và trượt bánh xe
Phương pháp nghiên cứu
Phương pháp nghiên cứu được thể hiện qua trình tự công việc như sau:
Phân tích và xây dựng mô hình động học và động lực học của rô bốt di động khi tồn tại các bất định mô hình, nhiễu ngoài, và trượt bánh xe
Nghiên cứu, phân tích các phương pháp điều khiển tiên tiến trong và ngoài nước cho rô bốt di động trong sự hiện diện của bất định mô hình, nhiễu ngoài, và trượt bánh xe Sau đó, đề xuất các phương pháp điều khiển mới
Chứng minh tính đúng đắn và hiệu quả của các phương pháp điều khiển mới bằng tiêu chuẩn ổn định Lyapunov và bổ đề Barbalat
Tiến hành kiểm chứng các phương pháp điều khiển nói trên băng công
cụ Matlab/Simulink
Ý nghĩa khoa học và thực tiễn của đề tài
Ý nghĩa khoa học: Xây dựng các phương pháp điều khiển mới cho rô bốt di động để bù ảnh hưởng tiêu cực của bất định mô hình, nhiễu ngoài, và trượt bánh xe
Ý nghĩa thực tiễn: Các phương pháp điều khiển được đề xuất trong luận án
này có thể được triển khai ứng dụng cho các rô bốt di động trong nhà kho với mặt sàn trơn hoặc có thể được triển khai ứng dụng cho các xe tự hành trong các nông trường
với nền đất ẩm ướt dễ trơn trượt
Trang 15Bố cục của luận án
Chương 1: Trình bày tổng quan các nghiên cứu trong và ngoài nước liên quan
đến nội dung nghiên cứu của luận án trong những năm gần đây Sau đó, mô hình toán học của rô bốt di động được xây dựng trong điều kiện tồn tại trượt bánh xe
Chương 2: Thiết kế luật điều khiển bám thích nghi dựa trên một mạng nơ ron
Trang 16CHƯƠNG 1 TỔNG QUAN VÀ MÔ HÌNH TOÁN HỌC
1.1 Đặt vấn đề
Trước khi thiết kế các luật điều khiển thì các nhà nghiên cứu cần phải có kiến thức tổng quan về các kết quả nghiên cứu trên khắp thế giới về chủ đề này và cũng phải có hiểu biết về mô hình động học cũng như động lực học của đối tượng cần điều khiển Do vậy, nội dung của chương này mô tả khái quát về tổng quan kết quả nghiên cứu liên quan đến chủ đề của luận án Sau đó, các mô hình động học và động lực học của rô bốt di động chịu ảnh hưởng tiêu cực của trượt bánh xe được xây dựng
Các rô bốt di động kiểu bánh xe được trang bị các phần tử chấp hành, các cảm biến, một máy tính on-board, … để nó có khả năng di chuyển tự động thông minh mà không cần sự tác động từ con người Nghiên cứu về rô bốt di động được chia ra làm
4 bài toán chính: thiết kế quỹ đạo, điều khiển chuyển động, định vị, và truyền thông Chúng có thể được mô tả như Hình 1.1
Bài toán định vị là bài toán phối kết hợp các cảm biến để ước lượng vị trí, hướng, vận tốc, và gia tốc của rô bốt di động trong thời gian thực
Bài toán truyền thông là bài toán thiết lập kênh giao tiếp giữa rô bốt di động này với rô bốt di động khác hoặc giữa rô bốt di động với các thiết bị khác trong môi trường hoạt động
Thiết kế quỹ đạo là một bài toán quan trọng trong lĩnh vực rô bốt di động, đặc biệt trong môi trường có nhiều vật cản Trong bài toán này, bộ điều khiển cần tìm ra một quỹ đạo tối ưu để rô bốt di động đi từ điểm xuất phát đến điểm đích mà không
có va chạm với bất kỳ vật cản nào Hơn nữa, khi một rô bốt di động chạy theo các quỹ đạo được xây dựng từ trước một cách lặp đi lặp lại, tìm kiếm quỹ đạo phù hợp nhất cũng ảnh hưởng tới tính hiệu quả và chi phí năng lượng của nó, đặc biệt là các
xe nông nghiệp Bởi vậy, thiết kế quỹ đạo có thể được xem như một dạng của bài toán tối ưu trong điều kiện có các ràng buộc nhất định như tránh vật cản, Bài toán
thiết kế quỹ đạo có thể được chia làm hai lớp: thiết kế quỹ đạo toàn cục và thiết kế quỹ đạo cục bộ Trong thiết kế quỹ đạo toàn cục, toàn bộ thông tin về môi trường
hoạt động của rô bốt di động đều được biết, bởi vậy quỹ đạo được thiết kế tĩnh từ
Trang 17trước và môi trường không có sự thay đổi theo thời gian Trong khi đó, trong thiết kế quỹ đạo cục bộ, chỉ một phần thông tin về môi trường được biết hoặc không có chút thông tin nào về môi trường Trong phương pháp thiết kế quỹ đạo cục bộ, quỹ đạo luôn được thiết kế động dựa theo thông tin cảm biến về các vật cản được thu thập online Bởi vậy, phương pháp thiết kế quỹ đạo cục bộ là phù hợp hơn và có ý nghĩa thực tiễn hơn phương pháp toàn cục, bởi vì môi trường thường thay đổi theo thời gian
và rất khó để được mô tả chính xác từ trước
Sau khi quỹ đạo được thiết kế, bài toán điều khiển chuyển động được chú ý đến để làm sao cho rô bốt phải bám theo quỹ đạo vừa được thiết kế Bài toán thiết kế
quỹ đạo kết hợp với bài toán điều khiển chuyển động được gọi là bài toán navigation
Bài toán điều khiển chuyển động cực kỳ quan trọng trong lĩnh vực rô bốt di động, bởi vì hiệu năng của các luật điều khiển ảnh hưởng trực tiếp đến hiệu quả của
các ứng dụng rô bốt di động trong sản xuất và đời sống Do vậy, bài toán này được lựa chọn làm mục tiêu nghiên cứu của luận án này
Hình 1.1 Mối liên hệ giữa các bài toán nghiên cứu trong lĩnh vực rô bốt di động
Truyền thông
Hiểu biết về môi trường và
vị trí điểm đích mong muốn
Thiết kế quỹ đạo
Điều khiển chuyển động
Phần cứng rô bốt di động
Navigation
Trang 18Trong những thập kỷ gần đây, bài toán điều khiển chuyển động cho rô bốt di
động kiểu bánh xe đã thu hút sự chú ý của các nhà khoa học trên khắp thế giới Hiển nhiên, rô bốt di động là một trong số các hệ thống chịu ràng buộc nonholonomic [1] Hơn nữa, nó lại là một hệ thống phi tuyến nhiều vào- nhiều ra [2] Nhờ có sự tiến bộ của lý thuyết cũng như kỹ thuật điều khiển, đã có rất nhiều phương pháp điều khiển khác nhau được áp dụng để thiết kế các luật điều khiển cho rô bốt di động như: điều khiển trượt [3, 4], điều khiển bền vững [5], điều khiển thích nghi [6-8], điều khiển backstepping [9-10], tuyến tính hóa phản hồi đầu ra [11] … Các luật điều khiển này
đã được thiết kế với giả thiết “bánh xe chỉ lăn mà không trượt”
Tuy nhiên, trong thực tiễn ứng dụng, điều kiện các bánh xe chỉ lăn mà không trượt lại có thể thường xuyên bị vi phạm Tức là đã xảy ra hiện tượng trượt bánh xe
[12-13]
Có rất nhiều nguyên nhân gây ra hiện tượng này như rô bốt di chuyển trên mặt sàn có lực ma sát yếu, lực ly tâm khi rô bốt chuyển động theo đường vòng cung, … Trượt bánh xe là một trong số các nhân tố chính gây ra sự giảm sút hiệu năng điều
khiển nghiêm trọng Do vậy, trong các tình huống như vậy, nếu muốn cải thiện hiệu năng điều khiển, thì cần phải thiết kế một bộ điều khiển có khả năng bù trượt bánh
xe
1.2 Tình hình nghiên cứu trong nước
Ở Việt Nam, đến nay, đã có rất nhiều nghiên cứu về xe tự hành như nhóm tác giả ở Đại học Giao Thông Vận Tải nghiên cứu về rô bốt di động di chuyển kiểu bầy đàn [14-15]
Các nhóm tác giả ở Đại học Cần Thơ [16], Đại học Thái Nguyên [17] nghiên cứu về điều khiển xe tự cân bằng, …
Một nhóm nghiên cứu ở Đại học Bách Khoa Hà Nội đã nghiên cứu về xây dựng mô hình cho một ô tô điện 04 bánh khi có tính đến tương tác bánh xe - mặt đường [18]
Tuy nhiên, chưa có nhiều kết quả nghiên cứu về điều khiển bù trượt bánh xe cho rô bốt di động được công bố
Trang 191.3 Tình hình nghiên cứu ngoài nước
Trên thế giới, đã có rất nhiều báo cáo nghiên cứu về điều khiển bù trượt bánh
xe cho rô bốt di động Bởi vì trượt bánh xe có thể làm hệ thống mất ổn định hoặc giảm hiệu năng điều khiển nghiêm trọng nên nó phải được ngăn chặn Thông thường,
để điều khiển bù trượt bánh xe, các thông tin đo lực ma sát và tốc độ trượt phải luôn được cập nhật theo thời gian thực và chính xác Cụ thể, trong [12] các tác giả đã bù trượt bánh xe bằng cách bù tỷ số trượt bánh xe Các gia tốc kế đã được sử dụng trong [13] để bù trượt bánh xe trong thời gian thực Nghiên cứu trong [19] đã phát triển một
bộ điều khiển bền vững xử lý cả tốc độ trượt lẫn gia tốc trượt bằng cách sử dụng hệ tọa độ của độ phẳng vi phân Trong [20], các tác giả đã đề xuất một hệ thống điều khiển phanh để chống trượt ngang cho bánh xe máy bay thương mại bằng phương pháp backstepping Trong [21], Sidek và cộng sự đã phát triển một bộ điều khiển tuyến tính hóa vào ra để biểu diễn mối quan hệ giữa mô men quay ở động cơ chấp hành với hàm số lực kéo của trượt bánh xe Nghiên cứu trong [22-23], các tác giả đã
xử lý trượt bánh xe như một nhiễu bị chặn tác động lên trạng thái hệ thống điều khiển Trong [24], một bộ điều khiển kiểu chế độ trượt rời rạc được sử dụng cho nhiệm vụ bám quỹ đạo dưới điều kiện tồn tại trơn trượt bánh xe Trong [25], các tác giả đã tách riêng trượt dọc và trượt ngang, rồi sau đó thiết kế các luật điều khiển riêng rẽ để lần lượt bù trượt dọc và trượt ngang Các kỹ thuật đo khác nhau để ước lượng tốc độ trượt bánh xe đã được báo cáo trong các bài báo [26-28] Trong [29], mô hình ma sát giữa bánh xe và mặt đường được khảo sát rất tỷ mỷ và một hệ thống giám sát và ước lượng
hệ số ma sát được đề xuất Tuy nhiên, hệ thống giám sát này rất phức tạp và cần đến
sự phối kết hợp của nhiều cảm biến tinh vi đắt tiền Do vậy, giá thành của hệ thống giám sát ma sát này cũng rất đắt
Trong [30], các tác giả đã mô hình hóa rô bốt di động như một hệ thống động lực học bậc ba kèm theo một ràng buộc nonholonomic bậc hai Các phép đo của trượt bánh xe được giả sử là có sẵn để thiết kế luật điều khiển Nhược điểm của giả sử này
là sự đòi hỏi các phép đo bổ sung như gyroscope, gia tốc kế, bộ ước lượng hệ số ma sát … Trong [31], một bộ điều khiển bám bền vững đã được đề xuất mà ở đó nhiễu ngoài, trượt bánh xe, đã được ước lượng nhờ sử dụng một bộ quan sát trạng thái mở rộng Trong [32], tác giả đề xuất một bộ điều khiển dựa trên một bộ ước lượng nhiễu
Trang 20ngoài do trượt bánh xe gây ra Trong [33], một bộ điều khiển thích nghi bám được đề xuất cho rô bốt di động trong sự hiện diện của các ngoại lực và trượt bánh xe Các bất định do trượt bánh xe và ngoại lực được bù bằng một mạng nơ ron ba lớp với một luật cập nhật trọng số linh hoạt Luật cập nhật trọng số linh hoạt này được xây dựng dựa trên nguyên lý làm một hàm mục tiêu đạt giá trị nhỏ nhất
Hình 1.2 Mô tả góc trượt trên xe tự hành kiểu 4 bánh bị trượt bánh xe
Các phương pháp điều khiển dựa vào tín hiệu định vị toàn cầu được nghiên
cứu và đề xuất trong [34-35] lần lượt cho các bài toán bám mục tiêu di động và bám
đường của một rô bốt di động kiểu bánh xe bốn bánh
Đối với xe tự hành trong nông nghiệp, phần lớn các phương pháp điều khiển
phải dựa vào giá trị đo của góc trượt, một góc được tạo bởi giữa trục dọc của xe tự hành với hướng véc tơ tịnh tiến như Hình 1.2 Năm 2009, Lenain và các cộng sự đã
giới thiệu một bộ quan sát góc trượt hỗn hợp động học và động lực học trong [36] Trong [37-38], các phương pháp ước lượng góc trượt dựa trên một bộ lọc Kalman
mở rộng đã được đề xuất Sau đó, góc trượt đã được ước lượng cho các thí nghiệm chuyển động khác nhau Năm 2009, Grip và cộng sự [39] đã xây dựng một bộ quan sát góc trượt phi tuyến bằng cách sử dụng các đặc tính động học và động lực học của một xe tự hành Nhờ có bộ quan sát này mà góc trượt và các tham số ma sát đã được ước lượng trong thời gian thực Cụ thể, các gia tốc trong các hướng dọc và ngang, vận tốc góc, góc điều hướng, thông tin vận tốc góc đã được sử dụng cho quá trình ước lượng này Tuy nhiên, phương pháp ước lượng này chưa được kiểm chứng qua một rô bốt thực mà chỉ dừng lại ở bước mô phỏng máy tính
Góc trượt
Trang 211.4 Mô hình động học
Xét một rô bốt di động kiểu bánh xe chịu ràng buộc nonholonomic như Hình
1.3 Cụ thể, G(xG, yG) là vị trí của tâm khối của phần cứng rô bốt di động M(xM, yM)
là trung điểm của đoạn trục thẳng nối hai bánh xe F1, F2 là các ma sát dọc giữa bánh
phải và bánh trái với mặt sàn F3 là tổng lực ma sát tác động theo hướng ngang ở hai điểm tiếp xúc của hai bánh xe với mặt sàn
F4 và lần lượt là ngoại lực và ngoại mô men tác động lên phần cứng di động
ở điểm G b là một nửa khoảng cách giữa hai bánh xe a là khoảng cách giữa điểm M
và điểm G θ là tọa độ hướng của rô bốt di động
Hình 1.3 Một rô bốt di động và hiện tượng trượt bánh xe
Khi không tồn tại trượt bánh xe, vận tốc tịnh tiến và vận tốc góc lần lượt được tính như sau [22]:
trong đó R, L lần lượt là tọa độ góc của bánh phải và bánh trái
Bởi vậy, động học của rô bốt di động này được biểu diễn như sau [4]:
Phần cứng
θ
Trang 22M M
cossin
x y
Ràng buộc nonholonomic của rô bốt di động đảm bảo hai yếu tố như sau:
Hướng của chuyển động tịnh tiến luôn vuông góc với trục nối hai bánh
x y
Trang 23trong đó IW, ID lần lượt là hệ số mô men quán tính của mỗi bánh xe xung quanh
trục quay và trục đường kính; r là bán kính của mỗi bánh xe
Các phương trình ràng buộc nonholonomic có thể được biểu diễn lại như sau [21]:
Trang 24Rõ ràng thế năng của toàn hệ thống bằng không Do vậy, hàm Lagrange L chính bằng tổng động năng của cả cơ hệ này, tức L = K Tiếp theo, phương trình
Lagrange có thể được viết như sau [21]:
T d
τ là véc tơ đầu vào với R, L lần lượt là
mô men điều khiển ở bánh phải và bánh trái τd là véc tơ biểu diễn cả bất định mô hình và nhiễu ngoài (F4 và ) N là một ma trận đầu vào Giải phương trình Lagrange
này, ta thu được kết quả sau [21]:
T d
Trang 25I là một ma trận đơn vị ij, và 0i j là một ma trận không ij Thay (1.22) vào
(1.20), và sau đó nhân kết quả của phương trình mới với T
Trang 26r m
ar m b
,
1 02
ar m
,
1 02
ar m
và hệ số ma sát giữa bánh xe và mặt đường [29] luôn được đo chính xác trong thời
gian thực Hiển nhiên, các đại lượng gồm gia tốc tịnh tiến, gia tốc góc, vận tốc tịnh tiến, vận tốc góc đều có thể được đo trực tiếp một cách dễ dàng qua các cảm biến
rẻ tiền, nhưng góc trượt và hệ số ma sát lại rất khó để đo [40] Để đo được các tín
hiệu này chính xác và đảm bảo tin cậy, hệ thống phải được tích hợp thêm các cảm
Trang 27biến phức tạp và đắt tiền [40] Ví dụ, để đo góc trượt, thì các tác giả trong [36-39]
phải sử dụng các bộ ước lượng rất phức tạp đòi hỏi sự phối kết hợp của nhiều cảm
biến tinh vi đắt tiền Tiếp theo, để ước lượng hệ số ma sát, các tác giả trong [29] phải
dùng đến một hệ thống giám sát lực ma sát giữa bánh xe và mặt đường Hệ thống này
có cấu trúc rất phức tạp và đòi hỏi sự phối kết hợp của rất nhiều cảm biến tinh vi đắt
tiền với nhau
Các phương pháp điều khiển được đề xuất trong luận án sẽ hướng tới không
sử dụng các cảm biến đo góc trượt và hệ số ma sát Thay vào đó, ảnh hưởng tiêu
cực từ trượt bánh xe lên hiệu năng điều khiển bám sẽ được bù một cách gián tiếp
trong các bộ điều khiển
Ở chương này, mô hình động học và động lực học của rô bốt 3 bánh xe chịu
tác động nhiễu ngoài, trượt bánh xe đã được xây dựng thành công Các mô hình này
sẽ được sử dụng để thiết kế các luật điều khiển bù trượt bánh xe, bất định mô hình,
và nhiễu ngoài ở các chương sau
Nội dung của Chương này được trích dẫn từ tài liệu công bố số 3
Trang 28CHƯƠNG 2 THIẾT KẾ LUẬT ĐIỀU KHIỂN BÁM THÍCH NGHI DỰA
TRÊN MẠNG NƠ RON BA LỚP 2.1 Đặt vấn đề
Sau khi có được mô hình động học và động lực học như ở Chương 1, ở Chương
2 này, một phương pháp điều khiển bám thích nghi dựa trên mạng nơ ron ba lớp được thiết kế để điều khiển rô bốt di động kiểu bánh xe trong điều kiện tồn tại trượt bánh
Để tránh nhược điểm này, bộ điều khiển mới được đề xuất ở đây được thiết kế trong hệ tọa độ thân rô bốt MXY Khi đó, các biến vận tốc của rô bốt có thể được đo trực tiếp thông qua các cảm biến rẻ tiền nhưng có độ tin cậy cao Bên cạnh đó, các vận tốc và gia tốc của trượt bánh xe đều không cần phải đo Thay vào đó, các ảnh hưởng tiêu cực của chúng sẽ được bù bằng một luật điều khiển có sử dụng mạng nơ ron ba lớp
Hình 2.1 Cấu trúc của mạng nơ ron 3 lớp
Trang 292.2 Cấu trúc mạng nơ ron ba lớp
Hiển nhiên rằng các mạng nơ ron nhân tạo có khả năng xấp xỉ các hàm phi tuyến đủ trơn với một độ chính xác tùy ý [8] Trong tiểu mục này, một mạng nơ ron nhân tạo 3 lớp được giới thiệu khái quát Như được minh họa trong Hình 2.1, đầu ra của của mạng nơ ron này được tính như sau 3 T
V lần lượt là các ma trận trọng số mạng nơ ron kết nối từ lớp đầu vào tới lớp
ẩn và từ lớp ẩn tới lớp đầu ra (xem Hình 2.1)
là hàm lõi của mạng nơ ron 3 lớp này Trong Chương này, hàm lõi này được
lựa chọn là kiểu sigmoid như sau:
trong đó N N1, 2 và N3 lần lượt là số lượng của các nơ ron lớp đầu vào, lớp ẩn, và
lớp đầu ra Tiếp theo, w và ij v là các trọng số linh hoạt có thể được điều chỉnh online ij
wj
và vi lần lượt là các giá trị điều chỉnh trực tiếp của lớp ẩn và lớp đầu ra
Đáng chú ý rằng 1 đã được gán như phần tử thứ nhất của véc tơ x, điều này
cho phép ta định nghĩa véc tơ v1, v2, ,vN1T như hàng thứ nhất của ma trận V
Tương tự, z chứa 1 như phần tử thứ nhất để
hợp như hàng thứ nhất của ma trận W Vì thế, bất kỳ sự điều chỉnh nào của W và V
đều bao gồm sự điều chỉnh của tất cả w , ij v , ij wj, và vi
Trang 30Xét một hàm liên tục N 1 N 3
f x R R Tồn tại các ma trận trọng số lý tưởng, W* và V , sao cho
T T
trong đó ε là véc tơ của các sai lệch xấp xỉ tối ưu
Giả sử 2.1: ε là bị chặn [8] Cụ thể, ε b với b là một hằng số dương hữu
hạn nào đó
Coi f x W V , ˆ ˆ, y x W V, ˆ ˆ, W σ V x là một ước lượng của f(x) Trong ˆ T ˆT
đó Wˆ và ˆV lần lượt là các ma trận ước lượng của W* và V ; chúng đều được cập nhật online bởi các thuật toán điều chỉnh trọng số online
Để thuận tiện, ta ký hiệu T
2.3 Phát biểu bài toán
Hình 2.2 Tọa độ của mục tiêu trong hệ tọa độ gắn thân rô bốt M-XY
Trang 31Gọi D(xD, yD) là mục tiêu đang di chuyển theo một quỹ đạo mong muốn với một vận tốc tịnh tiến được định nghĩa trước (xem Hình 2.2) Không mất tính tổng quát, phương trình chuyển động của D được mô tả như sau:
cos( ) sin( )
sao cho cả vị trí và hướng thực (xP, yP, ) bám theo vị trí và hướng mong muốn (xPd,
yPd, d) không thể được giải quyết với một hiệu năng có thể chấp nhận được [32]
Nhưng, nếu ta điều khiển rô bốt sao cho vị trí thực (xP, yP) bám theo mục tiêu D(xD,
yD) thì bài toán điều khiển hoàn toàn có thể được giải quyết mặc dù tồn tại cả trượt dọc và trượt ngang [32]
2.4 Mô tả biến đầu ra và FTE
Một véc tơ của các biến đầu ra được mô tả trong hệ tọa độ M-XY như sau:
x y
Trang 32Gọi ζd là véc tơ mong muốn của ζ Dựa vào yêu cầu bài toán điều khiển bám
nói trên và Hình 2.2, hoàn toàn có thể tính được d
e e
WMR chịu trượt bánh xe
v
Phương trình (2.14)
Trang 33
2.5 Cấu trúc bộ điều khiển
Trước tiên, sơ đồ khối của toàn bộ hệ thống điều khiển vòng kín được đề xuất như Hình 2.3
Nếu ma trận h khả nghịch, thì ta có thể biểu diễn lại (2.8) như sau:
Ψ trong (2.13) phụ thuộc trực tiếp vào vận tốc và gia tốc trượt bánh xe, nên
nó là bất định Vì thế, để biểu diễn (2.13) theo động lực học của biến FTE φ , một
biến phụ được đề xuất như sau:
2
Mh φ τ Mh φ Mκ Bv d Mh Ψ (2.16) trong đó MM M với ˆ ˆ M là một ma trận ước lượng của M
Trang 34Chú ý 2.3: Trong thực tiễn, các vận tốc trượt bánh xe phụ thuộc vào vận tốc
dài và vận tốc góc của rô bốt di động [32]
Nhân cả hai vế của (2.16) với ˆ 1
hM được như sau
thị các bất định mô hình và nhiễu ngoài
Tiếp theo, ta có thể chọn một luật điều khiển bằng phương pháp tính mô men như sau:
Mặt khác, ta có thể khai triển chuổi Taylor xung quanh ˆV đối với một x đã
được biết trước như sau:
V và O V x biểu thị thành phần bậc hai và cao hơn trong T
chuỗi Taylor, VV*Vˆ
Trang 35Ta ký hiệu σ σ - σ σV x O V x Lấy cả hai vế (2.21) cộng và trừ ˆ T T T
đều có thể được lựa chọn tùy ý Các số hạng đầu tiên trong (2.24) và (2.25) là các thành phần lan truyền ngược thuần túy, các số hạng cuối, H1 φ W và ˆ
Trang 36Giả sử 2.3: ma trận tham số lý tưởng bị chặn bởi một giá trị chặn trên như sau:
M
FZ
F
là ký hiệu của chuẩn Frobenius [8]
Đáng chú ý ở đây rằng ZM chỉ được sử dụng cho mục đích phân tích tính ổn định của hệ thống
Định lý 2.1: Đối với một rô bốt di động chịu ảnh hưởng của trượt bánh xe như
được minh họa bởi mô hình động học (1.8) và mô hình động lực học (1.23), nếu luật điều khiển được mô tả bởi Hình 2.3 với tín hiệu đầu vào điều khiển được lựa chọn bởi (2.19) và các luật cập nhật trọng số mạng nơ ron được lựa chọn bởi (2.24) và (2.25), thì theo tiêu chuẩn Lyapunov và đinh lý LaSalle mở rộng [8], tín ổn định của toàn bộ hệ thống điều khiển vòng kín được đảm bảo để đạt được một hiệu năng bám mong muốn mà ở đó véc tơ sai lệch bám vị trí lọc φ sẽ hội tụ về một lân cận nhỏ tùy
ý của không trong khi tất cả các tín hiệu trong hệ thống điều khiển đều bị chặn kiểu UUB
Chứng minh: một hàm ứng viên Lyapunov được định nghĩa như sau:
trong đó tr(.) định nghĩa vết của ma trận
Lấy đạo hàm của (2.26) theo thời gian với chú ý rằng W Wˆ và V Vˆ
Trang 37Quan sát (2.33) ta nhận thấy V được đảm bảo xác định âm miễn sao biểu thức
trong ngoặc mang dấu âm Cụ thể, V 0 được đảm bảo nếu bất phương trình sau là đúng:
Áp dụng tiêu chuẩn Lyapunov và định lý mở rộng của LaSalle, φvà Z được
đảm bảo bị chặn kiểu UUB trong một tập kín như sau:
Hơn nữa, đáng chú ý rằng φ có thể được làm nhỏ một cách tùy ý thông qua
chọn K phù hợp Cụ thể, nếu K càng lớn thì φcàng nhỏ Tiếp theo, bởi vì φ và Z
bị chặn nên tất cả các tín hiệu trong hệ thống điều khiển vòng kín đều bị chặn
Trang 382.7 Kết quả mô phỏng
Để minh họa tính đúng đắn của luật điều khiển trong chương này, các mô phỏng máy tính bằng phần mềm Matlab/Simulink đã được thực hiện Rô bốt di động
được mô tả bởi các tham số trong Bảng 3.1 Hơn nữa, vì mục đích so sánh, phương
pháp của Hoang và cộng sự trong [33] cũng được mô phỏng trong cùng một điều
kiện, cụ thể là tồn tại các bất định mô hình và nhiễu ngoài (tức τd 0; M 0 ), hơn
nữa các tốc độ và gia tốc trượt bánh xe không được đo
d 3 sin 0,5t 2,5 cos 0, 4 t
τ
và ˆM0,7M , và vận tốc trượt bánh xe được biểu diễn như Hình 3.4 Ở thời điểm
ban đầu, vị trí và hướng được giả lập trong hệ O-XY là xM 0 m, yM 0 m, và
Trang 39Bảng 2.1 Các tham số của rô bốt di động [21]
I W Mô men quán tính của bánh xe xung quanh trục bánh
xe
0,0025 (kg.m2)
I D Mô men quán tính của mỗi bánh xe quanh trục thẳng
đứng đi qua tâm bánh xe
0,005 (kg.m2)
Ví dụ 2.1: Mục tiêu D di chuyển theo một đường tròn với phương trình chuyển
động được mô tả như sau:
2 3cos(0, 2 )0,5 3sin(0, 2 )
Trang 40Hình 2.5 So sánh hiệu năng bám giữa hai phương pháp trong Ví dụ 4.1
giá trị độ lớn khoảng 0,005 (m), nhưng sai lệch bám vị trí e trong phương pháp mới 2
này nhỏ hơn so với phương pháp của Hoang và cộng sự [33] với giá lớn nhất lần lượt là: 0,01 và 0,04 (m)
Hình 2.7 minh họa kết quả so sánh mô men điều khiển giữa hai phương pháp
Về cơ bản, trong giai đoạn quá độ, hai phương pháp này đòi hỏi mô men điều khiển tương đồng nhau Trong giai đoạn xác lập, phương pháp trong [33] đòi hỏi biên độ