Do đó việc nghiên cứu và nângcao chất lượng điều khiển của xe hai bánh tự cân bằng là rất cần thiết khi mô hình xe bất định và có nhiễu tác động để tăng độ an toàn cho người sử dụng, xe
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC BÁCH KHOA HÀ NỘI
TRẦN GIA KHÁNH
NGHIÊN CỨU ỨNG DỤNG ĐIỀU KHIỂN HỌC TĂNG CƯỜNG CHO XE HAI BÁNH TỰ CÂN BẰNG CÓ MÔ HÌNH BẤT ĐỊNH KHÔNG DỪNG VÀ NHIỄU CƠ CẤU
CHẤP HÀNH
LUẬN ÁN TIẾN SĨ KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA
Hà Nội - 2024
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC BÁCH KHOA HÀ NỘI
TRẦN GIA KHÁNH
NGHIÊN CỨU ỨNG DỤNG ĐIỀU KHIỂN HỌC TĂNG CƯỜNG CHO XE HAI BÁNH TỰ CÂN BẰNG CÓ MÔ HÌNH BẤT ĐỊNH KHÔNG DỪNG VÀ NHIỄU CƠ CẤU
CHẤP HÀNH
Ngành: Kỹ thuật điều khiển và tự động hóa
Mã số: 9520216
LUẬN ÁN TIẾN SĨ KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1 PGS.TS Nguyễn Hoài Nam
2 GS.TS Nguyễn Doãn Phước
Hà Nội - 2024
Trang 3LỜI CAM ĐOANTôi xin cam đoan đây là công trình nghiên cứu của cá nhân tôi dưới sự hướngdẫn của giảng viên hướng dẫn và các nhà khoa học Tài liệu tham khảo trong luận
án được trích dẫn đầy đủ Các kết quả nghiên cứu của luận án là trung thực và chưatừng được các tác giả khác công bố
Hà Nội, ngày tháng năm 2024
Trang 4LỜI CẢM ƠNTrong quá trình nghiên cứu và hoàn luận án, nghiên cứu sinh đã nhận được sựđịnh hướng, giúp đỡ và các ý kiến đóng góp về mặt chuyên môn của tập thể cácthầy hướng dẫn, các nhà khoa học và các đồng nghiệp Nghiên cứu sinh xin đượcgửi lời cảm ơn sâu sắc.
Trước hết, nghiên cứu sinh xin được bày tỏ lòng biết ơn sâu sắc tới PGS.TS.Nguyễn Hoài Nam và GS.TS Nguyễn Doãn Phước đã tận tình hướng dẫn, địnhhướng, giúp đỡ và động viên nghiên cứu sinh trong suốt quá trình nghiên cứu.Nghiên cứu sinh xin chân thành cảm ơn tới tập thể giảng viên của Bộ môn Điềukhiển tự động nay là Khoa Tự động hóa đã tạo cho tôi môi trường làm việc chuyênnghiệp, năng động và có những ý kiến góp ý chân thành, sâu sắc trong suốt quátrình nghiên cứu, xây dựng thực nghiệm cũng như từng bước thực hiện luận án.Nghiên cứu sinh cũng xin chân thành cảm ơn Ban đào tạo, Trường Điện - Điện
tử, Đại học Bách khoa Hà Nội đã tạo điều kiện thuận lợi nhất về nhiều mặt đểnghiên cứu sinh hoàn thành luận án
Tôi xin bày tỏ lòng cảm ơn Ban Giám hiệu trường Đại học Sư phạm Kỹ thuậtNam Định, các bạn đồng nghiệp của tôi tại Khoa Điện - Điện tử nơi tôi công tác
đã luôn quan tâm, giúp đỡ tạo điều kiện thuận lợi để tôi học tập, nghiên cứu.Sau cùng, tôi xin gửi lời cảm ơn sâu sắc nhất đến gia đình thân yêu của tôi đãluôn chia sẻ, ủng hộ, động viên và giúp đỡ để tôi vượt qua mọi khó khăn để hoànthành luận án
Xin trân trọng cảm ơn!
Tác giả luận án
Trần Gia Khánh
Trang 5Mục lục
Lời cam đoan 1
Lời cảm ơn 2
Danh mục ký hiệu viết tắt 6
1 Tổng quan 11 1.1 Hệ thiếu cơ cấu chấp hành 11
1.2 Các dạng xe hai bánh tự cân bằng 12
1.3 Tổng quan các phương pháp điều khiển 15
1.4 Kết luận 18
2 Xây dựng mô hình tuyến tính tương đương cho xe hai bánh 19 2.1 Mô hình toán của xe hai bánh 19
2.2 Mô hình tuyến tính tương đương với nhiễu đầu vào và bất định mô hình 26
2.3 Điều khiển tối ưu dựa trên quy hoạch động thích nghi 29
2.4 Kết luận 33
3 Xây dựng bộ điều khiển thích nghi bền vững 34 3.1 Thiết kế bộ điều khiển thích nghi bền vững với bộ ước lượng nhiễu 34 3.1.1 Thiết kế bộ quan sát nhiễu tổng 34
3.1.2 Phân tích tính ổn định của hệ kín 36
3.1.3 Thiết kế bộ điều khiển bám thích nghi bền vững cho xe 37
3.2 Thiết kế bộ điều khiển thích nghi bền vững dựa trên quy hoạch động xấp xỉ tuyến tính và bộ ước lượng nhiễu 39
3.3 Kết luận 44
4 Kiểm chứng kết quả bằng mô phỏng và thực nghiệm 45 4.1 Kết quả mô phỏng 45
4.1.1 Phương pháp điều khiển đề xuất 45
4.1.2 Điều khiển tối ưu dựa trên phương pháp quy hoạch động xấp xỉ 53 4.1.3 Điều khiển thích nghi bền vững dựa trên phương pháp quy hoạch động xấp xỉ tuyến tính và bộ ước lượng 55
4.2 Kết quả thực nghiệm 58
4.2.1 Mô hình xe trong phòng thí nghiệm 58
4.2.2 Thiết kế bộ điều khiển dòng cho động cơ 60
4.2.3 Kết quả thực nghiệm với bộ điều khiển LQR 62
4.2.4 Kết quả thực nghiệm điều khiển LQR kết hợp với bộ quan sát nhiễu 64
4.3 Kết luận 67
Danh mục các công trình đã công bố của luận án 69
Trang 6Tài liệu tham khảo 70
Phục lục 78
Các phần tử của ma trận A2: 78
Các phần tử của ma trận B2: 80
Code chương trình điều khiển: 81
Trang 7Danh sách hình vẽ
1.1 Xe hai bánh tự cân bằng truyền thống [19] 13
1.2 Mô hình xe hai bánh có đầu vào xen kênh [22] 14
1.3 Mô hình xe hai bánh có bánh phản ứng [23] 15
2.1 Sơ đồ xe hai bánh tự cân bằng [25] 19
4.1 Nhiễu đầu vào thứ nhất và ước lượng nhiễu trong khoảng thời gian ngắn ban đầu 48
4.2 Nhiễu đầu vào thứ nhất và ước lượng nhiễu 48
4.3 Nhiễu đầu vào thứ hai và ước lượng nhiễu trong khoảng thời gian ngắn ban đầu 49
4.4 Nhiễu đầu vào thứ hai và ước lượng nhiễu 49
4.5 Vị trí của xe 50
4.6 Góc nghiêng của thân xe 50
4.7 Góc hướng của xe 51
4.8 So sánh x, ˙x, θ và ˙θ 51
4.9 Tín hiệu diều khiển, so sánh quỹ đạo, ψ và ˙ψ 52
4.10 Dịch chuyển của xe 54
4.11 Góc lắc thân xe 54
4.12 Góc hướng của xe 55
4.13 Đồ thị vị trí x, góc nghiêng θ và góc hướng của xe Ψ 56
4.14 Đồ thị tín hiệu điều khiển τL, và τR 57
4.15 Các nhiễu ước lượng 57
4.16 Các nhiễu khai phá 58
4.17 Một mô hình xe hai bánh tự cân bằng trong phòng thí nghiệm 59
4.18 Sơ đồ khối giao tiếp giữa các phần cứng với nhau 60
4.19 So sánh vị trí thực thực của xe 62
4.20 So sánh góc nghiêng thực của xe 63
4.21 So sánh góc hướng thực của xe 63
4.22 Góc nghiêng của xe khi bộ điều khiển có quan sát nhiễu và không có quan sát nhiễu 64
4.23 Góc hướng của xe khi bộ điều khiển có quan sát nhiễu và không có quan sát nhiễu 65
4.24 Vị trí của xe khi bộ điều khiển có quan sát nhiễu và không có quan sát nhiễu 65
4.25 Ước lượng của thành phần nhiễu tổng thứ nhất 66
4.26 Ước lượng của thành phần nhiễu tổng thứ hai 66
Trang 8Danh sách bảng
2.1 Ký hiệu và tham số xe [25] 20
3.1 Thuật toán on-policy 42
3.2 Thuật toán off-policy 44
4.1 Tham số của xe trong phòng thí nghiệm 60
Trang 9DANH MỤC KÝ HIỆU VIẾT TẮT
tuyến tính
PID Proportional-Integral-Derivative Bộ điều khiển tỷ lệ tích phân
vi phân
Linear Quadratic Regulator trạng thái LQR kết hợp
bộ điều khiển dòng PIđược thiết kế dùng GA
Linear Quadratic Regulator trạng thái LQR kết hợp
bộ điều khiển dòng PIđược thiết kế dùng MO
đề xuất Linear Quadratic Regulator trạng thái LQR kết hợp
bộ điều khiển dòng PIdùng phương pháp đề xuất
ADP Approximate Dynamic Programming Quy hoạch động xấp xỉ
Trang 10MỞ ĐẦU
1 Tính cấp thiết của đề tài
Hệ thống hụt (thiếu) cơ cấu chấp hành là đối tượng điều khiển có đặc điểm nhậnbiết là số biến điều khiển nhỏ hơn số đầu ra của hệ thống hoặc số bậc tự do của hệthống lớn hơn số đầu vào của hệ thống đó Điều khiển các hệ thống hụt cơ cấu chấphành là một lĩnh vực nghiên cứu được nhiều người quan tâm bởi vì những ứng dụngrộng rãi của nó trong rô bốt, các phương tiện bay và các phương tiện trên biển Một
số ví dụ về hệ thống hụt cơ cấu chấp hành như: Acrobot, con lắc ngược, xe tự hành,phương tiện dưới nước và phương tiên bay
Xe hai bánh tự cân bằng là một hệ thống hụt cơ cấu chấp hành Trong thực tếchúng ta có thể thấy các xe như Segway, Scooter được sử dụng rộng rãi trong dichuyển ở các địa hình nhỏ như công viên và khu vui chơi giải trí, với mục đích anninh và thuận tiện Đây là đối tượng phi tuyến nhiều vào nhiều ra, thiếu cơ cấuchấp hành và không ổn định Do đó, đối tượng này khó điều khiển
Việc tổng quan các phương pháp điều khiển hệ thống hụt cơ cấu chấp hành làrất cần thiết Hiện tại chưa có tổng quan nào như thế đã được công bố Các tổngquan mới chỉ dừng lại cho một lớp đối tượng nhất định
Hiện nay trên thế giới đang nghiên cứu và phát triển ô tô hai bánh dựa trênnguyên lý làm việc của xe hai bánh tự cân bằng Do đó việc nghiên cứu và nângcao chất lượng điều khiển của xe hai bánh tự cân bằng là rất cần thiết khi mô hình
xe bất định và có nhiễu tác động để tăng độ an toàn cho người sử dụng, xe có thểhoạt động trong điều kiện phức tạp như lên xuống dốc, đường không bằng phẳnghoặc khi có phát sinh sự cố như một cơ cấu chấp hành bị lỗi không hoạt động được.Chính vì vậy, nghiên cứu sinh lựa chọn đề tài: Nghiên cứu ứng dụng điều khiển họctăng cường cho xe hai bánh tự cân bằng có mô hình bất định không dừng và nhiễu
cơ cấu chấp hành
2 Mục đích nghiên cứu
Mục đích của đề tài là nghiên cứu các phương pháp điều khiển cho đối tượnghụt cơ cấu chấp hành và ứng dụng điều khiển xe hai bánh tự cân bằng, đề xuấtphương pháp điều khiển mới có thể xử lý được thành phần bất định của mô hình
và nhiễu tác động vào từ bên ngoài Để thực hiện được mục tiêu này, luận án đặt
ra các nhiệm vụ chính sau đây:
Tìm hiểu về các loại xe hai bánh tự cân bằng
Nghiên cứu, xây dựng mô hình toán học của xe hai bánh tự cân bằng phù hợpvới mục đích thiết kế bộ điều khiển, từ đó có thể đề xuất các phương pháp
Trang 11điều khiển cho xe hai bánh tự cân bằng.
Nghiên cứu và ứng dụng mạch cầu H, các nguyên tắc điều chỉnh sử dụng tínhiệu PWM, xây dựng bộ lọc Kalman để lọc tín hiệu từ cảm biến Nghiên cứucác vi điều khiển để thực hiện các thuật toán điều khiển đề xuất
Nghiên cứu các thuật toán điều khiển hiện đại để áp dụng cho xe hai bánh tựcân bằng
Xây dựng mô hình xe hai bánh tự cân bằng trong phòng thí nghiệm, lập trìnhđiều khiển, hoàn thiện và hiệu chỉnh nhằm kiểm chứng các kết quả nghiên cứu
lý thuyết
3 Đối tượng và phạm vi nghiên cứu của luận án
Đối tượng nghiên cứu của luận án: Điều khiển bám quỹ đạo cho xe hai bánh tựcân bằng có mô hình bất định và nhiễu ngoài tác động
Phạm vi nghiên cứu của luận án: Nghiên cứu và thiết kế các bộ điều khiển phảnhồi trạng thái và bộ điều khiển bám quỹ đạo cho xe hai bánh tự cân bằng có nhiễuđầu vào bất định và tham số chưa biết Phân tích và chứng minh tính ổn định của
hệ kín bao gồm các bộ điều khiển đề xuất và đối tượng điều khiển Mô phỏng sosánh và tiến hành thử nghiệm bộ điều khiển đề xuất cho xe hai bánh tự cân bằng
4 Ý nghĩa khoa học và thực tiễn của luận án
Luận án đưa ra phương pháp điều khiển cho đối tượng là xe hai bánh tự cânbằng có mô hình toán với tham số bất định và chịu tác động bởi nhiễu bên ngoài.Thông qua kết quả mô phỏng và thử nghiệm trên mô hình xe hai bánh tự cân bằngtrong phòng thí nghiệm, phương pháp điều khiển đề xuất có thể được áp dụng vàothực tiễn
5 Phương pháp nghiên cứu
Để đạt được mục tiêu đề ra, phương pháp nghiên cứu của luận án đặt ra nhưsau:
Phân tích và tổng hợp các tài liệu khoa học, các công trình nghiên cứu mớinhất đã được công bố trong và ngoài nước trong những năm gần đây về điềukhiển xe hai bánh tự cân bằng
Mô phỏng hệ thống điều khiển xe hai bánh tự cân bằng trên phần mềmMatlab/Simulink để kiểm chứng tính đúng đắn của lý thuyết
Trang 12 Phân tích và chứng minh tính ổn định của hệ kín dựa vào lý thuyết ổn địnhLyapunov.
Thử nghiệm bộ điều khiển đề xuất trên vi điều khiển cho mô hình xe hai bánh
tự cân bằng trong phòng thí nghiệm
6 Bố cục của luận án
Luận án được trình bày với 4 chương chính được tóm tắt như sau:
Chương 1: Tổng quan về hệ thiếu cơ cấu chấp hành, xe hai bánh tự cân bằng,các loại xe hai bánh, và các phương pháp điều khiển cho xe hai bánh tự cânbằng Mô hình toán của xe tự cân bằng có thể được phân làm 3 loại: Không
có xen kênh đầu vào, có xen kênh đầu vào và có bánh xe phản ứng
Chương 2: Xây dựng mô hình tuyến tính tương đương cho xe hai bánh khi
có nhiễu đầu vào và bất định mô hình Xây dựng bộ điều khiển dựa trên quyhoạch động thích nghi xấp xỉ cho xe hai bánh sử dụng mô hình gốc
Chương 3: Xây dựng bộ điều khiển thích nghi bền vững Các bộ điều khiểnthích nghi bền vững dựa trên bộ quan sát nhiễu kết hợp với luật điều khiểnphản hồi trạng thái đảm bảo xe bám quỹ đạo khi chịu nhiễu đầu vào và cótham số bất định Đầu tiên, mô hình phi tuyến của xe được chuyển về một
mô hình tuyến tính tương đương, trong đó sự bất định của mô hình và nhiễuđầu vào được biểu diễn bằng nhiễu đầu vào tổng Sau đó, một bộ quan sátnhiễu đầu vào tổng đã được thiết kế dựa trên xấp xỉ thành phần đạo hàmcủa mô hình tuyến tính tương đương Cuối cùng, các bộ điều khiển phản hồitrạng thái, bộ điều khiển bám quỹ đạo đã được thiết kế cho mô hình tuyếntính tương đương khi đã có bù nhiễu tổng ở đầu vào Một bộ điều khiển thíchnghi bền vững dựa trên phương pháp quy hoạch động xấp xỉ tuyến tính kếthợp bộ quan sát nhiễu cũng đã được nghiên cứu và đề xuất Tính ổn định của
hệ kín bao gồm các bộ điều khiển và bộ quan sát nhiễu đã được phân tích vàchứng minh chặt chẽ
Chương 4: Kiểm chứng kết quả thông qua mô phỏng và thực nghiệm Mô phỏngtrên Matlab đã được thực hiện để đánh giá chất lượng các phương pháp đềxuất và so sánh với phương pháp đã có như bộ điều khiển kinh điển LQR Cáckết quả chỉ ra rằng chất lượng điều khiển đã được đảm bảo tốt trong trườnghợp có bất định tham số mô hình và nhiễu đầu vào chưa biết khi sử dụng cácphương pháp điều khiển đề xuất, trong khi đó chất lượng điều khiển sẽ xấuhơn khi bộ điều khiển kinh điển LQR được áp dụng Bộ điều khiển bám được
đề xuất đã cho chất lượng điều khiển tốt hơn bộ điều khiển trong công trình
Trang 13[40] với dạng quỹ đạo đặt hình tròn, bộ điều khiển phản hồi trạng thái và cả
bộ điều khiển LQR
Kết luận: Một bộ điều khiển phản hồi trạng thái với bộ quan sát nhiễu tổngđầu vào đã được đề xuất cho xe hai bánh tự cân bằng có tham số mô hìnhbất định và nhiễu đầu vào chưa biết và tính ổn định của hệ thống điều khiểnkín đã được chứng minh Các bộ điều khiển đề xuất có những ưu điểm là đơngiản khi cài đặt và linh hoạt trong việc tính toán ma trận khuếch đại K của
bộ điều khiển phản hồi trạng thái, có thể giải quyết bất định tham số mô hình
và nhiễu đầu vào Ngoài ra một bộ điều khiển thích nghi bền vững dựa trênquy hoạch động xấp xỉ tuyến tính và bộ quan sát nhiễu cũng được đề xuấtcho xe
Trang 14Chương 1
Tổng quan
1.1 Hệ thiếu cơ cấu chấp hành
Một hệ thống cơ khí có số đầu vào điều khiển ít hơn số bậc tự do được gọi là
hệ thiếu cơ cấu chấp hành [1] Ngược lại, hệ đủ cơ cấu chấp hành là hệ thống có số
cơ cấu chấp hành bằng số bậc tự do của hệ Nguồn gốc của sự thiếu cơ cấu chấphành có thể là: do bản chất của động học hệ thống (ví dụ như con lắc ngược); hoặc
do nhân tạo từ thiết kế hay bỏ bớt cơ cấu chấp hành để tạo ra hệ thống điều khiểnkhó hơn; hoặc trường hợp còn lại là do cơ cấu chấp hành bị hỏng
Các hệ thống cơ khí thiếu cơ cấu chấp hành có rất nhiều ứng dụng thực tế trongcuộc sống như máy bay, tàu vũ trụ, phương tiện dưới nước [2], xe tự hành, rô bốt đi
bộ Việc điều khiển các đối tượng thiếu chấp hành này rất là khó và phức tạp Nóthường dẫn tới những vấn đề lý thuyết phức tạp mà trong hệ đủ chấp hành không
có và không thể giải quyết bằng các phương pháp điều khiển kinh điển
Một số kết quả và tính chất của hệ phi tuyến như tuyến tính hóa phản hồi và lýthuyết thụ động sẽ không áp dụng được cho hệ thiếu cơ cấu chấp hành Một số tínhchất không mong muốn của hệ thiếu chấp hành nữa là: có bậc tương đối không xácđịnh và tính pha không cực tiểu
Hệ thống này cũng khó để xác định tính điều khiển được, và khi kiểm tra đượctính điều khiển được thì tín hiệu điều khiển có thể là không liên tục, tuần hoàn hoặcthay đổi theo thời gian Điều khiển hệ thiếu cơ cấu chấp hành có thể coi là mộtgiải pháp mềm cho sự hỏng cơ cấu chấp hành của hệ đủ cơ cấu chấp hành để tránh
dự phòng thiết bị Do đó nó có thể được dùng trong những ứng dụng trong đó vấn
đề an toàn là quan trọng và có thể đóng góp vào sự thành công cho các nhiệm vụ.Những chiến lược điều khiển như vậy tự nhiên mang lại lợi ích về khía cạnh giảmkhối lượng (do giảm cơ cấu chấp hành) và giảm giá thành hệ thống Do đó có thểkhuyến khích các nhà sản xuất trực tiếp thiết kế các thuật toán có tính đến thiếu
cơ cấu chấp hành
Có nhiều tác giả đã cố phân loại và khái quát các hệ thống này với mục đích
đề xuất một phương pháp thiết kế điều khiển có tính hệ thống cho hệ thiếu cơ cấuchấp hành, nhưng điều này là khó thực hiện
Spong [3] là người đi đầu trong việc khái quát hóa việc phân tích các hệ thốngthiếu cơ cấu chấp hành, trong đó các hệ thống này có thể được tuyến tính hóa mộtphần bởi phản hồi ít nhất là cục bộ Ông đã đề xuất chuyển các hệ phi tuyến thànhcác hệ tuyến tính một phần bao gồm các hệ con đủ chấp hành và hệ con không cóchấp hành
Seto và Baillieul [4] đã phân loại hệ thống thiếu cơ cấu chấp hành sử dụng kháiniệm sơ đồ dòng điều khiển (CFD) thành ba dạng: cây (tree), chuỗi (chain) và điểmcách ly (isolated point) Ví dụ như con lắc ngược có cấu trúc dạng cây, hệ vật trượt
Trang 15trên xe có cấu trúc dạng chuỗi, hệ thống bóng và thanh có dạng điểm cách ly Một
số phương pháp điều khiển như tuyến tính hóa phải hồi và điều khiển cuốn chiếu
đã được thiết kế trong nghiên cứu này
Saber [5] đã phân loại hệ cơ thiếu cơ cấu chấp hành dựa trên tính đối xứng độnglực học, chế độ chấp hành, mô men tích phân được và đầu vào tương tác thành 8loại bằng cách chuyển hệ thống thành 3 dạng hệ phi tuyến nối tiếp chuẩn: dạngphản hồi chặt; dạng truyền thẳng chặt; và dạng toàn phương tuyến tính phi tamgiác
Thakar và nhóm nghiên cứu [6] đã đề xuất một bộ điều khiển sử dụng hàm nănglượng tổng là hàm Lyapunov cho một lớp hệ thống thiếu cơ cấu chấp hành, trong đó
số bậc tự do bằng hai lần kích thước của véc tơ đầu vào Phương pháp này không
áp dụng được cho xe hai bánh tự cân bằng vì đối tượng này có số bậc tự do là 3 vàkích thước đầu vào bằng 2
Trong công trình [7], các tác giả đã nghiên cứu và thiết kế bộ điều khiển cho hệthiếu cơ cấu chấp hành với tín hiệu đầu vào có dạng xung Hơn nữa, nghiên cứu đãtìm ra tập mở rộng của tập hút chứa điểm cân bằng cho trường hợp hệ có một đầuvào
Đối với hệ thiếu cơ cấu chấp hành, các phương pháp điều khiển kinh điển đãđược thiết kế gồm: phương pháp điều khiển dựa trên tuyến tính hóa một phần,tuyến tính hóa phản hồi và điều khiển cuốn chiếu [1, 8]
Một số phương pháp điều khiển đã được nghiên cứu và áp dụng cho hệ thiếu
cơ cấu chấp hành cụ thể như phương tiên bay không người lái [9, 10], tàu thủy vàphương tiện hàng hải [11, 12] Trong [9] đã tổng quan các phương pháp điều khiểncho máy bay không người lái, từ điều khiển tuyến tính PID tới điều khiển phi tuyếnnhư cuốn chiếu, điều khiển trượt và điều khiển phi tuyến Nghiên cứu [10] đã tổngquan các thuật toán điều khiển cho máy bay không người lái dạng 4 động cơ Bàitoán lập quỹ đạo cho các hệ thống cơ khí thiếu cơ cấu chấp hành được nghiên cứutrong [11] Công trình [12] đã nghiên cứu về vấn đề điều khiển bám dựa trên thịgiác cho các rô bốt trên mặt nước thiếu cơ cấu chấp hành
Có nhiều bộ điều khiển khác nhau đã được đề xuất cho hệ thiếu cơ cấu chấphành như là điều khiển cuốn chiếu, điều khiển cuốn chiếu thích nghi [13], điều khiểntrượt thích nghi [14], điều khiển thông minh (sử dụng hệ mờ hoặc mạng nơ-ron)[15, 16], điều khiển thích nghi bền vững [17] và điều khiển tối ưu
1.2 Các dạng xe hai bánh tự cân bằng
Xe tự hành hai bánh được chia thành hai dạng chính: a) điểm trọng tâm củathân xe nằm phía bên dưới trục của hai bánh xe [18] và b) điểm trọng tâm của thân
xe nằm phía bên trên trục của hai bánh xe [19] Dạng thứ nhất dễ điều khiển hơn
vì bản thân đối tượng là ổn định, trong khi đó dạng thứ hai lại khó điều khiển hơn
Trang 16vì bản thân đối tượng là không ổn định, nó giống như là hệ con lắc ngược Trongluận án này tập trung vào đối tượng dạng thứ hai, gọi là xe hai bánh tự cân bằng.
Xe hai bánh tự cân bằng là một hệ thống cơ thiếu cơ cấu chấp hành [1, 8] vì
nó có ba bậc tự do gồm: chuyển động xoay của thân xe, di chuyển thẳng và chuyểnđộng xoay của xe nhưng chỉ có hai đầu vào là hai mô ment tạo ra bởi các động cơđiện xoay chiều hoặc một chiều tác động lên hai bánh xe [19, 20, 21, 61]
Dạng xe hai bánh đầu tiên [19] được chế tạo năm 2002 có dạng như trong hình1.1 Xe này gồm hai hệ con: thanh lắc và hệ thống xoay Hai bộ điều khiển phảnhồi trạng thái được thiết kế sử dụng phương pháp gán điểm cực Các bộ điều khiểnnày làm cho xe ổn định và có thể chống nhiễu ảnh hưởng tới góc và lực tác độngbên ngoài
Hình 1.1: Xe hai bánh tự cân bằng truyền thống [19]
Nguyên lý hoạt động của xe như sau: Để cho xe hai bánh này có thể chuyển độngthẳng (hoặc lùi) thì hai bánh xe trái và phải phải quay cùng chiều và cùng tốc độ
Xe sẽ chuyển động rẽ sang trái nếu như bánh bên trái quay cùng chiều và có vậntốc chậm hơn bánh bên phải, nếu lớn hơn xe sẽ quay phải Trong quá trình chuyểnđộng, xe phải được giữ thăng bằng, có nghĩa là trọng tâm của thanh lắc phải rơivào trục hình học của hai bánh xe, nếu thanh lắc nghiêng về phía trước thì xe phảichạy về phía trước hoặc nghiêng về đằng sau thì xe phải lùi lại phía sau để bàn chân
đế luôn ở dưới trọng tâm của thanh lắc
Sau đó, một dạng xe hai bánh tự cân bằng mới có xen kênh đầu vào [22] đã đượcthiết kế, chế tạo và thử nghiệm Xe hai bánh này được mô tả như trong hình vẽ 1.2,trong đó bên trái là ảnh nhìn từ phía cạnh xe và bên phải là ảnh nhìn từ phía trướcxe
Hệ thống này chỉ có một động cơ điện một chiều làm cơ cấu chấp hành, nó được
Trang 17Hình 1.2: Mô hình xe hai bánh có đầu vào xen kênh [22].
gắn với thanh lắc và mô men của động cơ tác động lên cả bánh xe và thanh lắc Xenày dễ chế tạo (vì hai bánh đồng trục) nhưng nhiều thách thức hơn khi điều khiển
vì có sự xen kênh giữa thanh lắc và các bánh xe Xe có thể di chuyển trên đườngdốc và giữ được thanh lắc thăng bằng xung quanh điểm cân bằng Với loại xe này,
bộ điều khiển trượt tích phân [22] đã được áp dụng Phương pháp này làm cho xe
có thể di chuyển trên bề mặt nghiêng và đảm bảo thanh lắc được giữ thăng bằng.Một dạng xe hai bánh thứ ba [23, 24] đã được thử nghiệm Hình 1.3 thể hiện môhình của xe này Nó giống với mô hình thứ nhất nhưng có một bánh đà để giữ chothanh lắc cân bằng trong quá trình di chuyển Do đó, nó dễ điều khiển hơn Một bộđiều khiển PID đã được thiết kế để duy trì thanh lắc xung quanh vị trí thẳng đứng.Theo như cấu trúc vật lý của xe, các dạng xe có thể được nhóm thành loại cóđầu vào xen kênh và loại có đầu vào không xen kênh Đối với loại thứ hai, có 3dạng: trọng tâm nằm dưới trục xe, trọng tâm nằm phía trên của trục xe và trọngtâm được điều khiển bởi bánh xe phản ứng
Trong luận án này, em tập trung vào nghiên cứu và thiết kế bộ điều khiển cho
xe hai bánh tự cân bằng (TWMR) được điều khiển bởi mô men của hai động cơ vàkhung được thể hiện trong hình 1.1 Hai bánh xe được gắn trực tiếp với trục của haiđộng cơ điện (một chiều hoặc xoay chiều) và đặt đồng trục Các động cơ này đượcgắn lên khung xe Khi xe di chuyển, khung xe xoay một cách bị động xung quanhtrục của bánh xe Chuyển động này giống như của con lắc ngược Do đó, các bàitoán cơ bản khi điều khiển xe hoạt động gồm:
Bài toán 1: Bài toán đầu tiên và quan trọng nhất là duy trì thanh lắc xungquanh điểm cân bằng không ổn định Điều này có nghĩa là góc giữa thanh lắc
Trang 181.3 Tổng quan các phương pháp điều khiển
Cho tới trước năm 2014, chỉ có một vài nghiên cứu tổng quan cho xe hai bánh
tự cân bằng [26, 27] và các phương pháp điều khiển cho nó Các phương pháp điềukhiển cho xe hai bánh tự cân bằng đã được nghiên cứu và áp dụng từ điều khiểnPID kinh điển tới điều khiển tối ưu, điều khiển phi tuyến và thông minh
Trong công trình [28], một bộ điều khiển PID cho ô tô dựa trên mô hình xe cânbằng đã được phát triển, mô phỏng trong Matlab và thử nghiệm Bộ điều khiển này
đã giữ cho xe bám theo quỹ đạo đặt Ngoài ra, bộ điều khiển PD được kết hợp với
Trang 19phương pháp điều khiển học lặp đã được nghiên cứu trong [29] Bộ điều khiển PIDphân số (fractional) cũng đã được nghiên cứu và áp dụng trong [30] Trong côngtrình [31], một bộ điều khiển cuốn chiếu thích nghi kết hợp với hai bộ điều khiển
PD đã được đề xuất cho xe điện có bất định mô hình nhưng không xem xét tớinhiễu bất định tác động ở đầu vào Trong nghiên cứu [32], một bộ điều khiển sửdụng phương trình Riccati phụ thuộc trạng thái đã được thiết kế Sự kết hợp hai
bộ điều khiển PD với bộ điều khiển trễ thời gian (time-delayed) cho chuyển độngnhanh của xe đã được đề xuất trọng [34], trong đó bộ điều khiển PD thứ nhất đượcthiết kế cho góc nghiêng, bộ điều khiển PD còn lại để điều khiển hướng xe và bộđiều khiển trễ thời gian để điều chỉnh vị trí Một chiến lược điều khiển [35] gồm bộđiều khiển cục bộ và một bộ lập kế hoạch toàn cục cho phương tiện vận chuyển dựatrên xe hai bánh tự cân bằng đã được đề xuất, trong đó bộ điều khiển cục bộ gồm
ba bộ điều khiển PID điều chỉnh góc nghiêng, góc hướng và vị trí
Một số phương pháp điều khiển tối ưu đã được nghiên cứu và áp dụng cho xenhư điều khiển dự báo (MPC), điều khiển LQR [36] và điều khiển H∞ Trong côngtrình [37], một bộ điều khiển dự báo dựa trên bộ quan sát trạng thái kết hợp vớiđiều khiển thích nghi đã được thiết kế để đảm bảo xe bám theo quỹ đạo mong muốn
và giữ thăng bằng Một bộ điều khiển dự báo giải quyết bài toán điều khiển bámvới các ràng buộc vật lý đã được nghiên cứu trong [38] Một bộ điều khiển LQR dựatrên mô hình phi tuyến phụ thuộc trạng thái [39] đã được thiết kế Bộ điều khiểnnày bền vững với nhiễu ngoài tác động nhưng không giải quyết tính bất định môhình
Một bộ điều khiển tối ưu H∞ [40] đã được đề xuất sử dụng mô hình tuyến tínhxấp xỉ xung quanh điểm làm việc Mô hình của xe được tuyến tính hóa xung quanhđiểm làm việc sử dụng khai triển Taylor Mô hình tuyến tính hóa này có thành phầnnhiễu đầu vào gồm sai số do tuyến tính hóa và bất định tham số, nhưng nó không
có nhiễu ngoài tác động vào Để tính toán tham số của bộ điều khiển, trong mỗi chu
kỳ lấy mẫu, các ma trận của mô hình tuyến tính phải được tính lại và đồng thờigiải phương trình đại số Riccati trực tuyến Do đó khối lượng tính toán cho bộ điềukhiển sẽ nhiều
Một số phương pháp điều khiển phi tuyến như dựa trên phương pháp Lyapunov,điều khiển cuốn chiếu và điều khiển trượt cũng đã được nghiên cứu và áp dụngcho xe hai bánh tự cân bằng Một bộ điều khiển phi tuyến dựa trên phương phápLyapunov, sử dụng phép chuyển trạng thái được đề xuất trong [41]
Đã có rất nhiều bộ điều khiển phi tuyến khác cũng đã được thiết kế cho xe như:điều khiển cuốn chiếu kết hợp với điều khiển trượt [42] Trong [43], một bộ điềukhiển trượt đã được thiết kế chỉ để điều khiển các chuyển động thăng bằng và vịtrí Các bộ điều khiển cuốn chiếu thích nghi đã được áp dụng trong các nghiên cứu[44, 45] Bộ điều khiển trượt để bù ma sát được đề xuất trong [46] Một bộ điềukhiển thích nghi bền vững được đề xuất trong [47] Trong [48], điều khiển trượt
Trang 20thích nghi kết hợp với điều khiển mờ trực tiếp đã được thiết kế để giữ thăng bằng
và bám quỹ đạo cho xe, tuy nhiên nhiễu đầu vào không được xem xét Ngoài ra,một bộ điều khiển dựa trên động học không đã được đề xuất trong [49] Trong côngtrình [50], bộ điều khiển mặt trượt động dựa trên một bộ quan sát nhiễu phi tuyến
đã được thiết kế, trong đó bộ quan sát có một phương trình vi phân phức tạp cầngiải và bộ điều khiển cũng phức tạp do phải sử dụng phép biến đổi hệ trục tọa độ,
kỹ thuật mặt trượt động và các bộ lọc Bộ điều khiển này chỉ có thể ổn định cácgóc nghiêng và góc hướng của xe Một bộ điều khiển trượt khác [51] kết hợp với
bộ quan sát nhiễu phi tuyến cũng đã được nghiên cứu và đề xuất Một bộ quan sáttrạng thái kết hợp với thuật toán siêu xoắn đã được nghiên cứu trong [52]
Có rất nhiều phương pháp điều khiển thông minh đã được thiết kế cho xe tựcân bằng, chẳng hạn như dựa trên hệ suy luận mờ và mạng nơ-ron Một số bộ điềukhiển dựa trên hệ suy luận mờ đã được xây dựng cho xe hai bánh tự cân bằng trongcác công trình [21, 61, 22], [53, 54] và [55, 56, 57, 58] Các bộ điều khiển sử dụng
mô hình mờ TSK được thiết kế trong [21, 22, 55, 59] Trong công trình [60], một
bộ điều khiển dựa trên tính thụ động sử dụng mô hình mờ Takagi-Sugeno đã được
đề xuất Ngoài ra, bộ điều khiển dựa trên mô hình Mamdani [61] cũng đã được đềxuất Hơn nữa, bộ điều khiển mờ thích nghi được thiết kế trong các bài báo [56, 58].Vấn đề giữ thăng bằng và bám quỹ đạo đã được xử lý trong [62] bằng cách kết hợpđiều khiển trượt với hệ suy luận mờ Bộ điều dựa trên hệ suy luận mờ loại hai [63]
đã được thiết kế cho xe với bất định mô hình và nhiễu, nhưng bộ điều khiển nàyphụ thuộc vào việc giải các bất phương trình ma trận tuyến tính Trong nghiên cứu[64], một bộ điều khiển mờ thích nghi gián tiếp dựa trên bộ lập quỹ đạo đã được đềxuất cho xe hai bánh tự cân bầng có bất định mô hình Trong [65], mô hình toáncủa xe hai bánh tự cân bằng được tách thành ba hệ con: chuyển động thẳng của xe,chuyển động xoay của xe và chuyển động xoay của thanh lắc Các thành phần bấtđịnh của mỗi hệ con này sẽ được xấp xỉ bằng một hệ suy luận mờ Từ đó bộ điềukhiển thích nghi dựa trên hệ mờ đã được thiết kế
Một số vấn đề khác như xử lý bù ma sát được đưa ra trong [66], quan sát nhiễu
đã được nghiên cứu trong [67], ước lượng tham số của xe dựa trên dữ liệu thựcnghiệm [68], điều khiển chống trượt bánh xe đã được nghiên cứu trong [69], điềukhiển tránh vật cản trên cao được phân tích và đề xuất trong [70] bằng cách giải bàitoán tối ưu quỹ đạo nhiều bước Một xe hai bánh giống ô tô đã được thử nghiệmtrong [71] Xe tự hành được thiết kế có ghế ngồi được nghiên cứu trong [72] Điềukhiển bám quỹ đạo và điều khiển tránh vật cản của xe với mô hình rõ và không
có nhiễu đã được đề xuất trong [38] và [73] Gần đây, một bộ điều khiển có hệ sốkhuếch đại lớn dựa trên bộ quan sát thích nghi đã được thiết kế trong công trình[74] Nó đòi hỏi rất nhiều tính toán tích phân để ước lượng các trạng thái và tham
số của xe Trong [75], một bộ điều khiển để giữ xe thăng bằng độc lập với việc điềukhiển chuyển động của xe Điều này cho phép thực hiện bài toán bám quỹ đạo tách
Trang 21riêng khỏi bài toán cân bằng.
Mặc dù có nhiều phương pháp điều khiển đã được áp dụng cho xe hai bánh tựcân bằng, nhưng tuy nhiên vẫn còn có một số vấn đề thách thức quan trọng vẫnchưa được giải quyết như: tính điều khiển được, chuyển động của xe trên bề mặtkhông phẳng Một số mô hình xe ô tô dựa trên xe hai bánh tự cân bằng đã đượcsản xuất tuy nhiên tính an toàn của những xe này vẫn chưa thực sự được đảm bảokhi một trong hai cơ cấu chấp hành bị lỗi hoặc pin bị hỏng Một số hướng ứng dụngcủa các xe gần đây đã được phát triển như trong các công trình [76], [77] và [78].Hầu hết những phương pháp đã được tóm tắt ở trên đã không giải quyết vấn đềbất định mô hình và nhiễu đầu vào chưa biết, chỉ có một vài phương pháp đã giảiquyết, nhưng chúng rất phức tạp khi thiết kế và cài đặt Điều này đã thúc đẩy tácgiả đề xuất một bộ điều khiển đơn giản hơn dựa trên bộ quan sát nhiễu đầu vào đểđồng thời vượt qua được bất định mô hình và nhiễu đầu vào bất định Trong nghiêncứu này, đóng góp chính là:
a) Biến mô hình phi tuyến của xe thành một mô hình tuyến tính tương đương,trong đó bất định của mô hình và nhiễu đầu vào chưa biết được gộp lại thànhnhiễu đầu vào tổng;
b) Đề xuất bộ điều khiển dựa trên mô hình tuyến tính tương đương và bộ quansát nhiễu đầu vào, chứng minh tính ổn định của hệ thống điều khiển xe được
đề an toàn (một cơ cấu chấp hành hoặc cảm biến bị hỏng)
Chương tiếp theo sẽ trình bày mô hình toán của xe hai bánh tự cân bằng, xâydựng mô hình tuyến tính tương đương và thiết kế bộ điều khiển cho xe dựa trênphương pháp quy hoạch động
Trang 22Chương 2
Xây dựng mô hình tuyến tính tương đương cho xe hai bánh.
2.1 Mô hình toán của xe hai bánh
Sơ đồ của xe hai bánh tự cân bằng được thể hiện như trong hình 2.1 Các kháiniệm và tham số của xe được trình bày trong bảng 2.1, trong đó:
J =mr2/2, K = mr2/4, I1 = I3 = M d2/2, và I2 = M l2/2 (2.1)Trong phần này, một mô hình toán [25] của xe được nghiên cứu và trình bày
Hình 2.1: Sơ đồ xe hai bánh tự cân bằng [25]
Xe hai bánh tự cân bằng gồm ba vật cứng là hai bánh xe trái (phải) và thanhlắc ngược Gọi N n1n2n3 là hệ trục tọa độ cố định (toàn cục), Cc1c2c3 là hệ trụctọa độ gắn với điểm ở giữa của đoạn thẳng hình học nối hai tâm của các bánh xe,
Bb1b2b3 là hệ trục tọa độ gắn với trọng tâm của thanh lắc Xe di chuyển đồng thờibởi chuyển động thẳng, chuyển động xoay và chuyển động quay của thanh lắc Các
ma trận chuyển giữa các hệ trục tọa độ có thể biểu diễn như sau:
Trang 23d Khoảng cách giữa hai bánh xe
l Khoảng cách từ tâm của thân xe tới trục bánh xe
r Bán kính của bánh xe
M Khối lượng của thân xe (không gồm bánh xe)
m Khối lượng bánh xe
J Mô men quán tính của bánh xe theo trục bánh xe
K Mô men quán tính của bánh xe theo trục thẳng đứng
τL, τR Mô men tác động lên bánh xe trái, phải
Các trạng thái của xe được ký hiệu như sau:
ωL, ωR, ωB: Tốc độ góc của bánh trái, bánh phải và thanh lắc
vL, vR, vB: Tốc độ dài của bánh trái, bánh phải và thanh lắc
γL, γR: Tốc độ xoay của bánh trái, bánh phải
vC, ωC: Vận tốc dài và vận tốc góc của xe
Ứng với hệ tọa độ cố định N , trọng tâm của mỗi vật (thanh lắc (xB, yB), bánh trái(xL, yL), bánh phải (xR, yR)) có ràng buộc vị trí:
Trang 24Giả sử không có hiện tượng trượt, vận tốc của mỗi bánh được xác định bởi bánkính bánh xe và tốc độ xoay của nó, góc hướng của xe bị ràng buộc bởi tỉ số củacác thành phần vận tốc Do đó, ta có các ràng buộc phi holonomic dạng không tíchphân được:
˙xLcΨ + ˙yLsΨ =r ˙γL,
˙xRcΨ + ˙yRsΨ =r ˙γR,( ˙xL+ ˙xR)sΨ =( ˙yL+ ˙yR)cΨ,
Trang 25ddt
Trang 26M [¨yC+ l ¨θcθsΨ + l ¨ΨsθcΨ + 2l ˙θ ˙ΨcθcΨ − l( ˙θ2+ ˙Ψ2)sθsΨ] + 2m¨yC
= λ1sΨ + λ2sΨ − 2λ3cΨ (2.26)
M (¨xCcΨ + ¨yCsΨ)lcθ + (I2+ M l2)¨θ − (I1− I3+ M l2) ˙Ψ2sθcθ − M glsθ
= −(τL+ τR) + cα( ˙γL− ˙θ) + cα( ˙γR− ˙θ) (2.27)[I3+ md2/2 + 2K + (I1− I3)(sθ)2] ¨Ψ
+ M [−¨xCsΨ + ¨yCcΨ − ( ˙xCcΨ + ˙yCsΨ) ˙Ψ]lsθ+ M ( ˙xCcΨ + ˙yCsΨ) ˙Ψlsθ + 2(I1− I3) ˙θ ˙Ψsθcθ
= −dλ1/2 + dλ2/2
(2.28)
J ¨γL= −rλ1+ τL− cα( ˙γL− ˙θ) (2.29)
J ¨γR = −rλ2+ τR− cα( ˙γR− ˙θ) (2.30)Các hệ số Lagrange các phương trình trên có thể được loại bỏ bằng cách tìm λ1 và λ2trong phương trình (2.29), (2.30) và thay chúng vào các phương trình (2.25)-(2.28),
và giải ra λ3 từ phương trình (2.25) và (2.26) Cuối cùng, sử dụng các quan hệ (2.9)
và (2.10) ta có ba phương trình phi tuyến độc lập của chuyển động cho xe
Các phương trình chuyển động của xe [25] được biểu diễn như trong (2.31), (2.32)
tơ trọng lực, B là ma trận đầu vào, τ là véc tơ đầu vào, q là véc tơ trạng thái
Trang 28Định nghĩa lần lượt các biến trạng thái và đầu vào như sau:
˙x
˙θ
˙ψ
Trang 29Ω =(M lr)2(1 − cos2(x2)) + 2I2J + 2J M l2+ (I2M + 2I2m + 2M ml2)r2.
Khi xe hoạt động có thể mang tải với khối lượng khác nhau, do đó M có thể phụthuộc vào thời gian Ngoài ra, xe có thể chịu tác động từ bên ngoài bởi nhiễu cũngphụ thuộc vào thời gian Cho nên, mô hình toán của xe có tính chất không dừng
Hệ thống (2.44) sẽ được dùng để xây dựng một mô hình tuyến tính tương đương
có mô hình bất định và nhiễu đầu vào tổng ở phần tiếp theo
2.2 Mô hình tuyến tính tương đương với nhiễu
đầu vào và bất định mô hình
Gọi xe là một điểm cân bằng của hệ thống (2.44), thì xe là nghiệm của phươngtrình
xe Không mất tính tổng quát, giả sử′∗′ bằng không, điều này có nghĩa xe = 0
Vì f1(x) = x4, f2(x) = x5 và f3(x) = x6 là các hàm tuyến tính, đạo hàm bậcnhất của ba biến trang thái đầu tiên có thể được biểu diễn như sau
Trang 30thống (2.48) không bị ảnh hưởng trực tiếp bởi đầu vào và nhiễu đầu vào bất định.
Vì f4(x), f5(x) và f6(x) là các hàm phi tuyến, bằng cách khai triển Taylor, chúng
có thể được biểu diễn chính xác như sau
Λ = 2I2J + 2J M l2+ I2M r2+ 2I2mr2+ 2M l2mr2
Vì rank(B2) = 2, nghịch đảo của ma trận BT
2B2 tồn tại Cho nên, ∆(x, u) có thểđược viết như sau
Trang 31trong đó
d = (B2TB2)−1B2T∆(x, u) (2.52)Nói cách khác, ∆(x, u) thuộc không gian ảnh của B2 và phụ thuộc vào cả thời gian
do tham số của xe có thể thay đổi như khối lượng tải
Khi các tham số của xe là bất định, hệ thống (2.50) có thể được biểu diễn như sau
˙x46 = (A2+ ∆A2)x + (B2+ ∆B2)u + ∆(x, u) (2.53)
Nó tương đương với
˙x46= A2x + B2u + ∆u(x, u), (2.54)trong đó:
∆u(x, u) = ∆(x, u) + ∆A2x + ∆B2u (2.55)Tương tự, ta có:
trong đó:
du = (B2TB2)−1B2T∆u (2.57)Trong trường hợp này, ∆u(x, u) cũng nằm trong không gian ảnh của B2 và phụthuộc thời gian
Từ các phương trình (2.48), (2.54) và (2.56), ta thu được
Trang 32Do đó, ∆l thuộc không gian ảnh của B Có nghĩa rằng tính bất định của hệ thống(2.44) có thể được mô tả bởi nhiễu đầu vào bất định du.
Khi có nhiễu đầu vào chưa biết di(t) tác động vào xe, hệ thống (2.58) trở thành
trong đó:
Vì thế, nhiễu tổng dc biểu diễn cả đầu vào bất định và sự bất định của mô hình
Hệ thống (2.63) là một mô hình tuyến tính không dừng biểu diễn chính xác hệ phituyến (2.44) Điều kiện ràng buộc để đảm bảo tính tương đương của mô hình tuyếntính này là ma trận B phải có hạng bằng hai Trong chương tiếp theo, nhiễu tổng
sẽ được ước lượng thông qua bộ ước lượng nhiễu
2.3 Điều khiển tối ưu dựa trên quy hoạch động
thích nghi
Xét hệ phi tuyến
với x ∈ Rn, là véc tơ trạng thái của hệ thống, x ∈ Rm là véc tơ tín hiệu điều khiển,
F (x) và G(x) là các ánh xạ liên tục Lipschitz trên một tập Ω ∈ Rn chứa gốc tọa độvới F (0) = 0
Hàm chi phí ứng với luật điều khiển u là:
V (x) =
Z ∞ 0
Trước khi giải bài toán điều khiển tối ưu, ta đặt ra giả thiết như sau:
Giải thiết 2.1 Giả thiết tồn tại một luật điều khiển phản hồi ổn định tiệm cậntoàn cục u0 tại gốc tọa độ, trên một miền Ω cho hệ (2.65) với hàm chi phí (2.66)tương ứng là hữu hạn Một luật điều khiển thỏa mãn giả thiết trên được gọi là luậtđiều khiển ổn định chấp nhận được [85]
Bài toán điều khiển tối ưu bây giờ có thể được phát biểu như sau: Xét hệ phituyến liên tục (2.65) và tập hợp các luật điều khiển chấp nhận được Ψ(Ω), tìm luậtđiều khiển để tối thiểu hóa hàm chi phí (2.66)
Trang 33Ta định nghĩa C1 là tập hợp các hàm liên tục khả vi và P1 là tập tất cả các hàmtrong C1 xác định dương và thỏa mãn |x| → ∞ thì f (x) → ∞ Khi đó ta nhận thấyhàm V (x) trong công thức (2.66) phải thuộc tập C1, nói cách khác:
[∇V (x)]T[F (x) + G(x)u] + r(x, u) = 0, V (0) = 0, (2.68)Phương trình (2.68) được gọi là phương trình Lyapunov cho hệ phi tuyến Địnhnghĩa hàm Hamilton như sau:
H(x, u, V ) = r(x, u) + [∇V (x)]T[F (x) + G(x)u] (2.69)thì hàm chi phí tối ưu V∗(x) thỏa mãn phương trình HJB:
cụ thể như sau
Định lý 2.1 [86] Cho u0 là luật điều khiển ổn định tiệm cận toàn cục tại gốc tọa
độ của hệ (2.65) (Giả thiết 2.1) Khi đó, với k = 0, 1, , hàm chi phí Vk(u) ∈ C1thu được bằng việc giải phương trình:
uk là luật điều khiển ổn định toàn cục
Đặt limk→∞Vk(x0) = V (x0) và limk→∞uk(x0) = u∗ với mọi x0 ∈ Rn Khi đó,
V∗ = V và u∗ = u nếu V ∈ C1
Trang 34Trong phần này, phương pháp lặp P-I để xấp xỉ nghiệm của phương trình HJB
và luật điều khiển tối ưu trên cơ sở mạng nơron [86], được trình bày Phương pháp
là phiên bản mở rộng của phương pháp cho hệ tuyến tính được trình bày trong [87].Thuật toán lặp P-I, cũng giống các thuật toán học tăng cường khác, có thể đượcthực thi trực tuyến trên cấu trúc Actor-Critic [88] Trong cấu trúc Actor-Critic này,dựa trên khả năng xấp xỉ bất kỳ hàm phi tuyến trơn trên một tập đóng của mạngnơron, hàm chi phí Vk(x) và luật điều khiển uk+1(x) được xấp xỉ bằng hai mạngnơron, được gọi tương ứng là mạng nơron Critic và mạng nơron Actor
Với mỗi k = 0, 1, , hàm Vk(x) và luật điều khiển uk+1(x) được xấp xỉ trên miền
Ω như sau:
ˆ
Vk(x) =CkTΦ(x)ˆ
trong đó, Φ(x) : Rn → RN 1 và Ψ(x) : Rn → RN 2, với N1 và N2 là các số nguyêndương đủ lớn, là véctơ các hàm trơn độc lập tuyến tính trên miền Ω và bằng khôngtại x = 0, Ck ∈ RN 1 và Wk ∈ RN 2 ×m
là véctơ hoặc ma trận trọng số được cập nhật.Nói cách khác, với mạng Critic, ta sử dụng một mạng nơron với N1 nơron ở lớp ẩn
và hàm kích hoạt Φ(x), trọng số của lớp ẩn và không thay đổi trong suốt quá trìnhhuấn luyện Đầu ra của mạng có hàm kích hoạt là hàm tuyến tính, với véctơ trọng
số là ck Tương tự với mạng nơron Actor có m đầu ra dùng để xấp xỉ uk
Viết lại (2.65) dưới dạng sau:
˙x = F (x) + G(x)uk+ G(x)(u − uk), (2.75)Xét đạo hàm của Vk kết hợp với (2.66) và (2.73) ta có:
(u − ˆuk)TRWk+1T Ψ(x)dτ
=
Z t+T t
[q(x) + ˆuTkRˆuk]dτ + ek,
(2.78)
với ek là tổng sai lệch do xấp xỉ bằng mạng nơ-ron
Trang 35Áp dụng thuật toán lặp P-I, ta có thể giải được các trọng số mạng nơron ˆCk vàˆ
Wk bằng phương pháp tối thiểu hóa hàm sai lệchPL
i=1e2 k,i trong (2.78) sau khi thuthập đủ dữ liệu của các khoảng thời gian lấy mẫu tại t0, t1, , tL
Giải thiết 2.2 Giả sử tồn tại số tự nhiên l0 và δ > 0 sao cho với mọi L ≥ l0 ta có:
1L
1
Khanh G Tran et al., "Điều khiển xe hai bánh tự cân bằng mô hình bất định dựa trên phương pháp quy hoạch động thích nghi" Hội nghị khoa học toàn quốc lần thứ nhất về Động lực học và Điều khiển, 2019
Trang 362.4 Kết luận
Trong chương này, em đã trình bày mô hình toán của xe hai bánh tự cân bằng(2.44) Mô hình này gồm có hai đầu vào là mô men tác độc lên bánh trái τL và mômen tác động lên bánh phải τR Đầu ra quan tâm của mô hình gồm góc nghiêngcủa thân xe theo phương thẳng đứng θ, góc hướng của xe trong hệ tọa độ toàn cục
Ψ và vị trí xe theo hướng chuyển động x Từ góc hướng và vị trí xe, ta có thể tính
ra được tọa độ của xe trong hệ trục tọa độ toàn cục xC, yC theo công thức (2.11).Dựa trên mô hình toán (2.44), một mô hình tuyến tính tương đương có nhiễu đầuvào và bất định mô hình (2.63) đã được đề xuất sử sụng khai triển Taylor tại điểmcân bằng và xấp xỉ bậc nhất Mô hình tuyến tính tương đương này sẽ được sử dụng
để thiết kế các bộ điều khiển ở chương sau Ngoài ra, trong chương này một bộ điềukhiển ADP dựa trên cấu trúc Actor-Critic cũng được thiết kế cho mô hình phi tuyến(2.44) Tuy nhiên bộ điều khiển này chưa giải quyết được vấn đề nhiễu tác động ởđầu vào
Trang 37Chương 3
Xây dựng bộ điều khiển thích nghi bền vững
3.1 Thiết kế bộ điều khiển thích nghi bền vững
với bộ ước lượng nhiễu
3.1.1 Thiết kế bộ quan sát nhiễu tổng
Trong phần này, một bộ quan sát nhiễu đầu vào [80] được trình bày và áp dụngcho hệ thống (2.63) Sử dụng phương pháp Euler, ta có một mô hình gián đoạn xấp
xỉ của hệ thống (2.63) như sau
xk ≈ Adxk−1+ Bd(uk+ dck), (3.1)trong đó:
Ad=I + TsA,
I là ma trận đơn vị, và Ts là thời gian lấy mẫu
Một mô hình tham chiếu sẽ được sử dụng để ước lượng nhiễu dck như sau
zk = Adzk−1+ Bd(uk− ˆdck−1), (3.3)trong đó ˆdck−1 là nhiễu được ước lượng ở thời điểm trước đó k − 1 Do đó, hệ thống(3.1) có bù nhiễu ˆdck−1 được biểu diễn là
Thì một ước lượng tối ưu của dck là
ˆc
k= (BdTBd)−1BdT[xk− zk− Adxk−1+ Adzk−1] (3.9)
Trang 38Định lý 3.1 ([80]) Nếu hệ thống (3.5) có rank(B) = 2, trạng thái đo được xk =x(tk) từ hệ thống (3.5) được biểu diễn chính xác bởi mô hình gián đoạn sau
xk= Adxk−1+ Bd(u + dck− ˆdck−1), (3.10)với Ts> 0 được chọn phù hợp, thì nhiễu ước lượng (3.9) sẽ thỏa mãn
dck = (BdTBd)−1Bd[xk− zk− δk] (3.12)
Do đó, sai số ước lượng là
ˆc
k− dck= (BdTBd)−1BdTδk (3.13)Tuy nhiên, δk thì tỉ lệ với T2
s vì sai số cục bộ [45] Do đó, sai số ước lượng có thểlàm nhỏ bằng cách giảm thời gian lấy mẫu Ts
Nhiễu tổng ước lượng được dùng để bù hệ thống (2.63) như trong (3.5), trong đó
ˆc(t) = ˆdc
∀t, kTs ≤ t < (k + 1)Ts, and ∀k = 0, 1, , Chú ý rằng nhiễu tổng ước lượng ˆdc(t)giống như một chuỗi hàm bước nhảy
Tóm lại, bộ quan sát nhiễu tổng được thực hiện như sau:
1 Khởi tạo: Chọn Ts > 0 đủ nhỏ Gán ˆdc0 = 0 Đo trạng thái x0 của hệ thống(2.44) tại thời điểm t0 = 0 Gán z0 = x0
2 Thực hiện các phép toán lần lượt với k = 1, 2, , :
a) Đo trạng thái xk của hệ thống (2.44) tại thời điểm tk= kTs
b) Tính zk từ phương trình (3.3) và tính ˆdck từ phương trình (3.11)
c) Gán zk = xk, trở lại bước a)
Hệ thống (3.5) được sử dụng để thiết kế bộ điều khiển phản hồi trạng thái và bộđiều khiển bám quỹ đạo dựa trên bộ quan sát nhiễu (3.11) trong phần tiếp theo
Trang 393.1.2 Phân tích tính ổn định của hệ kín
Trong phần này, tính ổn định của hệ kín (3.5) với bộ điều khiển phản hồi trạngthái được phân tích Một số giả thiết được cho như sau
Giải thiết 3.1 dc(t) là liên tục ∀t ≥ 0 và dtddc(t) bị chặn
Giải thiết 3.2 Tồn tại một bộ điều khiển phản hồi trạng thái u = −Kx thỏa mãnđiều kiện ma trận A − BK là Hurwitz(tất cả phần thực của các giá trị riêng đềuâm)
Trong luận án ma trận K được thiết kế sử dụng phương pháp điều khiển LQRnhư đã trình bày ở phần chương 2
Bổ đề 3.1 Với giả thiết 3.1, hệ thống (3.5) với bộ điều khiển phản hồi trạng thái
K thỏa mãn giả thiết 3.2 là ổn định đầu vào tới trạng thái (ISS)
Chứng minh Đặt
γ
k(t) = dc(t) − ˆdck−1với ∀t, kTs ≤ t ≤ (k + 1)Ts và
γ
k(t) = 0cho ∀t /∈ [kTs, (k + 1)Ts]
wk(t) =
(
1, ∀t, kTs ≤ t < (k + 1)Ts
0, t /∈ [kTs, (k + 1)Ts) (3.15)Thì γ(t) cũng bị chặn
Thay γ(t) và bộ điều khiển
Trang 40Vì ˆA là Hurwitz theo giả thiết 3.2, với ∀Q > 0 và QT = Q, phương trình Lyapunov
trong đó |∗| ký hiệu chuẩn vô cùng L∞, λmin là giá trị riêng nhỏ nhất của ma trận Q
Khi x nằm bên ngoài miền
thì ˙V < 0, do đó x → Γ chứa gốc không Cho nên, hệ thống (3.17) là ổn định đầuvào tới trạng thái (ISS) [82] Điều này có nghĩa là hệ thống (3.5) ổn định ISS.Tóm lại, bộ điều khiển phản hồi trạng thái với nhiễu đầu vào là
trong đó ma trận khuếch đại K có thể được thiết kế sử dụng các phương pháp hiện
có như điều khiển LQR, phương pháp gán điểm cực hoặc thậm chí là điều khiểnH∞ Bộ điều khiển đề xuất không chỉ đơn giản về thiết kế mà còn cả về vấn đề càiđặt Hơn nữa, bộ điều khiển này có thể xử lý được bất định mô hình và nhiễu đầuvào của xe Trong phần tiếp theo, bộ điều khiển bám quỹ đạo sẽ được đề xuất cho
xe có bất định mô hình và nhiễu đầu vào
3.1.3 Thiết kế bộ điều khiển bám thích nghi bền vững cho