Phát triển bộ điều khiển trượt thích nghi nêu trên thành bộ điều khiển trượt thích nghi phân ly DANSMC cho hệ phi tuyến đa biến. Áp dụng các nghiên cứu về điều khiển trượt thích nghi phân ly lên hệ con lắc ngược xoay và con lắc ngược hai chiều thông qua mô phỏng và thực nghiệm.
Trang 1
ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
Trang 2ĐẠI HỌC QUỐC GIA TP HCM
TRƯỜNG ĐẠI HỌC BÁCH KHOA
Phản biện 2: PGS.TSKH HỒ ĐẮC LỘC
Phản biện 3: PGS.TS NGUYỄN TẤN TIẾN
NGƯỜI HƯỚNG DẪN KHOA HỌC
1 PGS TS DƯƠNG HOÀI NGHĨA
2 TS NGUYỄN ĐỨC THÀNH
Trang 3i
LỜI CAM ĐOAN
Tác giả xin cam đoan đây là công trình nghiên cứu của bản thân tác giả Các kết quả nghiên cứu và các kết luận trong luận án này là trung thực, và không sao chép từ bất kỳ một nguồn nào và dưới bất kỳ hình thức nào Việc tham khảo các nguồn tài liệu (nếu có) đã được thực hiện trích dẫn và ghi nguồn tài liệu tham khảo đúng theo yêu cầu
Tác giả luận án
Nguyễn Đức Minh
Trang 4ii
ABSTRACT
Variable Structure Control with sliding mode or Sliding Mode Control is known as a simple but effective robust non-linear control method This method has many advanced features such as good performance and robustness against parameter variations However, because of the switching of the control signal, there is a high frequency oscillation of the phase portrait around the sliding surface Furthermore, designing SMC requires an upper bound of the model uncertainty The model uncertainty often consists of the non-model dynamic and the variation of the plant parameters If the actual modelling error exceeds the uncertainty upper bound used to design the controller, the system stability will not be guaranteed In addition, like traditional control methods, designing SMC requires a mathematical model of the plant The control performance may be deteriorated in case of imprecise or time varying model parameters
well-This work aims to study a neural network based adaptive sliding mode controller for uncertain non-linear dynamical system It consists of three main points:
- The combination of neural networks and the sliding mode control theory to design an adaptive sliding mode controller for uncertain non-linear dynamical systems This new controller can be characterized by: (i) it is a direct neural network controller; (ii) the controller is identified on line without need of initial model, (iii) it has the ability to adjust itself to cope with the variations of the upper bounds of the uncertainty and it is noise insensitive
- The development of the adaptive sliding mode controller mentioned above to the Decoupled Adaptive Sliding Mode Controller DANSMC for multivariable non-linear systems
- The proposed controller has been successfully tested with an inverted rotary pendulum and an inverted two-dimensional pendulum through simulations and experiments
Main results
Trang 5iii
- The proposed sliding mode controller consists of two components: the equivalent controller and the robust controller; it has a smooth form, it can overcome the chattering phenomenon and it is appropriate for training the neural network
- The update-law for one hidden layer feed forward neural network has been carried out based on Lyapunov stability theory, which involves two feedback signals: sliding surface signal and its derivative The neural network can be trained online without need of plant model nor its uncertainty upper bound
- It is shown that the proposed neural network controller can completely replace the traditional sliding mode controller By using the system states as inputs instead of sliding surface signals, DANSMC exploits the ability of neural network Simulation results also show that the system can self-develop to improve the control performance
- Theories and simulations show that the DNSMC controller can adjust itself to adapt to the variations of the plant as well as its uncertainty
Trang 6iv
TÓM TẮT LUẬN ÁN
Điều khiển có cấu trúc thay đổi VSC (Variable Structure Control) với chế độ trượt, hay điều khiển trượt SMC (Sliding Mode Control) được biết đến như là một phương pháp điều khiển phi tuyến bền vững đơn giản, hiệu quả Phương pháp điều khiển này có nhiều ưu điểm như: (i) ít nhạy với sự biến thiên của các thông số của hệ thống; (ii) có khả năng chống nhiễu tốt; (iii) đáp ứng động học nhanh Tuy nhiên do tín hiệu điều khiển trượt cổ điển có dạng chuyển mạch nên tồn tại hiện tượng dao động có tần số cao (chattering) của các quỹ đạo pha xung quanh mặt trượt Hơn nữa, khi thiết
kế điều khiển SMC yêu cầu phải biết trước giá trị chặn trên của các thành phần bất
định của hệ thống Các thành phần bất định thường bao gồm các thành phần động học không mô hình, sự biến thiên của các thông số và nhiễu loạn Nếu giá trị chặn trên thực vượt quá giá trị chặn trên được giả thiết trong khi thiết kế bộ điều khiển, sự ổn
định của hệ thống sẽ không được bảo đảm Ngoài ra cũng giống như các phương pháp
điều khiển kinh điển khác, việc thiết kế bộ điều khiển trượt yêu cầu phải biết mô hình toán học cùng các thông số của mô hình của đối tượng Điều này sẽ ảnh hưởng tới chất lượng điều khiển trong một số ứng dụng mà ở đó mô hình toán học của đối tượng được
điều khiển khó xác định một cách chính xác và các thông số có tầm biến thiên rộng Luận án tiến sĩ nghiên cứu phương pháp điều khiển trượt thích nghi dùng mạng nơ-ron áp dụng cho hệ phi tuyến động bất định không rõ thông số mô hình với ba nội dung chính:
Kết hợp lý thuyết điều khiển trượt và mạng nơ-ron để thiết kế bộ điều khiển trượt thích nghi dùng mạng nơ-ron áp dụng cho hệ thống phi tuyến động bất định không rõ thông số mô hình Bộ điều khiển mới có các đặc điểm: (i) là một mạng nơ-ron được dùng làm bộ điều khiển trực tiếp; (ii) không cần nhận dạng trước các thông số của mô hình đối tượng, luật điều khiển được suy ra trực tiếp trong quá trình huấn luyện trực tuyến; (iii) có khả năng thích nghi trước sự thay đổi của các chặn trên của các thành phần bất định và có khả năng kháng nhiễu tốt
Phát triển bộ điều khiển trượt thích nghi nêu trên thành bộ điều khiển trượt thích nghi phân ly DANSMC cho hệ phi tuyến đa biến
Áp dụng các nghiên cứu về điều khiển trượt thích nghi phân ly lên hệ con lắc ngược xoay và con lắc ngược hai chiều thông qua mô phỏng và thực nghiệm
Trang 7v
Các kết quả đạt được của luận án
- Luật điều khiển trượt được đề nghị trong luận án bao gồm cả hai thành phần
điều khiển tương đương và điều khiển bền vững, có dạng hàm trơn, có khả năng khắc phục được hiện tượng chattering và phù hợp để huấn luyện cho mạng nơ-ron
- Luật cập nhật cho mạng nơ-ron truyền thẳng một lớp ẩn được đề nghị dựa trên
lý thuyết ổn định của Lyapunov với hai tín hiệu hồi tiếp bao gồm tín hiệu mặt trượt và
đạo hàm của nó đã được chứng minh là đáp ứng được yêu cầu của luật điều khiển trượt được đề nghị và có khả năng huấn luyện trực tuyến cho mạng nơ-ron trở thành
bộ điều khiển trượt thích nghi mà không cần phải nhận dạng trước các thông số của
đối tượng và các giá trị chặn trên của các thành phần bất định của hệ thống
- Với mô hình điều khiển được đề nghị trong luận án mạng nơ-ron truyền thẳng một lớp ẩn đã thay thế hoàn toàn bộ điều khiển trượt Với đặc điểm ngõ vào của mạng
là các biến trạng thái (khác với ngõ vào là tín hiệu mặt trượt như một số phương pháp
điều khiển trượt dùng mạng nơ-ron khác), phương pháp DANSMC đã khai thác được khả năng nhớ theo trạng thái của mạng nơ-ron và qua các kết quả mô phỏng đã cho thấy khả năng tự nâng cấp chất lượng điều khiển của hệ thống qua từng phiên điều khiển
- Lý thuyết và mô phỏng cũng đã cho thấy khả năng tự thay đổi để thích nghi của bộ điều khiển DANSMC trước sự thay đổi của các thông số của đối tượng cũng như các chặn trên của các thành phần bất định
Trang 8vi
LỜI CÁM ƠN
Tôi xin tỏ lòng biết ơn sâu sắc đến PGS TS Dương Hoài Nghĩa và TS Nguyễn
Đức Thành, hai người thầy đã hướng dẫn tận tình trong suốt thời gian tôi làm nghiên cứu sinh tại Đại học Bách Khoa Những gợi ý đúng lúc hết sức quý báu cùng những ý kiến phản biện sâu sắc của các thầy đã giúp tôi nhận thức, định hướng đúng và hoàn thiện nghiên cứu của mình Trong những năm cùng làm nghiên cứu với các thầy, tôi không chỉ học được các phương pháp nghiên cứu khoa học mà còn học được nhiều
điều về tư cách, đạo đức trong cuộc sống
Xin chân thành cảm ơn các thầy cô Bộ môn Tự Động ĐHBK TPHCM vì đã truyền đạt cho tôi những kiến thức nền tảng hết sức quý báu trong thời gian tôi còn học cao học, cũng như những góp ý khoa học và những phản biện thẳng thắn trong khi tôi thực hiện các chuyên đề tiến sĩ là những cơ sở hết sức có giá trị giúp tôi hoàn chỉnh luận án của mình
Xin cảm ơn vợ, và các con tôi đã cùng chia xẻ trong những ngày khó khăn nhất
cả về vật chất và tinh thần để tôi có thể yên tâm thực hiện luận án này
Xin gửi lời cảm ơn đến các đồng nghiệp là các giảng viên của Khoa tin học trường Đại học Yersin và bạn bè thân hữu, những người luôn giúp đỡ và động viên tôi trong những năm tháng làm luận án
Mặc dù đã cố gắng hết sức nhưng luận án không tránh khỏi những thiếu xót Tác giả rất mong được sự góp ý của quý thầy cô và các bạn đồng nghiệp
Trang 9vii
MỤC LỤC
1 TỔNG QUAN 1
1.1 Đặt vấn đề 1
1.2 Mục tiêu và phương pháp nghiên cứu của luận án 4
2 LÝ THUYẾT CƠ SỞ 8
2.1 Lý thuyết điều khiển trượt 9
2.1.1 Đối tượng điều khiển 9
2.1.2 Mặt trượt 9
2.1.3 Luật điều khiển trượt kinh điển 10
2.1.4 Điều khiển trượt cho hệ thống MIMO 12
2.1.5 Đặc điểm của điều khiển trượt 14
2.2 Xấp xỉ hàm của mạng nơ-ron truyền thẳng 15
2.3 Một số mô hình điều khiển trượt dùng mạng nơ-ron 18
2.3.1 Mô hình sử dụng mạng nơ-ron làm thành phần điều khiển tương đương 19 2.3.2 Mô hình điều khiển trượt phân ly dùng mạng nơ-ron 20
3 ĐIỀU KHIỂN TRƯỢT THÍCH NGHI PHÂN LY DÙNG MẠNG NƠ-RON 28
3.1 Điều khiển trượt thích nghi dùng mạng nơ-ron 28
3.1.1 Mô tả bộ điều khiển 28
3.1.2 Luật cập nhật thích nghi để huấn luyện mạng 29
3.2 Điều khiển trượt thích nghi phân ly dùng mạng nơ-ron DANSMC 33
4 KẾT QUẢ MÔ PHỎNG VÀ THỰC NGHIỆM 38
4.1 Điều khiển trượt thích nghi phân ly con lắc ngược hai bậc xoay tự do 38
4.1.1 Mô tả con lắc ngược xoay 38
4.1.2 Phân tích điều khiển 39
4.1.3 Mô tả quá trình và các kết quả mô phỏng 42
4.1.4 Mô tả quá trình và các kết quả thực nghiệm 56
4.2 Điều khiển trượt thích nghi phân ly con lắc hai chiều 66
5 KẾT LUẬN 73
6 CÁC TÀI LIỆU CÔNG BỐ CỦA TÁC GIẢ 77
7 Tài liệu tham khảo 78
Trang 10viii
DANH MỤC CÁC HÌNH ẢNH
Hình 2-1 Tín hiệu điều khiển trượt có dạng chuyển mạch 14
Hình 2-2 Mô phỏng quỹ đạo pha và hiện tượng chattering 15
Hình 2-3 Mạng nơ-ron một lớp ẩn trong bộ điều khiển DNNSMC 23
Hình 2-4 Hệ thống DNNSMC của Lon-Chen Hung và Hung Yuan Chung 24
Hình 2-5 Mô hình điều khiển trượt phân ly dùng thuật toán SPSA 25
Hình 2-6 Đáp ứng góc con lắc ngược của điều khiển DNNSMC so với DFSM 25
Hình 3-1 Mạng nơ-ron dùng làm bộ điều khiển 29
Hình 3-2 Mô hình điều khiển trượt thích nghi phân ly 35
Hình 4-1 Mô hình con lắc ngược xoay 39
Hình 4-2 Mô hình con lắc ngược trên simulink 41
Hình 4-3 Mô phỏng điều khiển DANSMC lên con lắc ngược xoay 41
Hình 4-4 Mô phỏng điều khiển DNNSMC lên con lắc ngược xoay trong 10s đầu tiên 45
Hình 4-5 Mô phỏng điều khiển DNNSMC lên con lắc ngược xoay trong 0.5s đầu tiên 46
Hình 4-6 Đáp ứng của tín hiệu mặt trượt của điều khiển DNNSMC 47
Hình 4-7 Quỹ đạo pha các biến trạng thái của điều khiển DNNSMC 48
Hình 4-8 Quỹ đạo pha các biến trạng thái của điều khiển DNNSMC trong quá trình quá độ 49
Hình 4-9 Quá trình huấn luyện và hội tụ bộ điều khiển DANSMC 50
Hình 4-10 Đáp ứng của tín hiệu trượt qua các phiên huấn luyện của điều khiển DANSMC 51
Hình 4-11 Đáp ứng của điều khiển DANSMC 52
Hình 4-12 Đáp ứng của tín hiệu mặt trượtcủa điều khiển DASMC 53
Hình 4-13 Quỹ đạo pha các biến trạng thái của điều khiển DANSMC 54
Hình 4-14 So sánh đáp ứng của điều khiển DNNSMC và DANSMC 55
Hình 4-15 Kết cấu phần cứng mô hình thực nghiệm để điều khiển trượt thích nghi phân ly con lắc ngược xoay dùng mạng nơ-ron 57
Hình 4-16 Mô hình thực con lắc ngược trong phòng thí nghiệm 58
Hình 4-17 Sơ đồ khối chip vi điều khiển TMS320 2812 59
Hình 4-18 Đáp ứng của trong 30 giây.(lật lên và ổn định) 62
Hình 4-19 Đáp ứng của trong 30 giây 62
Hình 4-20 Tín hiệu điều khiển u trong 30 giây 63
Hình 4-21 Đáp ứng của góc khi thay đổi khối lượng và chiều dài con lắc 64
Hình 4-22 Đáp ứng của góc khi thay đổi khối lượng và chiều dài con lắc 65
Hình 4-23 Con lắc ngược hai chiều 66
Hình 4-24 Biểu diễn hệ tọa độ con lắc ngược hai chiều 67
Hình 4-25 Mô hình điều khiển DANSMC cho con lắc ngược hai chiều 69
Hình 4-26 Kết quả phiên huấn luyện thứ nhất 70
Hình 4-27 Kết quả của phiên huấn luyện thứ hai 70
Hình 4-28 Quỹ đạo x-y của phiên huấn luyện thứ nhất và thứ hai 71
Hình 4-29 Mô phỏng với biên độ nhiễu biến thiên 71
Hình 4-30 Mô phỏng với biên độ nhiễu biến thiên mạnh 72
Trang 11ix
DANH MỤC BẢNG BIỂU
Bảng 1 Bộ trọng số thu được sau phiên huấn luyện đầu tiên 43 Bảng 2 Bộ trọng số thu được sau phiên huấn luyện cuối 44
Trang 12x
DANH MỤC CÁC TỪ VIẾT TẮT VÀ THUẬT NGỮ ĐỐI CHIẾU
ANSMC (Adapative Neural Sliding Mode Control): Điều khiển trượt thích nghi dùng
mạng nơ-ron
CCS (Code Composer Studio): phần mềm hỗ trợ lập trình và giao tiếp với bo mạch xử
lý tín hiệu số
Chattering: Hiện tượng dao động xung quanh mặt trượt
DANSMC (Decoupled Adaptive Neural Sliding Mode Control): Điều khiển trượt
thích nghi phân ly dùng mạng nơ-ron
DNNSMC (Decoupled Neural Network Sliding Mode Control): Điều khiển trượt phân
ly dùng mạng nơ-ron
DSP ( Digital Signal Processing): Xử lý tín hiệu số
Lyapunov: Lý thuyết ổn định được phát biểu bởi Lyapunov
NN (Neural Network): Mạng nơ-ron
SMC (Sliding Mode Control): Điều khiển trượt
SHL (Single Hidden Layer): Mạng nơ-ron một lớp ẩn
RBFN (Radial Basic Funtion Network): Mạng hàm cơ sở xuyên tâm
MLP (Multiple Layer Perceptron): Mạng nơ-ron nhiều lớp
Perceptron: Một đơn vị trong mạng nơ-ron
Swinging up: Điều khiển lật lên (cho con lắc ngược)
Sliding surface : mặt trượt
VSC (Variable Structure Control): điều khiển có cấu trúc thay đổi
Trang 131
1.1 Đặt vấn đề
Giới thiệu về điều khiển trượt
Điều khiển trượt là một phương pháp điều khiển phi tuyến đơn giản hiệu quả, dựa vào hồi tiếp các biến trạng thái của hệ thống Bộ điều khiển được thiết kế sao cho các trạng thái của hệ thống luôn luôn hướng về một mặt phẳng Hurwitz của các trạng thái, một khi các trạng thái đã nằm trên mặt trượt thì chúng sẽ tiến về gốc tọa độ Vì vậy mục đích điều khiển ổn định trạng thái trở thành điều khiển ổn định tiệm cận các trạng thái bám trên mặt trượt
Điều khiển trượt có hai thành phần là thành phần điều khiển tương đương và thành phần điều khiển bền vững Thành phần điều khiển bền vững mà trong nhiều tài liệu còn gọi là thành phần điều khiển hiệu chỉnh có nhiệm vụ chính là điều khiển quỹ
đạo các trạng thái hướng về mặt trượt Khi quỹ đạo các trạng thái đã ở lân cận mặt trượt thì thành phần điều khiển tương đương có tác dụng điều khiển các trạng thái bám chặt trên mặt trượt
Để thiết kế thành phần điều khiển tương đương trong điều khiển trượt cần phải biết rõ các hàm toán học phi tuyến của mô hình đối tượng và để thiết kế thành phần
điều khiển bền vững trong điều khiển trượt thì cần phải biết các chặn trên của các thành phần bất định của mô hình Trong đó các dạng của thành phần bất định của hệ thống bao gồm: nhiễu ảnh hưởng lên hệ thống, nhiễu đo đạc, và sai số mô hình do các thông số của đối tượng biến thiên theo thời gian
Ưu điểm của điều khiển trượt là nó ít nhạy với sự biến động của các thông số của
mô hình và ảnh hưởng của nhiễu bên ngoài
Điều khiển trượt đã được áp dụng khá thành công để thiết kế các bộ điều khiển bền vững trong phòng thí nghiệm và ứng dụng rộng rãi trong thực tiễn
Một số vấn đề của điều khiển trượt cổ điển
Tuy nhiên khi thiết kế các bộ điều khiển trượt có một số vấn đề thường gặp phải như sau:
Trang 142
- Thành phần điều khiển bền vững trong điều khiển trượt có dạng hàm dấu kết hợp với hiện tượng trễ vật lý của các đối tượng gây nên hiện tượng chattering các trạng thái xung quanh mặt trượt Thông thường để hạn chế hiện tượng chattering người thường thay thế hàm dấu trong thành phần điều khiển bền vững bằng hàm bão hòa
- Việc xác định các giá trị chặn trên của các thành phần bất định thường không chính xác Người ta thường dùng các giá trị hằng để ước lượng các giá trị này Khi thiết kế thành phần điều khiển bền vững, nếu việc chọn giá trị chặn trên quá lớn sẽ làm gia tăng hiện tượng chattering, làm tổn hao năng lượng điều khiển không cần thiết và xảy ra nhiều hiện tượng không mong muốn Còn khi giá trị chặn trên thực lớn hơn giá trị chặn trên theo thiết kế thì hệ thống sẽ mất tính ổn định
Bài toán điều khiển trượt khi áp dụng cho các hệ thống đa biến là một bài toán khá phức tạp Trong tài liệu [1] được giới thiệu năm 2000 dựa trên nhiều nghiên cứu trước đó, Utkin đã giới thiệu một số các phương pháp thiết kế các bộ điều khiển trượt phân ly áp dụng được cho các hệ thống phi tuyến bậc bốn Các phương trình vi phân biểu diễn mô hình động học của đối tượng được đề nghị biến đổi để đưa về dạng hệ phương trình chuẩn đã được định nghĩa trước đó Sau đó bài toán phân ly biến số được giải quyết dựa trên việc xét từng trường hợp riêng với một loạt các phép biến đổi toán học và chỉ có thể áp dụng lên từng đối tượng cụ thể chứ không có phương pháp biến
đổi tổng quát Các nghiên cứu đã được thực hiện phân tích mô hình động học và thiết
kế bộ điều khiển phân ly các đối tượng phi tuyến có độ bất ổn cao như hệ xe con lắc
Thành phần ñiều khiển tương ñương
Thành phần ñiều khiển bền vững
Luật ñiều khiển trượt cổ ñiển
Thông số ñối tượng
phi tuyến thông qua
Trang 153
đơn, hệ xe con lắc đôi và hệ con lắc xoay hai bậc tự do Tuy nhiên, các bài toán cho thấy độ phức tạp cao và không dễ dàng thành công nếu áp dụng lên những đối tượng phi tuyến khác
Điều khiển trượt thích nghi dùng mạng nơ-ron
Trong những năm gần đây ứng dụng khả năng học được để xấp xỉ thích nghi các hàm phi tuyến, một số nghiên cứu đã sử dụng mạng nơ-ron hoặc nơ-ron mờ để thay thế một phần hoặc hoàn toàn bộ điều khiển trượt cổ điển
Thông thường để thiết kế thành phần điều khiển tương đương của điều khiển trượt cổ điển cần phải nhận dạng trước các thông số của mô hình đối tượng Nhận dạng thông số mô hình đối tượng thường phức tạp (có khi không thực hiện được) nhất
là đối với các đối tượng có tính phi tuyến và độ bất ổn cao Tín hiệu điều khiển sau khi thiết kế không như mong muốn do sai số nhận dạng và thường phải bù sai số nhận dạng bằng các phương pháp điều khiển thích nghi
Ưu điểm của các bộ điều khiển trượt dùng mạng nơ-ron là không cần biết trước các thông số cũng như các chặn trên của các hàm phi tuyến của mô hình động học, và hạn chế được hiện tượng chattering so với điều khiển trượt cổ điển
Trong một số nghiên cứu [2], [3], [4], [5], [6] [7] thành phần điều khiển bền vững
được tách ra và hoạt động ở vùng xa mặt trượt, còn ở lân cận mặt trượt thì mạng ron hoặc nơ-ron mờ được dùng để thay thế thành phần điều khiển tương đương của
nơ-điều khiển trượt cổ điển
Trong một số nghiên cứu khác [8], [9], [10] hàm dấu trong thành phần điều khiển bền vững được thay thế bằng hàm bão hòa để hạn chế hiện tượng chattering và mạng nơ-ron hoặc nơ-ron mờ cũng được dùng để thay thành phần điều khiển tương đương với mục đích là để bù cho các sai số mô hình và các thành phần bất định của đối tượng Trong tất cả các nghiên cứu trên, các mạng nơ-ron hoặc nơ-ron mờ được huấn luyện trực tuyến với các luật cập nhật được đề nghị khá đơn giản chủ yếu dựa trên tín hiệu hồi tiếp là tín hiệu mặt trượt Các chứng minh về sự ổn định của hệ thống, sự hội
tụ của các luật điều khiển trượt mạng nơ-ron thường dựa trên lý thuyết ổn định của Lyapunov
Đặc điểm của các phương pháp nghiên cứu này là chúng vẫn sử dụng luật điều khiển trượt cổ điển làm cơ sở Mạng nơ-ron chỉ dùng để thay thế thành phần điều
Trang 164
khiển tương đương Hàm dấu trong thành phần điều khiển bền vững thường được thay thế bằng hàm bảo hòa để hạn chế hiện tượng chattering Tuy nhiên các chặn trên dùng trong thiết kế thành phần điều khiển bền vững vẫn là các giá trị hằng được chọn trước,
vì vậy chất lượng điều khiển vẫn phụ thuộc vào việc lựa chọn các giá trị hằng khi thiết
kế thành phần điều khiển bền vững
Vì bài toán điều khiển trượt dùng mạng nơ-ron hay nơ-ron mờ không có mô hình toán học rõ ràng nên không thể áp dụng các phương pháp điều khiển trượt phân ly cổ
điển [1], nên trong các tài liệu [7], [8], [9], [10] các tác giả đã đề nghị một mô hình
điều khiển trượt phân ly đơn giản nhưng rất hiệu quả để kết hợp với bộ điều khiển trượt dùng mạng nơ-ron thành bộ điều khiển trượt phân ly dùng mạng nơ-ron áp dụng
để điều khiển cho các hệ thống đa biến
Các kết quả nghiên cứu bằng lý thuyết cũng như mô phỏng và thực nghiệm trên nhiều đối tượng con lắc ngược, hệ cầu banh, cánh tay máy…, đã cho thấy các bộ điều khiển phân ly dùng mạng nơ-ron có khả năng điều khiển thích nghi trong những điều kiện không biết trước các hàm phi tuyến của đối tượng và có khả năng hạn chế được hiện tượng chattering
Tuy nhiên việc tách thành phần điều khiển bền vững với thành phần điều khiển tương đương hoặc việc thay thế hàm dấu bằng hàm bão hòa trong thành phần điều khiển bền vững đã làm giảm tính bền vững của hệ thống trước nhiễu ở vùng sát mặt trượt
1.2 Mục tiêu và phương pháp nghiên cứu của luận án
Mục tiêu nghiên cứu của luận án
Mục tiêu luận án là phát triển các nghiên cứu về điều khiển trượt cổ điển và điều khiển trượt dùng mạng nơ-ron để thiết kế bộ điều khiển trượt thích nghi phân ly DANSMC áp dụng cho hệ phi tuyến đa biến sử dụng mạng truyền thẳng làm bộ điều khiển trực tiếp kết hợp được cả hai thành phần điều khiển tương đương và điều khiển bền vững trong điều kiện không biết trước các thông số mô hình của đối tượng và các chặn trên của các thành phần bất định hoặc hơn nữa các thông số của mô hình và các giá trị chặn trên có thể bị thay đổi trong quá trình điều khiển Luật điều khiển trượt
được nghiên cứu thiết kế theo hướng sao cho nó không chứa hàm có dấu nhằm khắc
Trang 17nơ-hệ thực (Kỹ thuật điều khiển con lắc ngược dùng mạng nơ-ron có thể phát triển để
điều khiển các đối tượng phi tuyến khác như rô-bốt di chuyển cân bằng trên hai bánh, tên lửa, cánh tay rô-bốt ….)
Phương pháp nghiên cứu trong luận án
Về lý thuyết
- Nghiên cứu thiết kế một luật điều khiển trượt không có thành phần chuyển mạch Tín hiệu phản hồi bao gồm cả tín hiệu mặt trượt và đạo hàm của nó cho phép xác định một quỹ đạo cho trước của tín hiệu mặt trượt nhằm khắc phục hiện tượng chattering
- Nghiên cứu sử dụng một mạng truyền thẳng với ngõ vào là các sai số trạng thái
và ngõ ra là tín hiệu điều khiển làm bộ điều khiển trượt thích nghi Luật cập nhật thích nghi với tín hiệu hồi tiếp bao gồm tín hiệu mặt trượt và đạo hàm của nó Giải thuật huấn luyện mạng được xây dựng sao cho quỹ đạo pha của hệ thống hội tụ về mặt trượt theo một quỹ đạo cho trước trong điều kiện đối tượng bất định Mạng truyền thẳng
được sử dụng làm bộ điều khiển trượt thích nghi trực tiếp cho cả hai thành phần điều khiển tương đương và hiệu chỉnh Nhờ đó mà không chỉ các thông số của mô hình đối tượng mà cả các giá trị chặn trên cũng được cập nhật đầy đủ cho thành phần điều khiển bền vững
Về ứng dụng
- Cuối cùng luận án nghiên cứu kết hợp giữa điều khiển trượt dùng mạng nơ-ron với lý thuyết điều khiển phân ly để hình thành bộ điều khiển trượt thích nghi phân ly
áp dụng được cho các hệ thống đa biến
Các luật điều khiển và luật cập nhật được chứng minh dựa vào các hàm điều khiển Lyapunov
Trang 186
Các kết quả mô phỏng trên hệ thống con lắc ngược hai bậc xoay tự do và con lắc ngược hai chiều với đầy đủ các quy trình từ huấn luyện ban đầu nhằm kiểm chứng tính hội tụ của luật cập nhật thích nghi, đến các kết quả điều khiển bám theo quỹ đạo và các kết quả thực nghiệm trên hệ thực con lắc ngược xoay nhằm kiểm tra chất lượng của bộ
điều khiển trong điều kiện các thông số mô hình thay đổi liên tục và ảnh hưởng mạnh của nhiễu từ bên ngoài Các mô phỏng dựa trên phần mềm matlab và simulink, còn thực nghiệm dựa trên nền của board xử lý tín hiệu số DSP TMS320-2812 kết hợp với phần mềm CCS (Code Composer Studio)
Nội dung của luận án
Luận án được chia thành bốn chương chính với các nội dung như sau:
Chương một là chương tổng quan về điều khiển trượt, điều khiển trượt dùng mạng nơ-ron, mục đích cũng như phương pháp nghiên cứu của luận án
Chương hai giới thiệu các kiến thức cơ sở về mạng nơ-ron và lý thuyết điều khiển trượt, và một số mô hình điều khiển trượt dùng mạng nơ-ron Phần đầu của chương này giới thiệu mạng truyền thẳng với đầy đủ các cấu trúc cơ bản, khả năng xấp
xỉ các hàm phi tuyến và các phương pháp huấn luyện mạng Phần tiếp theo giới thiệu
lý thuyết điều khiển trượt cổ điển được đưa ra cùng một số phân tích về ưu nhược
điểm Phần cuối của chương này giới thiệu một số mô hình điều khiển trượt phân ly dùng mạng nơ-ron đã được phát triển trong những năm gần đây
Chương ba bao hàm nội dung chính của luận án Trong chương này một bộ điều khiển trượt thích nghi phân ly dùng mạng nơ-ron DANSMC được đề nghị với luật điều khiển trượt mới không có các thành phần chuyển mạch nhằm khắc phục hiện tượng chattering Hơn nữa, khác với các phương pháp điều khiển trượt dùng mạng nơ-ron khác được trình bày ở chương hai, mạng nơ-ron ở đây được dùng để thay thế cả hai thành phần điều khiển tương đương và điều khiển bền vững với tín hiệu hồi tiếp huấn luyện mạng bao gồm cả tín hiệu mặt trượt và đạo hàm của nó (trong khi các phương pháp khác chỉ sử dụng tín hiệu mặt trượt), có khả năng học được luật điều khiển mới
và khả năng cập nhật thích nghi, tự điều chỉnh luật điều khiển phù hợp nhằm bảo đảm chất lượng điều khiển khi các thông số của đối tượng bị thay đổi
Chương bốn mô tả ứng dụng phương pháp điều khiển trượt thích nghi phân ly DANSMC được giới thiệu trong chương ba vào hai mô hình con lắc ngược hai bậc
Trang 197
xoay tự do và con lắc ngược hai chiều là các mô hình phi tuyến cao, bất ổn và không cực tiểu pha cùng với các kết quả mô phỏng và thực nghiệm Trong các thí nghiệm này, các mạng nơ-ron được khởi tạo với giá trị ngẫu nhiên ban đầu nhỏ, với vùng không gian trạng thái được thu hẹp xung quanh điểm cân bằng ngược, và được mở rộng dần ra, cùng với chất lượng điều khiển được tăng dần Các mô phỏng trên con lắc hai chiều được thực hiện trong điều kiện con lắc di chuyển theo một quỹ đạo cho trước trên một mặt phẳng trong điều kiện bị tác động mạnh của nhiễu bên ngoài và sự biến thiên lớn các thông số của con lắc Các kết quả mô phỏng trên matlab và simulink và trên thực nghiệm thông qua phần mềm CCS đã cho thấy khả năng thích nghi trước sự thay đổi của các thông số mô hình và tính bền vững của bộ điều khiển được đề nghị dưới tác động mạnh của nhiễu bên ngoài Cũng trong chương này, một số kết quả mô phỏng điều khiển DNNSMC trên con lắc ngược xoay cũng được đưa ra nhằm so sánh với phương pháp điều khiển DANSMC
Chương năm khái quát lại sự khác biệt và các kết quả đạt được của các phương pháp nghiên cứu trong luận án so với các phương pháp nghiên cứu khác và nêu lên một số tồn tại cũng như phương hướng nghiên cứu khắc phục
Trang 208
Hình thành và phát triển từ thập niên năm mươi của thế kỷ hai mươi, điều khiển trượt đã trở nhanh chóng trở thành một trong những phương pháp kinh điển được ưa chuộng trong các phương pháp điều khiển các hệ phi tuyến Nhờ vào tính năng giảm bậc, ít nhạy đối với nhiễu, với sự biến thiên của các thông số của đối tượng, điều khiển trượt trở thành một công cụ mạnh để điều khiển các hệ thống động học bậc cao, phức tạp dưới các điều kiện bất định của hệ thống
Các nghiên cứu lý thuyết và thực hành điển hình về điều khiển trượt cổ điển đã
được trình bày đầy đủ trong các tài liệu [1], [11], [12], [13], [14]
Trong những năm gần đây nhiều công trình nghiên cứu kết hợp giữa điều khiển trượt cổ điển và điều khiển thông minh đã được công bố nhằm khắc phục một số nhược điểm còn tồn tại của điều khiển trượt cổ điển về tính tối ưu của tín hiệu điều khiển, hiện tượng chattering của các biến trạng thái xung quanh mặt trượt…, cũng như phát triển các luật điều khiển trượt mà không cần biết chính xác các thông số của đối tượng
Tổng hợp từ các nghiên cứu trên, chương này và trình bày lại một số nội dung chính, làm cơ sở để phát triển cho mô hình điều khiển trượt phân ly DANSMC sẽ được trình bày trong chương ba:
- Mô hình toán học của điều khiển trượt cổ điển dưới dạng tổng quát và phát triển
mô hình toán học của bộ điều khiển nhằm áp dụng cho các hệ thống phi tuyến bậc cao MIMO
- Mô hình toán học và các công thức để huấn luyện của mạng nơ-ron truyền thẳng nhiều lớp làm cơ sở để phát triển cho các mô hình điều khiển trượt dùng mạng nơ-ron và mô hình điều khiển trượt ANSMC được trình bày trong chương ba
- Một số nghiên cứu về điều khiển trượt thích nghi ứng dụng mạng nơ-ron đã
được công bố trong và ngoài nước được trình bày lại theo thứ tự phát triển từ những ý tưởng nghiên cứu ban đầu tới các công trình lý thuyết và thực tiễn đã được công bố trong những năm gần đây
Trang 219
2.1 Lý thuyết điều khiển trượt
2.1.1 Đối tượng điều khiển
Xét hệ thống phi tuyến biểu diễn bởi phương trình vi phân
d u y y g y
y f
++
x
x x
)
()(
và tín hiệu s
e c e c e
c e
n
n
1 2 )
2 ( 1 ) 1 (
+ +
= + + +
Nếu thực hiện được luật điều khiển sao cho s = 0, tín hiệu sai lệch e là nghiệm
của phương trình (2.6) Do các nghiệm của phương trình đặc trưng của (2.6) đều nằm
bên trái mặt phẳng phức, nên e(t) sẽ tiến tới 0 khi t tiến tới ∞ Phương trình s=0 xác
định một mặt cong S trong không gian n chiều gọi là mặt trượt (sliding surface) S
Trang 2210
Vấn đề đặt ra là xác định luật điều khiển u để đưa các quỹ đạo pha của hệ thống
về mặt trượt và duy trì trên mặt trượt một cách bền vững đối với các biến động của ( )
Vấn đề chọn lựa các hệ số cho mặt trượt S
Như đã phân tích ở trên, nếu có thể điều khiển được các trạng thái tiến tới mặt
trượt (s=0), thì các tín hiệu sai lệch e sẽ tiến tới 0 khi t tiến tới ∞ Đáp ứng của các sai
số trạng thái khi tiến về 0 phụ thuộc vào cách chọn lựa các hệ số cho mặt trượt
Để làm rõ điều này, chúng ta lấy một ví dụ đơn giản sau :
Cho một mặt trượt được biểu diễn bằng sai số trạng thái như sau :
e e c
Để phương trình : c.e + e&=0 Hurwitz, ta chỉ cần chọn c>0
Giả sử, ta đã tìm được các luật điều khiển sao cho s đạt tới giá trị không Khi đó
phương trình (2.7) có thể viết lại :
e c
(2.8) cho thấy e(t) có dạng hàm mũ và đạt tới giá trị lân cận 0, sau khoảng thời gian t ≈3 =.τ 3/c
Một cách tổng quát, để chọn các giá trị cho các hệ số của s, cần phải chọn trước
đáp ứng của sai số trạng thái theo mong muốn, chọn các cực tương ứng nằm bên trái mặt phẳng phức, từ đó suy ra các hệ số cần tìm
2.1.3 Luật điều khiển trượt kinh điển
Lấy đạo hàm (2.7), ta có:
n n
n
n n n
n n n
r u x g d e c e c e
c x f
e c e c e
c r d u x g x f
e c e c e
c e s
−+
+++++
=
++++
−++
=
++++
)(
)
()(
1 2 )
1 ( 1
1 2 )
1 ( 1 ) (
1 2 )
1 ( 1 ) (
s −&= , k > 0 (2.10) Lúc đó s & <s 0 nên s− > 0 khi t− > ∞
Luật điều khiển trượt cổ điển có thể tính chính xác bằng cách thay (2.10) vào
(2.9) và rút u ra như sau:
Trang 2311
1 2 )
1 (
)()(
c x f x g
Luật điều khiển trượt có tính đến các thành phần bất định
Trong thực tế luật điều khiển trượt cần tính tới các thành phần bất định như nhiễu
hệ thống cũng như sự biến thiên theo thời gian của f (x)và g (x)
Gọi ∆f ( t x, ), ∆g ( t x, )là các thành phần bất định của f ( t x, )và g ( t x, )của hệ thống
),()(),(x t f0 x f x t
Và
),()(),(x t g0 x g x t
Trong đó f0(x)và g0(x) là các hàm danh định của hệ thống
Giả sử rằng ∆f ( t x, ), ∆g ( t x, ) và nhiễu d là không tính được tại từng thời điểm
nhưng có thể biết được các chặn trên và dưới cụ thể là:
max
),
u s t x g d e c e c e
c r t x f s s s
n
)
( )
(
).
, ( )
) , ( (
.
min 0
min 0
1 2 ) 1 ( 1
∆ + +
∆ +
≤
+ + + +
),()
()(x δ0 x δmax x t
Với
1)
1 ) ( 0
min 0
g x g
n n
&
&
& ++++
−
∆+
min 0
max
) (
1 )
, (
Trang 2412
Nếu luật điều khiển u được chọn sao cho V& <0, khi đó s− > 0, khi t−>∞
Từ (2.17) suy ra luật điều khiển trượt có tính đến các thành phần bất định như sau:
((),.(
max x t sign g x sign s
là thành phần điều khiển hiệu chỉnh có tác dụng bù cho các thành phần bất định của hệ thống và có giá trị phụ thuộc vào các chặn trên của các thành phần bất định của hệ thống Thường thì δmaxđược chọn bằng một hệ số dương k với
2.1.4 Điều khiển trượt cho hệ thống MIMO
Xét một hệ thống phi tuyến MIMO
Trang 25điển hình là các hệ thống cơ khí như xe con lắc ngược hoặc con lắc ngược xoay …, lúc
đó bài toán thiết kế điều khiển trượt trở nên phức tạp hơn Trong [1], Utkin đã trình bày một số phương pháp thiết kế điều khiển trượt phân ly áp dụng được cho các hệ thống phi tuyến đa biến có số ngõ vào điều khiển ít hơn số bậc của hệ thống Các
Trang 2614
phương pháp này dựa trên cơ sở phép đổi biến để đưa hệ thống trở về dạng chuẩn, và
đã áp dụng thành công cho các hệ thống bậc bốn
2.1.5 Đặc điểm của điều khiển trượt
Hình 2-1 Tín hiệu điều khiển trượt có dạng chuyển mạch
Từ mục 2.1.3 và 2.1.4 cho thấy để tính toán thành phần điều khiển tương đương của điều khiển trượt đòi hỏi phải biết đầy đủ các hàm danh định của đối tượng, và để tính toán thành phần điều khiển bền vững cần phải biết các chặn trên của hệ thống và nhiễu
Hàm dấu trong thành phần điều khiển của điều khiển trượt cổ điển tạo nên hiện tượng đảo cực trong tín hiệu điều khiển (tín hiệu điều khiển có dạng chuyển mạch) với tần số cao nhất bằng tần số lấy mẫu và cộng với hiện tượng trễ vật lý của các đối tượng được điều khiển tạo nên hiện tượng dao động của các quỹ đạo pha xung quanh mặt trượt, còn gọi là hiện tượng chattering
Trang 2715
Hình 2-2 Mô phỏng quỹ đạo pha và hiện tượng chattering
Nếu hệ số k được chọn càng lớn thì tính bền vững của hệ thống càng cao, đồng
thời hiện tượng chattering xuất hiện càng mạnh Hiện tượng chattering gây ra một số hiệu ứng không mong muốn như : phát sinh sai số điều khiển; làm phát nóng mạch
điện tử; mài mòn các bộ phận cơ khí; kích động các mode tần số cao không mô hình hóa làm giảm chất lượng điều khiển hoặc mất ổn định
Bài toán điều khiển trượt áp dụng cho các hệ thống đa biến cần kết hợp giữa điều khiển trượt và điều khiển phân ly Các phương pháp này dựa trên việc phân tích mô hình toán học cụ thể của từng đối tượng và rất phức tạp
2.2 Xấp xỉ hàm của mạng nơ-ron truyền thẳng
Ánh xạ vào ra của mạng hai lớp được biểu diễn như sau:
Trang 28nơ-Gọi x, u r là cặp tín hiệu vào ra mong muốn của một hàm phi tuyến f Giả sử ta muốn xấp xỉ f bởi mạng u= fˆ( )x =N(x w, )
Định nghĩa hàm mục tiêu J như sau:
1.2
T
=
với = −e u u r
Huấn luyện một mạng nơ-ron nhiều lớp N(x,w) để xấp xỉ hàm f là quá trình cập
nhật hiệu chỉnh lặp các tham số của mạng sao cho J− >min. Lấy đạo hàm (2.36) ta có :
d dt
Trang 29i
T i
Công thức cập nhật cho các trọng số của nơ-ron ngõ ra
* số 1 trong vector cột nằm ở hàng thứ s
Thay (2.46) vào (2.45), ta có
Trang 302.3 Một số mô hình điều khiển trượt dùng mạng nơ-ron
Các luật điều khiển trượt như đã trình bày trong mục 2.1 có nhược điểm là có dạng tín hiệu chuyển mạch gây nên hiện tượng chattering xung quanh mặt trượt, đồng thời luật điều khiển đòi hỏi phải biết chính rõ một số thông số mô hình của đối tượng, thông số mô hình nhiễu công thức Từ những năm gần đây, với sự phát triển của các
kỹ thuật điều khiển thông minh, nhiều mô hình điều khiển ứng dụng các kỹ thuật điều khiển thông minh như điều khiển mờ, mạng nơ-ron, nơ-ron mờ, được nghiên cứu áp dụng vào thành phần của điều khiển trượt cổ điển thành các bộ điều khiển mờ, trượt
mờ, trượt dùng mạng nơ-ron, nhằm cải thiện chất lượng của bộ điều khiển trượt Các
Trang 31- Ứng dụng mô hình điều khiển trượt phân ly mới kết hợp với điều khiển thông minh nhằm làm giảm độ phức tạp của việc phải tính toán mô hình điều khiển phân ly cổ điển hết sức phức tạp và phụ thuộc quá nhiều vào thông số mô hình của đối tượng
- Các mô hình điều khiển mới áp dụng thành công trên các đối tượng có tính phi tuyến cao và có tính bất định lớn như hệ con lắc đơn, con lắc đôi, hệ cầu banh …
Phần tiếp theo trình bày phân loại các nghiên cứu trên theo thứ tự các nội dung
đã nêu trên
2.3.1 Mô hình sử dụng mạng nơ-ron làm thành phần điều khiển tương đương
Các mô hình trong mục này tổng hợp từ các nghiên cứu [2]-[6], cũng là những nghiên cứu bước đầu phối hợp giữa điều khiển trượt và điều khiển thông minh, trong
đó các nghiên cứu tập trung vào việc thay thế thành phần điều khiển tương đương bằng bộ điều khiển dùng mạng nơ-ron truyền thẳng một lớp
Trong mô hình điều khiển trượt dạng này tín hiệu điều khiển trượt được phân chia như sau:
- Ở vùng xa mặt trượt thành phần điều khiển hiệu chỉnh được sử dụng để hướng các trạng thái tiến về mặt trượt
)())
((.sign g x sign s k
Với k được tính theo công thức (2.22)
- Ở lân cận mặt trượt thành phần điều khiển tương đương được thay thế bằng một mạng hai lớp như mô tả ở mục 2.1 dùng để điều khiển các trạng thái bám trên mặt
Trang 3220
trượt Ngõ vào của mạng chính là tín hiệu mặt trượt s Các trọng số của mạng được
cập nhật thích nghi trực tuyến sao hàm (2.15) cực tiểu
Luật cập nhật mạng dựa trên phương pháp gradient descent được triển khai theo công thức :
ij ij
w
V w
Việc chỉ sử dụng điều khiển tương đương mà thực chất là bộ điều khiển mạng nơ-ron ở vùng sát mặt trượt đã làm cho hệ thống tuy có khả năng khắc phục được hiện tượng chattering nhưng lại làm suy giảm tính bền vững của hệ thống trước các ảnh hưởng của nhiễu
2.3.2 Mô hình điều khiển trượt phân ly dùng mạng nơ-ron
Năm 2007 Lon-Chen Hung và Hung Yuan Chung ở khoa kỹ thuật điện tử đại học
quốc gia Đài Loan đã giới thiệu kỹ thuật điều khiển phân ly sử dụng bộ điều khiển trượt trên cơ sở mạng nơ-ron DNNSMC (Decoupled Neural Network Sliding Mode Control) cho các hệ thống phi tuyến bậc bốn [8], [9] Tính hiệu quả của bộ điều khiển
đã được kiểm chứng thông qua việc mô phỏng trên nhiều đối tượng có tính phi tuyến cao như con lắc đơn, con lắc đôi, hệ cầu banh, và việc thực nghiệm thành công trên trên hệ thực xe con lắc ngược DNNSMC có thể xem là điển hình cho các nghiên cứu gần đây về điều khiển trượt dùng mạng nơ-ron
Trang 3321
Năm 2010 Ching Hung Lee và đồng nghiệp cũng đã giới thiệu một kỹ thuật điều khiển trượt phân ly ứng dụng mạng nơ-ron tương tự như kỹ thuật điều khiển DNNSMC, áp dụng cho hệ MIMO phát triển dựa vào thuật toán SPAS (Silmultaneous Pertubation Approximation Algorithm)
Các kỹ thuật phát triển điều khiển trượt thích nghi phân ly trong các tài liệu [10] có nhiều điểm tương tự Vì vậy, trong mục này các nghiên cứu này sẽ được tổng hợp và trình bày thống nhất lại theo ký hiệu riêng của luận án, để tiện theo dõi và bảo
[6]-đảm tính thống nhất của luận án
Hệ thống điều khiển trượt phân ly
Xét một hệ thống bậc bốn có dạng như sau
2 2 2 2
4
4 3
1 1 1 1
2
2 1
)
()(
)
()(
d u x g x f x
x x
d u x g x f x
x x
++
=
=
++
khiển duy nhất u được dùng để điều khiển cho cả hai đáp ứng của các trạng thái lên hai
mặt trượt khác nhau
Định nghĩa tín hiệu mặt trượt thứ nhất
(x z) x [c ][x x ] c z c x c z c
1 12 1
2 1 1 2 1
1
Định nghĩa tín hiệu mặt trượt thứ hai
4 3 2
2 c x x
Trong thiết kế bộ điều khiển trượt phân ly, điều khiển tương đương có nhiệm vụ duy trì các trạng thái trên mặt trượt Điều khiển tương đương có thể đạt được bằng cách chọn s&1 =0
( 1 ) 2 1 2 1 1 1 1 1
1 c x z x c x c z f g u d
s& = & −& + & = − &+ + + (2.59)
Trang 3422
Ngõ vào điều khiển trượt phân ly được chọn với hàm Lyapunov như sau:
2 1
1.s s c x c z f g u d s
Từ (2.61) suy ra luật điều khiển trượt bao gồm cả thành phần điều khiển tương
đương và điều khiển bền vững trước nhiễu
Trong đó k là hằng số dương Mục đích của điều khiển là lái các trạng thái hệ
thống về điểm cân bằng gốc Các biến s1, s2 cùng suy giảm thông qua biến tạm thời
z Phương trình (2.57) chỉ ra rằng mục đích điều khiển của u được thay đổi từ x1 =0, 0
2 =
x thành x =1 z, x2 =0(Lo & Kuo, 1998) [7]
Biến tạm thời z có thể được định nghĩa
ϕϕ
ϕ
if
if sign
Thiết kế bộ điều khiển trượt phân ly dùng mạng nơ-ron DNNSMC
Trang 3523
Một mạng nơ-ron SHL như mô tả ở mục 2.2 được dùng để thay thế thành phần
điều khiển tương đương (2.64) với ngõ vào là tín hiệu mặt trượt s1 (xem hình 2.3) Trong đó hàm tác động lớp ẩn có dạng
( 1, ,ˆ ˆ) DNNSMC h
Trong đó u DNNSMClà điều khiển tương đương xấp sỉ, u h là thành phần điều khiển bền vững, được thiết kế để bảo đảm sự ổn định của các trạng thái dưới ảnh hưởng của các thành phần bất định
Trang 3624
Xem xét một hệ thống phi tuyến động mô tả như (2.56) và mặt trượt được định nghĩa như (2.57) Cho trước một quỹ đạo trạng thái mong muốn liên tục và giới hạn, nếu luật điều khiển trượt phân ly mạng nơ-ron được thiết kế như (2.69), trong đó luật thích nghi của bộ điều khiển mạng nơ-ron được thiết kế như (2.71), (2.72), và bộ điều khiển bền vững được thiết kế như (2.74)
Luật cập nhật thích nghi cho mạng để đảm bảo luật điều khiển (2.69) ở ngõ ra của mạng như sau:
sign s
v&=−γ2 ∆ ( 1).σ′ & ∆ & (2.72)
Hình 2-4 Hệ thống DNNSMC của Lon-Chen Hung và Hung Yuan Chung
Trang 37mà Kuo và Lo đã thực hiện bằng các hệ thống điều khiển trượt mờ phân ly DFSM [7]
“Các kết quả thực mô phỏng và thực nghiệm đã cho thấy đáp ứng và tính bền vững của
hệ thống DNNSMC tốt hơn so với hệ thống do Kuo & Lo đề nghị “ [8],[9]
Hình 2-6 Đáp ứng góc con lắc ngược của điều khiển DNNSMC so với DFSM
Tổng luận về điều khiển trượt phân ly dùng mạng nơ-ron
Trang 3826
Chương này đã trình bày lý thuyết cơ sở về mạng nơ-ron, sơ lược một số ứng dụng về nhận dạng và điều khiển ứng dụng mạng nơ-ron, điều khiển trượt cổ điển và một số phương pháp điều khiển trượt dùng mạng nơ-ron
Về mặt lý thuyết thì việc áp dụng mạng nơ-ron trong nhận dạng và điều khiển là khá lý tưởng Tuy nhiên trong thực tế việc áp dụng mạng nơ-ron để nhận dạng và điều khiển là không dễ dàng, nhất là khi áp dụng lên các đối tượng phi tuyến động học có
độ phức tạp cao Hơn nữa bất kỳ bộ điều khiển dùng mạng nơ-ron nào đều cũng phải
áp dụng một trong các phương pháp điều khiển kinh điển là cơ sở để điều khiển
Điều khiển trượt thích nghi dùng mạng nơ-ron trong những năm gần đây đã có những thành quả nhất định trong việc thay thế thành phần điều khiển tương đương bằng một mạng nơ-ron với luật cập nhật thích nghi trực tuyến cho các trọng số của mạng với tín hiệu hồi tiếp cập nhật thích nghi là tín hiệu mặt trượt mà không cần biết trước các hàm phi tuyến của đối tượng Với việc chỉ duy trì điều khiển bền vững ở vùng xa mặt trượt hoặc thay thế hàm dấu trong thành phần điều khiển bền vững bằng hàm bão hòa đã hạn chế được hiện tượng chattering
Tuy nhiên về mặt bản chất thì các luật điều khiển trượt dùng mạng nơ-ron như đã nêu trên vẫn là luật điều khiển trượt cổ điển, vì vậy các phương pháp làm hạn chế hiện tượng chattering sẽ làm giảm tính bền vững của hệ thống ở vùng sát mặt trượt và ngược lại
Bài toán điều khiển trượt phân ly với phân ly các hệ thống bậc cao thành các hệ thống con có bậc thấp hơn theo các phương pháp điều khiển trượt phân ly mà Kuo và
Lo đã giới thiệu đã cơ bản giải quyết được bài toán điều khiển trượt phân ly cho các
hệ thống phi tuyến bậc bốn Tuy nhiên, khi áp dụng phương pháp trên cho các hệ thống có bậc cao hơn bậc bốn cần phải áp dụng thêm các phương pháp biến đổi khác
để phân ly hệ thống thành các hệ thống con có bậc nhỏ hơn hoặc bằng bốn
Bài toán dùng mạng nơ-ron như bộ điều khiển thích nghi trực tiếp duy nhất mà không cần nhận dạng trước các thông số mô hình đối tượng và có khả năng huấn luyện trực tuyến trong quá trình điều khiển, không cần áp dụng các phương pháp thử sai là một bài toán hết sức thú vị và có nhiều ý nghĩa khi áp dụng được trong thực tiễn Điều khiển trượt là một phương pháp điều khiển đơn giản có thể được áp dụng để làm cơ sở cho các luật điều khiển của một bộ điều khiển nơ-ron trực tiếp, với điều kiện cần phải
Trang 3927
cải biên dạng tín hiệu điều khiển thành dạng hàm trơn và luật điều khiển phải thích nghi được với sự thay đổi của các chặn trên của các thành phần bất định, để có thể thống nhất các thành phần điều khiển trượt vào một bộ điều khiển duy nhất dùng mạng nơ-ron Chương ba của luận án sẽ tiếp tục hướng nghiên cứu dùng mạng nơ-ron như
bộ điều khiển thích nghi trực tiếp với các luật điều khiển trượt được cải biên theo dạng hàm trơn và phát triển thành bộ điều khiển trượt thích nghi phân ly áp dụng được cho các hệ phi tuyến đa biến
Trang 40điều khiển trượt dùng mạng nơ-ron không thông qua nhận dạng đối tượng Áp dụng thành công các phương pháp thiết kế các bộ điều khiển trực tiếp không thông qua nhận dạng, sẽ giúp đơn giản hóa quy trình và giảm chi phí thiết kế Tuy nhiên hạn chế của các phương pháp này là mạng nơ-ron vẫn chưa thay thế hoàn toàn bộ điều khiển trượt, luật điều khiển vẫn là luật điều khiển trượt cổ điển và phải có sự lựa chọn giữa chất lượng điều khiển và việc hạn chế hiện tượng chattering
Chương này sẽ giới thiệu một bộ điều khiển trượt thích nghi phân ly mới DANSMC (Decoupled Adaptive Neural Sliding Mode Control) áp dụng được cho các
hệ thống phi tuyến đa biến Các nghiên cứu được trình bày trong chương này đã được công bố trên các bài báo [CB1]-[CB6] (Mục các tài liệu công bố của tác giả)
Ý tưởng chính là sử dụng một mạng mạng nơ-ron truyền thẳng làm thành một bộ
điều khiển trực tiếp Luật điều khiển được đưa ra dựa trên cơ sở lý thuyết điều khiển trượt sao cho có thể điều khiển được các trạng thái bám theo một quỹ đạo đã được
định trước trong quá trình tiến đến mặt trượt và bám chặt vào mặt trượt nhằm khắc phục hiện tượng chattering Luật điều khiển ở đây có dạng hàm trơn thích hợp để huấn luyện cho hàm mạng nơ-ron Trên cơ sở của lý thuyết ổn định của Lyapunov đưa ra các luật cập nhật cần thiết để huấn luyện mạng Cuối cùng là kết hợp giữa bộ điều khiển trượt thích nghi dùng mạng nơ-ron đã nêu trên và lý thuyết điều khiển trượt phân
ly để hình thành bộ điều khiển trượt thích nghi phân ly dùng mạng nơ-ron DANSMC
3.1 Điều khiển trượt thích nghi dùng mạng nơ-ron
3.1.1 Mô tả bộ điều khiển
Mô hình đối tượng và các định nghĩa về hệ thống phi tuyến như đã mô tả ở mục 2.2