1. Trang chủ
  2. » Luận Văn - Báo Cáo

ĐIỀU KHIỂN TRƯỢT THÍCH NGHI hệ THỐNG ĐỘNG PHI TUYẾN

96 787 23

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 96
Dung lượng 1,67 MB

Nội dung

Phát triển bộ điều khiển trượt thích nghi nêu trên thành bộ điều khiển trượt thích nghi phân ly DANSMC cho hệ phi tuyến đa biến. Áp dụng các nghiên cứu về điều khiển trượt thích nghi phân ly lên hệ con lắc ngược xoay và con lắc ngược hai chiều thông qua mô phỏng và thực nghiệm.

Trang 1

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH

TRƯỜNG ĐẠI HỌC BÁCH KHOA

Trang 2

ĐẠI HỌC QUỐC GIA TP HCM

TRƯỜNG ĐẠI HỌC BÁCH KHOA

Phản biện 2: PGS.TSKH HỒ ĐẮC LỘC

Phản biện 3: PGS.TS NGUYỄN TẤN TIẾN

NGƯỜI HƯỚNG DẪN KHOA HỌC

1 PGS TS DƯƠNG HOÀI NGHĨA

2 TS NGUYỄN ĐỨC THÀNH

Trang 3

i

LỜI CAM ĐOAN

Tác giả xin cam đoan đây là công trình nghiên cứu của bản thân tác giả Các kết quả nghiên cứu và các kết luận trong luận án này là trung thực, và không sao chép từ bất kỳ một nguồn nào và dưới bất kỳ hình thức nào Việc tham khảo các nguồn tài liệu (nếu có) đã được thực hiện trích dẫn và ghi nguồn tài liệu tham khảo đúng theo yêu cầu

Tác giả luận án

Nguyễn Đức Minh

Trang 4

ii

ABSTRACT

Variable Structure Control with sliding mode or Sliding Mode Control is known as a simple but effective robust non-linear control method This method has many advanced features such as good performance and robustness against parameter variations However, because of the switching of the control signal, there is a high frequency oscillation of the phase portrait around the sliding surface Furthermore, designing SMC requires an upper bound of the model uncertainty The model uncertainty often consists of the non-model dynamic and the variation of the plant parameters If the actual modelling error exceeds the uncertainty upper bound used to design the controller, the system stability will not be guaranteed In addition, like traditional control methods, designing SMC requires a mathematical model of the plant The control performance may be deteriorated in case of imprecise or time varying model parameters

well-This work aims to study a neural network based adaptive sliding mode controller for uncertain non-linear dynamical system It consists of three main points:

- The combination of neural networks and the sliding mode control theory to design an adaptive sliding mode controller for uncertain non-linear dynamical systems This new controller can be characterized by: (i) it is a direct neural network controller; (ii) the controller is identified on line without need of initial model, (iii) it has the ability to adjust itself to cope with the variations of the upper bounds of the uncertainty and it is noise insensitive

- The development of the adaptive sliding mode controller mentioned above to the Decoupled Adaptive Sliding Mode Controller DANSMC for multivariable non-linear systems

- The proposed controller has been successfully tested with an inverted rotary pendulum and an inverted two-dimensional pendulum through simulations and experiments

Main results

Trang 5

iii

- The proposed sliding mode controller consists of two components: the equivalent controller and the robust controller; it has a smooth form, it can overcome the chattering phenomenon and it is appropriate for training the neural network

- The update-law for one hidden layer feed forward neural network has been carried out based on Lyapunov stability theory, which involves two feedback signals: sliding surface signal and its derivative The neural network can be trained online without need of plant model nor its uncertainty upper bound

- It is shown that the proposed neural network controller can completely replace the traditional sliding mode controller By using the system states as inputs instead of sliding surface signals, DANSMC exploits the ability of neural network Simulation results also show that the system can self-develop to improve the control performance

- Theories and simulations show that the DNSMC controller can adjust itself to adapt to the variations of the plant as well as its uncertainty

Trang 6

iv

TÓM TẮT LUẬN ÁN

Điều khiển có cấu trúc thay đổi VSC (Variable Structure Control) với chế độ trượt, hay điều khiển trượt SMC (Sliding Mode Control) được biết đến như là một phương pháp điều khiển phi tuyến bền vững đơn giản, hiệu quả Phương pháp điều khiển này có nhiều ưu điểm như: (i) ít nhạy với sự biến thiên của các thông số của hệ thống; (ii) có khả năng chống nhiễu tốt; (iii) đáp ứng động học nhanh Tuy nhiên do tín hiệu điều khiển trượt cổ điển có dạng chuyển mạch nên tồn tại hiện tượng dao động có tần số cao (chattering) của các quỹ đạo pha xung quanh mặt trượt Hơn nữa, khi thiết

kế điều khiển SMC yêu cầu phải biết trước giá trị chặn trên của các thành phần bất

định của hệ thống Các thành phần bất định thường bao gồm các thành phần động học không mô hình, sự biến thiên của các thông số và nhiễu loạn Nếu giá trị chặn trên thực vượt quá giá trị chặn trên được giả thiết trong khi thiết kế bộ điều khiển, sự ổn

định của hệ thống sẽ không được bảo đảm Ngoài ra cũng giống như các phương pháp

điều khiển kinh điển khác, việc thiết kế bộ điều khiển trượt yêu cầu phải biết mô hình toán học cùng các thông số của mô hình của đối tượng Điều này sẽ ảnh hưởng tới chất lượng điều khiển trong một số ứng dụng mà ở đó mô hình toán học của đối tượng được

điều khiển khó xác định một cách chính xác và các thông số có tầm biến thiên rộng Luận án tiến sĩ nghiên cứu phương pháp điều khiển trượt thích nghi dùng mạng nơ-ron áp dụng cho hệ phi tuyến động bất định không rõ thông số mô hình với ba nội dung chính:

Kết hợp lý thuyết điều khiển trượt và mạng nơ-ron để thiết kế bộ điều khiển trượt thích nghi dùng mạng nơ-ron áp dụng cho hệ thống phi tuyến động bất định không rõ thông số mô hình Bộ điều khiển mới có các đặc điểm: (i) là một mạng nơ-ron được dùng làm bộ điều khiển trực tiếp; (ii) không cần nhận dạng trước các thông số của mô hình đối tượng, luật điều khiển được suy ra trực tiếp trong quá trình huấn luyện trực tuyến; (iii) có khả năng thích nghi trước sự thay đổi của các chặn trên của các thành phần bất định và có khả năng kháng nhiễu tốt

Phát triển bộ điều khiển trượt thích nghi nêu trên thành bộ điều khiển trượt thích nghi phân ly DANSMC cho hệ phi tuyến đa biến

Áp dụng các nghiên cứu về điều khiển trượt thích nghi phân ly lên hệ con lắc ngược xoay và con lắc ngược hai chiều thông qua mô phỏng và thực nghiệm

Trang 7

v

Các kết quả đạt được của luận án

- Luật điều khiển trượt được đề nghị trong luận án bao gồm cả hai thành phần

điều khiển tương đương và điều khiển bền vững, có dạng hàm trơn, có khả năng khắc phục được hiện tượng chattering và phù hợp để huấn luyện cho mạng nơ-ron

- Luật cập nhật cho mạng nơ-ron truyền thẳng một lớp ẩn được đề nghị dựa trên

lý thuyết ổn định của Lyapunov với hai tín hiệu hồi tiếp bao gồm tín hiệu mặt trượt và

đạo hàm của nó đã được chứng minh là đáp ứng được yêu cầu của luật điều khiển trượt được đề nghị và có khả năng huấn luyện trực tuyến cho mạng nơ-ron trở thành

bộ điều khiển trượt thích nghi mà không cần phải nhận dạng trước các thông số của

đối tượng và các giá trị chặn trên của các thành phần bất định của hệ thống

- Với mô hình điều khiển được đề nghị trong luận án mạng nơ-ron truyền thẳng một lớp ẩn đã thay thế hoàn toàn bộ điều khiển trượt Với đặc điểm ngõ vào của mạng

là các biến trạng thái (khác với ngõ vào là tín hiệu mặt trượt như một số phương pháp

điều khiển trượt dùng mạng nơ-ron khác), phương pháp DANSMC đã khai thác được khả năng nhớ theo trạng thái của mạng nơ-ron và qua các kết quả mô phỏng đã cho thấy khả năng tự nâng cấp chất lượng điều khiển của hệ thống qua từng phiên điều khiển

- Lý thuyết và mô phỏng cũng đã cho thấy khả năng tự thay đổi để thích nghi của bộ điều khiển DANSMC trước sự thay đổi của các thông số của đối tượng cũng như các chặn trên của các thành phần bất định

Trang 8

vi

LỜI CÁM ƠN

Tôi xin tỏ lòng biết ơn sâu sắc đến PGS TS Dương Hoài Nghĩa và TS Nguyễn

Đức Thành, hai người thầy đã hướng dẫn tận tình trong suốt thời gian tôi làm nghiên cứu sinh tại Đại học Bách Khoa Những gợi ý đúng lúc hết sức quý báu cùng những ý kiến phản biện sâu sắc của các thầy đã giúp tôi nhận thức, định hướng đúng và hoàn thiện nghiên cứu của mình Trong những năm cùng làm nghiên cứu với các thầy, tôi không chỉ học được các phương pháp nghiên cứu khoa học mà còn học được nhiều

điều về tư cách, đạo đức trong cuộc sống

Xin chân thành cảm ơn các thầy cô Bộ môn Tự Động ĐHBK TPHCM vì đã truyền đạt cho tôi những kiến thức nền tảng hết sức quý báu trong thời gian tôi còn học cao học, cũng như những góp ý khoa học và những phản biện thẳng thắn trong khi tôi thực hiện các chuyên đề tiến sĩ là những cơ sở hết sức có giá trị giúp tôi hoàn chỉnh luận án của mình

Xin cảm ơn vợ, và các con tôi đã cùng chia xẻ trong những ngày khó khăn nhất

cả về vật chất và tinh thần để tôi có thể yên tâm thực hiện luận án này

Xin gửi lời cảm ơn đến các đồng nghiệp là các giảng viên của Khoa tin học trường Đại học Yersin và bạn bè thân hữu, những người luôn giúp đỡ và động viên tôi trong những năm tháng làm luận án

Mặc dù đã cố gắng hết sức nhưng luận án không tránh khỏi những thiếu xót Tác giả rất mong được sự góp ý của quý thầy cô và các bạn đồng nghiệp

Trang 9

vii

MỤC LỤC

1 TỔNG QUAN 1

1.1 Đặt vấn đề 1

1.2 Mục tiêu và phương pháp nghiên cứu của luận án 4

2 LÝ THUYẾT CƠ SỞ 8

2.1 Lý thuyết điều khiển trượt 9

2.1.1 Đối tượng điều khiển 9

2.1.2 Mặt trượt 9

2.1.3 Luật điều khiển trượt kinh điển 10

2.1.4 Điều khiển trượt cho hệ thống MIMO 12

2.1.5 Đặc điểm của điều khiển trượt 14

2.2 Xấp xỉ hàm của mạng nơ-ron truyền thẳng 15

2.3 Một số mô hình điều khiển trượt dùng mạng nơ-ron 18

2.3.1 Mô hình sử dụng mạng nơ-ron làm thành phần điều khiển tương đương 19 2.3.2 Mô hình điều khiển trượt phân ly dùng mạng nơ-ron 20

3 ĐIỀU KHIỂN TRƯỢT THÍCH NGHI PHÂN LY DÙNG MẠNG NƠ-RON 28

3.1 Điều khiển trượt thích nghi dùng mạng nơ-ron 28

3.1.1 Mô tả bộ điều khiển 28

3.1.2 Luật cập nhật thích nghi để huấn luyện mạng 29

3.2 Điều khiển trượt thích nghi phân ly dùng mạng nơ-ron DANSMC 33

4 KẾT QUẢ MÔ PHỎNG VÀ THỰC NGHIỆM 38

4.1 Điều khiển trượt thích nghi phân ly con lắc ngược hai bậc xoay tự do 38

4.1.1 Mô tả con lắc ngược xoay 38

4.1.2 Phân tích điều khiển 39

4.1.3 Mô tả quá trình và các kết quả mô phỏng 42

4.1.4 Mô tả quá trình và các kết quả thực nghiệm 56

4.2 Điều khiển trượt thích nghi phân ly con lắc hai chiều 66

5 KẾT LUẬN 73

6 CÁC TÀI LIỆU CÔNG BỐ CỦA TÁC GIẢ 77

7 Tài liệu tham khảo 78

Trang 10

viii

DANH MỤC CÁC HÌNH ẢNH

Hình 2-1 Tín hiệu điều khiển trượt có dạng chuyển mạch 14

Hình 2-2 Mô phỏng quỹ đạo pha và hiện tượng chattering 15

Hình 2-3 Mạng nơ-ron một lớp ẩn trong bộ điều khiển DNNSMC 23

Hình 2-4 Hệ thống DNNSMC của Lon-Chen Hung và Hung Yuan Chung 24

Hình 2-5 Mô hình điều khiển trượt phân ly dùng thuật toán SPSA 25

Hình 2-6 Đáp ứng góc con lắc ngược của điều khiển DNNSMC so với DFSM 25

Hình 3-1 Mạng nơ-ron dùng làm bộ điều khiển 29

Hình 3-2 Mô hình điều khiển trượt thích nghi phân ly 35

Hình 4-1 Mô hình con lắc ngược xoay 39

Hình 4-2 Mô hình con lắc ngược trên simulink 41

Hình 4-3 Mô phỏng điều khiển DANSMC lên con lắc ngược xoay 41

Hình 4-4 Mô phỏng điều khiển DNNSMC lên con lắc ngược xoay trong 10s đầu tiên 45

Hình 4-5 Mô phỏng điều khiển DNNSMC lên con lắc ngược xoay trong 0.5s đầu tiên 46

Hình 4-6 Đáp ứng của tín hiệu mặt trượt của điều khiển DNNSMC 47

Hình 4-7 Quỹ đạo pha các biến trạng thái của điều khiển DNNSMC 48

Hình 4-8 Quỹ đạo pha các biến trạng thái của điều khiển DNNSMC trong quá trình quá độ 49

Hình 4-9 Quá trình huấn luyện và hội tụ bộ điều khiển DANSMC 50

Hình 4-10 Đáp ứng của tín hiệu trượt qua các phiên huấn luyện của điều khiển DANSMC 51

Hình 4-11 Đáp ứng của điều khiển DANSMC 52

Hình 4-12 Đáp ứng của tín hiệu mặt trượtcủa điều khiển DASMC 53

Hình 4-13 Quỹ đạo pha các biến trạng thái của điều khiển DANSMC 54

Hình 4-14 So sánh đáp ứng của điều khiển DNNSMC và DANSMC 55

Hình 4-15 Kết cấu phần cứng mô hình thực nghiệm để điều khiển trượt thích nghi phân ly con lắc ngược xoay dùng mạng nơ-ron 57

Hình 4-16 Mô hình thực con lắc ngược trong phòng thí nghiệm 58

Hình 4-17 Sơ đồ khối chip vi điều khiển TMS320 2812 59

Hình 4-18 Đáp ứng của trong 30 giây.(lật lên và ổn định) 62

Hình 4-19 Đáp ứng của trong 30 giây 62

Hình 4-20 Tín hiệu điều khiển u trong 30 giây 63

Hình 4-21 Đáp ứng của góc khi thay đổi khối lượng và chiều dài con lắc 64

Hình 4-22 Đáp ứng của góc khi thay đổi khối lượng và chiều dài con lắc 65

Hình 4-23 Con lắc ngược hai chiều 66

Hình 4-24 Biểu diễn hệ tọa độ con lắc ngược hai chiều 67

Hình 4-25 Mô hình điều khiển DANSMC cho con lắc ngược hai chiều 69

Hình 4-26 Kết quả phiên huấn luyện thứ nhất 70

Hình 4-27 Kết quả của phiên huấn luyện thứ hai 70

Hình 4-28 Quỹ đạo x-y của phiên huấn luyện thứ nhất và thứ hai 71

Hình 4-29 Mô phỏng với biên độ nhiễu biến thiên 71

Hình 4-30 Mô phỏng với biên độ nhiễu biến thiên mạnh 72

Trang 11

ix

DANH MỤC BẢNG BIỂU

Bảng 1 Bộ trọng số thu được sau phiên huấn luyện đầu tiên 43 Bảng 2 Bộ trọng số thu được sau phiên huấn luyện cuối 44

Trang 12

x

DANH MỤC CÁC TỪ VIẾT TẮT VÀ THUẬT NGỮ ĐỐI CHIẾU

ANSMC (Adapative Neural Sliding Mode Control): Điều khiển trượt thích nghi dùng

mạng nơ-ron

CCS (Code Composer Studio): phần mềm hỗ trợ lập trình và giao tiếp với bo mạch xử

lý tín hiệu số

Chattering: Hiện tượng dao động xung quanh mặt trượt

DANSMC (Decoupled Adaptive Neural Sliding Mode Control): Điều khiển trượt

thích nghi phân ly dùng mạng nơ-ron

DNNSMC (Decoupled Neural Network Sliding Mode Control): Điều khiển trượt phân

ly dùng mạng nơ-ron

DSP ( Digital Signal Processing): Xử lý tín hiệu số

Lyapunov: Lý thuyết ổn định được phát biểu bởi Lyapunov

NN (Neural Network): Mạng nơ-ron

SMC (Sliding Mode Control): Điều khiển trượt

SHL (Single Hidden Layer): Mạng nơ-ron một lớp ẩn

RBFN (Radial Basic Funtion Network): Mạng hàm cơ sở xuyên tâm

MLP (Multiple Layer Perceptron): Mạng nơ-ron nhiều lớp

Perceptron: Một đơn vị trong mạng nơ-ron

Swinging up: Điều khiển lật lên (cho con lắc ngược)

Sliding surface : mặt trượt

VSC (Variable Structure Control): điều khiển có cấu trúc thay đổi

Trang 13

1

1.1 Đặt vấn đề

Giới thiệu về điều khiển trượt

Điều khiển trượt là một phương pháp điều khiển phi tuyến đơn giản hiệu quả, dựa vào hồi tiếp các biến trạng thái của hệ thống Bộ điều khiển được thiết kế sao cho các trạng thái của hệ thống luôn luôn hướng về một mặt phẳng Hurwitz của các trạng thái, một khi các trạng thái đã nằm trên mặt trượt thì chúng sẽ tiến về gốc tọa độ Vì vậy mục đích điều khiển ổn định trạng thái trở thành điều khiển ổn định tiệm cận các trạng thái bám trên mặt trượt

Điều khiển trượt có hai thành phần là thành phần điều khiển tương đương và thành phần điều khiển bền vững Thành phần điều khiển bền vững mà trong nhiều tài liệu còn gọi là thành phần điều khiển hiệu chỉnh có nhiệm vụ chính là điều khiển quỹ

đạo các trạng thái hướng về mặt trượt Khi quỹ đạo các trạng thái đã ở lân cận mặt trượt thì thành phần điều khiển tương đương có tác dụng điều khiển các trạng thái bám chặt trên mặt trượt

Để thiết kế thành phần điều khiển tương đương trong điều khiển trượt cần phải biết rõ các hàm toán học phi tuyến của mô hình đối tượng và để thiết kế thành phần

điều khiển bền vững trong điều khiển trượt thì cần phải biết các chặn trên của các thành phần bất định của mô hình Trong đó các dạng của thành phần bất định của hệ thống bao gồm: nhiễu ảnh hưởng lên hệ thống, nhiễu đo đạc, và sai số mô hình do các thông số của đối tượng biến thiên theo thời gian

Ưu điểm của điều khiển trượt là nó ít nhạy với sự biến động của các thông số của

mô hình và ảnh hưởng của nhiễu bên ngoài

Điều khiển trượt đã được áp dụng khá thành công để thiết kế các bộ điều khiển bền vững trong phòng thí nghiệm và ứng dụng rộng rãi trong thực tiễn

Một số vấn đề của điều khiển trượt cổ điển

Tuy nhiên khi thiết kế các bộ điều khiển trượt có một số vấn đề thường gặp phải như sau:

Trang 14

2

- Thành phần điều khiển bền vững trong điều khiển trượt có dạng hàm dấu kết hợp với hiện tượng trễ vật lý của các đối tượng gây nên hiện tượng chattering các trạng thái xung quanh mặt trượt Thông thường để hạn chế hiện tượng chattering người thường thay thế hàm dấu trong thành phần điều khiển bền vững bằng hàm bão hòa

- Việc xác định các giá trị chặn trên của các thành phần bất định thường không chính xác Người ta thường dùng các giá trị hằng để ước lượng các giá trị này Khi thiết kế thành phần điều khiển bền vững, nếu việc chọn giá trị chặn trên quá lớn sẽ làm gia tăng hiện tượng chattering, làm tổn hao năng lượng điều khiển không cần thiết và xảy ra nhiều hiện tượng không mong muốn Còn khi giá trị chặn trên thực lớn hơn giá trị chặn trên theo thiết kế thì hệ thống sẽ mất tính ổn định

Bài toán điều khiển trượt khi áp dụng cho các hệ thống đa biến là một bài toán khá phức tạp Trong tài liệu [1] được giới thiệu năm 2000 dựa trên nhiều nghiên cứu trước đó, Utkin đã giới thiệu một số các phương pháp thiết kế các bộ điều khiển trượt phân ly áp dụng được cho các hệ thống phi tuyến bậc bốn Các phương trình vi phân biểu diễn mô hình động học của đối tượng được đề nghị biến đổi để đưa về dạng hệ phương trình chuẩn đã được định nghĩa trước đó Sau đó bài toán phân ly biến số được giải quyết dựa trên việc xét từng trường hợp riêng với một loạt các phép biến đổi toán học và chỉ có thể áp dụng lên từng đối tượng cụ thể chứ không có phương pháp biến

đổi tổng quát Các nghiên cứu đã được thực hiện phân tích mô hình động học và thiết

kế bộ điều khiển phân ly các đối tượng phi tuyến có độ bất ổn cao như hệ xe con lắc

Thành phần ñiều khiển tương ñương

Thành phần ñiều khiển bền vững

Luật ñiều khiển trượt cổ ñiển

Thông số ñối tượng

phi tuyến thông qua

Trang 15

3

đơn, hệ xe con lắc đôi và hệ con lắc xoay hai bậc tự do Tuy nhiên, các bài toán cho thấy độ phức tạp cao và không dễ dàng thành công nếu áp dụng lên những đối tượng phi tuyến khác

Điều khiển trượt thích nghi dùng mạng nơ-ron

Trong những năm gần đây ứng dụng khả năng học được để xấp xỉ thích nghi các hàm phi tuyến, một số nghiên cứu đã sử dụng mạng nơ-ron hoặc nơ-ron mờ để thay thế một phần hoặc hoàn toàn bộ điều khiển trượt cổ điển

Thông thường để thiết kế thành phần điều khiển tương đương của điều khiển trượt cổ điển cần phải nhận dạng trước các thông số của mô hình đối tượng Nhận dạng thông số mô hình đối tượng thường phức tạp (có khi không thực hiện được) nhất

là đối với các đối tượng có tính phi tuyến và độ bất ổn cao Tín hiệu điều khiển sau khi thiết kế không như mong muốn do sai số nhận dạng và thường phải bù sai số nhận dạng bằng các phương pháp điều khiển thích nghi

Ưu điểm của các bộ điều khiển trượt dùng mạng nơ-ron là không cần biết trước các thông số cũng như các chặn trên của các hàm phi tuyến của mô hình động học, và hạn chế được hiện tượng chattering so với điều khiển trượt cổ điển

Trong một số nghiên cứu [2], [3], [4], [5], [6] [7] thành phần điều khiển bền vững

được tách ra và hoạt động ở vùng xa mặt trượt, còn ở lân cận mặt trượt thì mạng ron hoặc nơ-ron mờ được dùng để thay thế thành phần điều khiển tương đương của

nơ-điều khiển trượt cổ điển

Trong một số nghiên cứu khác [8], [9], [10] hàm dấu trong thành phần điều khiển bền vững được thay thế bằng hàm bão hòa để hạn chế hiện tượng chattering và mạng nơ-ron hoặc nơ-ron mờ cũng được dùng để thay thành phần điều khiển tương đương với mục đích là để bù cho các sai số mô hình và các thành phần bất định của đối tượng Trong tất cả các nghiên cứu trên, các mạng nơ-ron hoặc nơ-ron mờ được huấn luyện trực tuyến với các luật cập nhật được đề nghị khá đơn giản chủ yếu dựa trên tín hiệu hồi tiếp là tín hiệu mặt trượt Các chứng minh về sự ổn định của hệ thống, sự hội

tụ của các luật điều khiển trượt mạng nơ-ron thường dựa trên lý thuyết ổn định của Lyapunov

Đặc điểm của các phương pháp nghiên cứu này là chúng vẫn sử dụng luật điều khiển trượt cổ điển làm cơ sở Mạng nơ-ron chỉ dùng để thay thế thành phần điều

Trang 16

4

khiển tương đương Hàm dấu trong thành phần điều khiển bền vững thường được thay thế bằng hàm bảo hòa để hạn chế hiện tượng chattering Tuy nhiên các chặn trên dùng trong thiết kế thành phần điều khiển bền vững vẫn là các giá trị hằng được chọn trước,

vì vậy chất lượng điều khiển vẫn phụ thuộc vào việc lựa chọn các giá trị hằng khi thiết

kế thành phần điều khiển bền vững

Vì bài toán điều khiển trượt dùng mạng nơ-ron hay nơ-ron mờ không có mô hình toán học rõ ràng nên không thể áp dụng các phương pháp điều khiển trượt phân ly cổ

điển [1], nên trong các tài liệu [7], [8], [9], [10] các tác giả đã đề nghị một mô hình

điều khiển trượt phân ly đơn giản nhưng rất hiệu quả để kết hợp với bộ điều khiển trượt dùng mạng nơ-ron thành bộ điều khiển trượt phân ly dùng mạng nơ-ron áp dụng

để điều khiển cho các hệ thống đa biến

Các kết quả nghiên cứu bằng lý thuyết cũng như mô phỏng và thực nghiệm trên nhiều đối tượng con lắc ngược, hệ cầu banh, cánh tay máy…, đã cho thấy các bộ điều khiển phân ly dùng mạng nơ-ron có khả năng điều khiển thích nghi trong những điều kiện không biết trước các hàm phi tuyến của đối tượng và có khả năng hạn chế được hiện tượng chattering

Tuy nhiên việc tách thành phần điều khiển bền vững với thành phần điều khiển tương đương hoặc việc thay thế hàm dấu bằng hàm bão hòa trong thành phần điều khiển bền vững đã làm giảm tính bền vững của hệ thống trước nhiễu ở vùng sát mặt trượt

1.2 Mục tiêu và phương pháp nghiên cứu của luận án

Mục tiêu nghiên cứu của luận án

Mục tiêu luận án là phát triển các nghiên cứu về điều khiển trượt cổ điển và điều khiển trượt dùng mạng nơ-ron để thiết kế bộ điều khiển trượt thích nghi phân ly DANSMC áp dụng cho hệ phi tuyến đa biến sử dụng mạng truyền thẳng làm bộ điều khiển trực tiếp kết hợp được cả hai thành phần điều khiển tương đương và điều khiển bền vững trong điều kiện không biết trước các thông số mô hình của đối tượng và các chặn trên của các thành phần bất định hoặc hơn nữa các thông số của mô hình và các giá trị chặn trên có thể bị thay đổi trong quá trình điều khiển Luật điều khiển trượt

được nghiên cứu thiết kế theo hướng sao cho nó không chứa hàm có dấu nhằm khắc

Trang 17

nơ-hệ thực (Kỹ thuật điều khiển con lắc ngược dùng mạng nơ-ron có thể phát triển để

điều khiển các đối tượng phi tuyến khác như rô-bốt di chuyển cân bằng trên hai bánh, tên lửa, cánh tay rô-bốt ….)

Phương pháp nghiên cứu trong luận án

Về lý thuyết

- Nghiên cứu thiết kế một luật điều khiển trượt không có thành phần chuyển mạch Tín hiệu phản hồi bao gồm cả tín hiệu mặt trượt và đạo hàm của nó cho phép xác định một quỹ đạo cho trước của tín hiệu mặt trượt nhằm khắc phục hiện tượng chattering

- Nghiên cứu sử dụng một mạng truyền thẳng với ngõ vào là các sai số trạng thái

và ngõ ra là tín hiệu điều khiển làm bộ điều khiển trượt thích nghi Luật cập nhật thích nghi với tín hiệu hồi tiếp bao gồm tín hiệu mặt trượt và đạo hàm của nó Giải thuật huấn luyện mạng được xây dựng sao cho quỹ đạo pha của hệ thống hội tụ về mặt trượt theo một quỹ đạo cho trước trong điều kiện đối tượng bất định Mạng truyền thẳng

được sử dụng làm bộ điều khiển trượt thích nghi trực tiếp cho cả hai thành phần điều khiển tương đương và hiệu chỉnh Nhờ đó mà không chỉ các thông số của mô hình đối tượng mà cả các giá trị chặn trên cũng được cập nhật đầy đủ cho thành phần điều khiển bền vững

Về ứng dụng

- Cuối cùng luận án nghiên cứu kết hợp giữa điều khiển trượt dùng mạng nơ-ron với lý thuyết điều khiển phân ly để hình thành bộ điều khiển trượt thích nghi phân ly

áp dụng được cho các hệ thống đa biến

Các luật điều khiển và luật cập nhật được chứng minh dựa vào các hàm điều khiển Lyapunov

Trang 18

6

Các kết quả mô phỏng trên hệ thống con lắc ngược hai bậc xoay tự do và con lắc ngược hai chiều với đầy đủ các quy trình từ huấn luyện ban đầu nhằm kiểm chứng tính hội tụ của luật cập nhật thích nghi, đến các kết quả điều khiển bám theo quỹ đạo và các kết quả thực nghiệm trên hệ thực con lắc ngược xoay nhằm kiểm tra chất lượng của bộ

điều khiển trong điều kiện các thông số mô hình thay đổi liên tục và ảnh hưởng mạnh của nhiễu từ bên ngoài Các mô phỏng dựa trên phần mềm matlab và simulink, còn thực nghiệm dựa trên nền của board xử lý tín hiệu số DSP TMS320-2812 kết hợp với phần mềm CCS (Code Composer Studio)

Nội dung của luận án

Luận án được chia thành bốn chương chính với các nội dung như sau:

Chương một là chương tổng quan về điều khiển trượt, điều khiển trượt dùng mạng nơ-ron, mục đích cũng như phương pháp nghiên cứu của luận án

Chương hai giới thiệu các kiến thức cơ sở về mạng nơ-ron và lý thuyết điều khiển trượt, và một số mô hình điều khiển trượt dùng mạng nơ-ron Phần đầu của chương này giới thiệu mạng truyền thẳng với đầy đủ các cấu trúc cơ bản, khả năng xấp

xỉ các hàm phi tuyến và các phương pháp huấn luyện mạng Phần tiếp theo giới thiệu

lý thuyết điều khiển trượt cổ điển được đưa ra cùng một số phân tích về ưu nhược

điểm Phần cuối của chương này giới thiệu một số mô hình điều khiển trượt phân ly dùng mạng nơ-ron đã được phát triển trong những năm gần đây

Chương ba bao hàm nội dung chính của luận án Trong chương này một bộ điều khiển trượt thích nghi phân ly dùng mạng nơ-ron DANSMC được đề nghị với luật điều khiển trượt mới không có các thành phần chuyển mạch nhằm khắc phục hiện tượng chattering Hơn nữa, khác với các phương pháp điều khiển trượt dùng mạng nơ-ron khác được trình bày ở chương hai, mạng nơ-ron ở đây được dùng để thay thế cả hai thành phần điều khiển tương đương và điều khiển bền vững với tín hiệu hồi tiếp huấn luyện mạng bao gồm cả tín hiệu mặt trượt và đạo hàm của nó (trong khi các phương pháp khác chỉ sử dụng tín hiệu mặt trượt), có khả năng học được luật điều khiển mới

và khả năng cập nhật thích nghi, tự điều chỉnh luật điều khiển phù hợp nhằm bảo đảm chất lượng điều khiển khi các thông số của đối tượng bị thay đổi

Chương bốn mô tả ứng dụng phương pháp điều khiển trượt thích nghi phân ly DANSMC được giới thiệu trong chương ba vào hai mô hình con lắc ngược hai bậc

Trang 19

7

xoay tự do và con lắc ngược hai chiều là các mô hình phi tuyến cao, bất ổn và không cực tiểu pha cùng với các kết quả mô phỏng và thực nghiệm Trong các thí nghiệm này, các mạng nơ-ron được khởi tạo với giá trị ngẫu nhiên ban đầu nhỏ, với vùng không gian trạng thái được thu hẹp xung quanh điểm cân bằng ngược, và được mở rộng dần ra, cùng với chất lượng điều khiển được tăng dần Các mô phỏng trên con lắc hai chiều được thực hiện trong điều kiện con lắc di chuyển theo một quỹ đạo cho trước trên một mặt phẳng trong điều kiện bị tác động mạnh của nhiễu bên ngoài và sự biến thiên lớn các thông số của con lắc Các kết quả mô phỏng trên matlab và simulink và trên thực nghiệm thông qua phần mềm CCS đã cho thấy khả năng thích nghi trước sự thay đổi của các thông số mô hình và tính bền vững của bộ điều khiển được đề nghị dưới tác động mạnh của nhiễu bên ngoài Cũng trong chương này, một số kết quả mô phỏng điều khiển DNNSMC trên con lắc ngược xoay cũng được đưa ra nhằm so sánh với phương pháp điều khiển DANSMC

Chương năm khái quát lại sự khác biệt và các kết quả đạt được của các phương pháp nghiên cứu trong luận án so với các phương pháp nghiên cứu khác và nêu lên một số tồn tại cũng như phương hướng nghiên cứu khắc phục

Trang 20

8

Hình thành và phát triển từ thập niên năm mươi của thế kỷ hai mươi, điều khiển trượt đã trở nhanh chóng trở thành một trong những phương pháp kinh điển được ưa chuộng trong các phương pháp điều khiển các hệ phi tuyến Nhờ vào tính năng giảm bậc, ít nhạy đối với nhiễu, với sự biến thiên của các thông số của đối tượng, điều khiển trượt trở thành một công cụ mạnh để điều khiển các hệ thống động học bậc cao, phức tạp dưới các điều kiện bất định của hệ thống

Các nghiên cứu lý thuyết và thực hành điển hình về điều khiển trượt cổ điển đã

được trình bày đầy đủ trong các tài liệu [1], [11], [12], [13], [14]

Trong những năm gần đây nhiều công trình nghiên cứu kết hợp giữa điều khiển trượt cổ điển và điều khiển thông minh đã được công bố nhằm khắc phục một số nhược điểm còn tồn tại của điều khiển trượt cổ điển về tính tối ưu của tín hiệu điều khiển, hiện tượng chattering của các biến trạng thái xung quanh mặt trượt…, cũng như phát triển các luật điều khiển trượt mà không cần biết chính xác các thông số của đối tượng

Tổng hợp từ các nghiên cứu trên, chương này và trình bày lại một số nội dung chính, làm cơ sở để phát triển cho mô hình điều khiển trượt phân ly DANSMC sẽ được trình bày trong chương ba:

- Mô hình toán học của điều khiển trượt cổ điển dưới dạng tổng quát và phát triển

mô hình toán học của bộ điều khiển nhằm áp dụng cho các hệ thống phi tuyến bậc cao MIMO

- Mô hình toán học và các công thức để huấn luyện của mạng nơ-ron truyền thẳng nhiều lớp làm cơ sở để phát triển cho các mô hình điều khiển trượt dùng mạng nơ-ron và mô hình điều khiển trượt ANSMC được trình bày trong chương ba

- Một số nghiên cứu về điều khiển trượt thích nghi ứng dụng mạng nơ-ron đã

được công bố trong và ngoài nước được trình bày lại theo thứ tự phát triển từ những ý tưởng nghiên cứu ban đầu tới các công trình lý thuyết và thực tiễn đã được công bố trong những năm gần đây

Trang 21

9

2.1 Lý thuyết điều khiển trượt

2.1.1 Đối tượng điều khiển

Xét hệ thống phi tuyến biểu diễn bởi phương trình vi phân

d u y y g y

y f

++

x

x x

)

()(

và tín hiệu s

e c e c e

c e

n

n

1 2 )

2 ( 1 ) 1 (

+ +

= + + +

Nếu thực hiện được luật điều khiển sao cho s = 0, tín hiệu sai lệch e là nghiệm

của phương trình (2.6) Do các nghiệm của phương trình đặc trưng của (2.6) đều nằm

bên trái mặt phẳng phức, nên e(t) sẽ tiến tới 0 khi t tiến tới ∞ Phương trình s=0 xác

định một mặt cong S trong không gian n chiều gọi là mặt trượt (sliding surface) S

Trang 22

10

Vấn đề đặt ra là xác định luật điều khiển u để đưa các quỹ đạo pha của hệ thống

về mặt trượt và duy trì trên mặt trượt một cách bền vững đối với các biến động của ( )

Vấn đề chọn lựa các hệ số cho mặt trượt S

Như đã phân tích ở trên, nếu có thể điều khiển được các trạng thái tiến tới mặt

trượt (s=0), thì các tín hiệu sai lệch e sẽ tiến tới 0 khi t tiến tới ∞ Đáp ứng của các sai

số trạng thái khi tiến về 0 phụ thuộc vào cách chọn lựa các hệ số cho mặt trượt

Để làm rõ điều này, chúng ta lấy một ví dụ đơn giản sau :

Cho một mặt trượt được biểu diễn bằng sai số trạng thái như sau :

e e c

Để phương trình : c.e + e&=0 Hurwitz, ta chỉ cần chọn c>0

Giả sử, ta đã tìm được các luật điều khiển sao cho s đạt tới giá trị không Khi đó

phương trình (2.7) có thể viết lại :

e c

(2.8) cho thấy e(t) có dạng hàm mũ và đạt tới giá trị lân cận 0, sau khoảng thời gian t ≈3 =.τ 3/c

Một cách tổng quát, để chọn các giá trị cho các hệ số của s, cần phải chọn trước

đáp ứng của sai số trạng thái theo mong muốn, chọn các cực tương ứng nằm bên trái mặt phẳng phức, từ đó suy ra các hệ số cần tìm

2.1.3 Luật điều khiển trượt kinh điển

Lấy đạo hàm (2.7), ta có:

n n

n

n n n

n n n

r u x g d e c e c e

c x f

e c e c e

c r d u x g x f

e c e c e

c e s

−+

+++++

=

++++

−++

=

++++

)(

)

()(

1 2 )

1 ( 1

1 2 )

1 ( 1 ) (

1 2 )

1 ( 1 ) (

s −&= , k > 0 (2.10) Lúc đó s & <s 0 nên s− > 0 khi t− > ∞

Luật điều khiển trượt cổ điển có thể tính chính xác bằng cách thay (2.10) vào

(2.9) và rút u ra như sau:

Trang 23

11

1 2 )

1 (

)()(

c x f x g

Luật điều khiển trượt có tính đến các thành phần bất định

Trong thực tế luật điều khiển trượt cần tính tới các thành phần bất định như nhiễu

hệ thống cũng như sự biến thiên theo thời gian của f (x)và g (x)

Gọi ∆f ( t x, ), ∆g ( t x, )là các thành phần bất định của f ( t x, )và g ( t x, )của hệ thống

),()(),(x t f0 x f x t

),()(),(x t g0 x g x t

Trong đó f0(x)và g0(x) là các hàm danh định của hệ thống

Giả sử rằng ∆f ( t x, ), ∆g ( t x, ) và nhiễu d là không tính được tại từng thời điểm

nhưng có thể biết được các chặn trên và dưới cụ thể là:

max

),

u s t x g d e c e c e

c r t x f s s s

n

)

( )

(

).

, ( )

) , ( (

.

min 0

min 0

1 2 ) 1 ( 1

∆ + +

∆ +

+ + + +

),()

()(x δ0 x δmax x t

Với

1)

1 ) ( 0

min 0

g x g

n n

&

&

& ++++

∆+

min 0

max

) (

1 )

, (

Trang 24

12

Nếu luật điều khiển u được chọn sao cho V& <0, khi đó s− > 0, khi t−>∞

Từ (2.17) suy ra luật điều khiển trượt có tính đến các thành phần bất định như sau:

((),.(

max x t sign g x sign s

là thành phần điều khiển hiệu chỉnh có tác dụng bù cho các thành phần bất định của hệ thống và có giá trị phụ thuộc vào các chặn trên của các thành phần bất định của hệ thống Thường thì δmaxđược chọn bằng một hệ số dương k với

2.1.4 Điều khiển trượt cho hệ thống MIMO

Xét một hệ thống phi tuyến MIMO

Trang 25

điển hình là các hệ thống cơ khí như xe con lắc ngược hoặc con lắc ngược xoay …, lúc

đó bài toán thiết kế điều khiển trượt trở nên phức tạp hơn Trong [1], Utkin đã trình bày một số phương pháp thiết kế điều khiển trượt phân ly áp dụng được cho các hệ thống phi tuyến đa biến có số ngõ vào điều khiển ít hơn số bậc của hệ thống Các

Trang 26

14

phương pháp này dựa trên cơ sở phép đổi biến để đưa hệ thống trở về dạng chuẩn, và

đã áp dụng thành công cho các hệ thống bậc bốn

2.1.5 Đặc điểm của điều khiển trượt

Hình 2-1 Tín hiệu điều khiển trượt có dạng chuyển mạch

Từ mục 2.1.3 và 2.1.4 cho thấy để tính toán thành phần điều khiển tương đương của điều khiển trượt đòi hỏi phải biết đầy đủ các hàm danh định của đối tượng, và để tính toán thành phần điều khiển bền vững cần phải biết các chặn trên của hệ thống và nhiễu

Hàm dấu trong thành phần điều khiển của điều khiển trượt cổ điển tạo nên hiện tượng đảo cực trong tín hiệu điều khiển (tín hiệu điều khiển có dạng chuyển mạch) với tần số cao nhất bằng tần số lấy mẫu và cộng với hiện tượng trễ vật lý của các đối tượng được điều khiển tạo nên hiện tượng dao động của các quỹ đạo pha xung quanh mặt trượt, còn gọi là hiện tượng chattering

Trang 27

15

Hình 2-2 Mô phỏng quỹ đạo pha và hiện tượng chattering

Nếu hệ số k được chọn càng lớn thì tính bền vững của hệ thống càng cao, đồng

thời hiện tượng chattering xuất hiện càng mạnh Hiện tượng chattering gây ra một số hiệu ứng không mong muốn như : phát sinh sai số điều khiển; làm phát nóng mạch

điện tử; mài mòn các bộ phận cơ khí; kích động các mode tần số cao không mô hình hóa làm giảm chất lượng điều khiển hoặc mất ổn định

Bài toán điều khiển trượt áp dụng cho các hệ thống đa biến cần kết hợp giữa điều khiển trượt và điều khiển phân ly Các phương pháp này dựa trên việc phân tích mô hình toán học cụ thể của từng đối tượng và rất phức tạp

2.2 Xấp xỉ hàm của mạng nơ-ron truyền thẳng

Ánh xạ vào ra của mạng hai lớp được biểu diễn như sau:

Trang 28

nơ-Gọi x, u r là cặp tín hiệu vào ra mong muốn của một hàm phi tuyến f Giả sử ta muốn xấp xỉ f bởi mạng u= fˆ( )x =N(x w, )

Định nghĩa hàm mục tiêu J như sau:

1.2

T

=

với = −e u u r

Huấn luyện một mạng nơ-ron nhiều lớp N(x,w) để xấp xỉ hàm f là quá trình cập

nhật hiệu chỉnh lặp các tham số của mạng sao cho J− >min. Lấy đạo hàm (2.36) ta có :

d dt

Trang 29

i

T i

Công thức cập nhật cho các trọng số của nơ-ron ngõ ra

* số 1 trong vector cột nằm ở hàng thứ s

Thay (2.46) vào (2.45), ta có

Trang 30

2.3 Một số mô hình điều khiển trượt dùng mạng nơ-ron

Các luật điều khiển trượt như đã trình bày trong mục 2.1 có nhược điểm là có dạng tín hiệu chuyển mạch gây nên hiện tượng chattering xung quanh mặt trượt, đồng thời luật điều khiển đòi hỏi phải biết chính rõ một số thông số mô hình của đối tượng, thông số mô hình nhiễu công thức Từ những năm gần đây, với sự phát triển của các

kỹ thuật điều khiển thông minh, nhiều mô hình điều khiển ứng dụng các kỹ thuật điều khiển thông minh như điều khiển mờ, mạng nơ-ron, nơ-ron mờ, được nghiên cứu áp dụng vào thành phần của điều khiển trượt cổ điển thành các bộ điều khiển mờ, trượt

mờ, trượt dùng mạng nơ-ron, nhằm cải thiện chất lượng của bộ điều khiển trượt Các

Trang 31

- Ứng dụng mô hình điều khiển trượt phân ly mới kết hợp với điều khiển thông minh nhằm làm giảm độ phức tạp của việc phải tính toán mô hình điều khiển phân ly cổ điển hết sức phức tạp và phụ thuộc quá nhiều vào thông số mô hình của đối tượng

- Các mô hình điều khiển mới áp dụng thành công trên các đối tượng có tính phi tuyến cao và có tính bất định lớn như hệ con lắc đơn, con lắc đôi, hệ cầu banh …

Phần tiếp theo trình bày phân loại các nghiên cứu trên theo thứ tự các nội dung

đã nêu trên

2.3.1 Mô hình sử dụng mạng nơ-ron làm thành phần điều khiển tương đương

Các mô hình trong mục này tổng hợp từ các nghiên cứu [2]-[6], cũng là những nghiên cứu bước đầu phối hợp giữa điều khiển trượt và điều khiển thông minh, trong

đó các nghiên cứu tập trung vào việc thay thế thành phần điều khiển tương đương bằng bộ điều khiển dùng mạng nơ-ron truyền thẳng một lớp

Trong mô hình điều khiển trượt dạng này tín hiệu điều khiển trượt được phân chia như sau:

- Ở vùng xa mặt trượt thành phần điều khiển hiệu chỉnh được sử dụng để hướng các trạng thái tiến về mặt trượt

)())

((.sign g x sign s k

Với k được tính theo công thức (2.22)

- Ở lân cận mặt trượt thành phần điều khiển tương đương được thay thế bằng một mạng hai lớp như mô tả ở mục 2.1 dùng để điều khiển các trạng thái bám trên mặt

Trang 32

20

trượt Ngõ vào của mạng chính là tín hiệu mặt trượt s Các trọng số của mạng được

cập nhật thích nghi trực tuyến sao hàm (2.15) cực tiểu

Luật cập nhật mạng dựa trên phương pháp gradient descent được triển khai theo công thức :

ij ij

w

V w

Việc chỉ sử dụng điều khiển tương đương mà thực chất là bộ điều khiển mạng nơ-ron ở vùng sát mặt trượt đã làm cho hệ thống tuy có khả năng khắc phục được hiện tượng chattering nhưng lại làm suy giảm tính bền vững của hệ thống trước các ảnh hưởng của nhiễu

2.3.2 Mô hình điều khiển trượt phân ly dùng mạng nơ-ron

Năm 2007 Lon-Chen Hung và Hung Yuan Chung ở khoa kỹ thuật điện tử đại học

quốc gia Đài Loan đã giới thiệu kỹ thuật điều khiển phân ly sử dụng bộ điều khiển trượt trên cơ sở mạng nơ-ron DNNSMC (Decoupled Neural Network Sliding Mode Control) cho các hệ thống phi tuyến bậc bốn [8], [9] Tính hiệu quả của bộ điều khiển

đã được kiểm chứng thông qua việc mô phỏng trên nhiều đối tượng có tính phi tuyến cao như con lắc đơn, con lắc đôi, hệ cầu banh, và việc thực nghiệm thành công trên trên hệ thực xe con lắc ngược DNNSMC có thể xem là điển hình cho các nghiên cứu gần đây về điều khiển trượt dùng mạng nơ-ron

Trang 33

21

Năm 2010 Ching Hung Lee và đồng nghiệp cũng đã giới thiệu một kỹ thuật điều khiển trượt phân ly ứng dụng mạng nơ-ron tương tự như kỹ thuật điều khiển DNNSMC, áp dụng cho hệ MIMO phát triển dựa vào thuật toán SPAS (Silmultaneous Pertubation Approximation Algorithm)

Các kỹ thuật phát triển điều khiển trượt thích nghi phân ly trong các tài liệu [10] có nhiều điểm tương tự Vì vậy, trong mục này các nghiên cứu này sẽ được tổng hợp và trình bày thống nhất lại theo ký hiệu riêng của luận án, để tiện theo dõi và bảo

[6]-đảm tính thống nhất của luận án

Hệ thống điều khiển trượt phân ly

Xét một hệ thống bậc bốn có dạng như sau

2 2 2 2

4

4 3

1 1 1 1

2

2 1

)

()(

)

()(

d u x g x f x

x x

d u x g x f x

x x

++

=

=

++

khiển duy nhất u được dùng để điều khiển cho cả hai đáp ứng của các trạng thái lên hai

mặt trượt khác nhau

Định nghĩa tín hiệu mặt trượt thứ nhất

(x z) x [c ][x x ] c z c x c z c

1 12 1

2 1 1 2 1

1

Định nghĩa tín hiệu mặt trượt thứ hai

4 3 2

2 c x x

Trong thiết kế bộ điều khiển trượt phân ly, điều khiển tương đương có nhiệm vụ duy trì các trạng thái trên mặt trượt Điều khiển tương đương có thể đạt được bằng cách chọn s&1 =0

( 1 ) 2 1 2 1 1 1 1 1

1 c x z x c x c z f g u d

s& = & −& + & = − &+ + + (2.59)

Trang 34

22

Ngõ vào điều khiển trượt phân ly được chọn với hàm Lyapunov như sau:

2 1

1.s s c x c z f g u d s

Từ (2.61) suy ra luật điều khiển trượt bao gồm cả thành phần điều khiển tương

đương và điều khiển bền vững trước nhiễu

Trong đó k là hằng số dương Mục đích của điều khiển là lái các trạng thái hệ

thống về điểm cân bằng gốc Các biến s1, s2 cùng suy giảm thông qua biến tạm thời

z Phương trình (2.57) chỉ ra rằng mục đích điều khiển của u được thay đổi từ x1 =0, 0

2 =

x thành x =1 z, x2 =0(Lo & Kuo, 1998) [7]

Biến tạm thời z có thể được định nghĩa

ϕϕ

ϕ

if

if sign

Thiết kế bộ điều khiển trượt phân ly dùng mạng nơ-ron DNNSMC

Trang 35

23

Một mạng nơ-ron SHL như mô tả ở mục 2.2 được dùng để thay thế thành phần

điều khiển tương đương (2.64) với ngõ vào là tín hiệu mặt trượt s1 (xem hình 2.3) Trong đó hàm tác động lớp ẩn có dạng

( 1, ,ˆ ˆ) DNNSMC h

Trong đó u DNNSMClà điều khiển tương đương xấp sỉ, u h là thành phần điều khiển bền vững, được thiết kế để bảo đảm sự ổn định của các trạng thái dưới ảnh hưởng của các thành phần bất định

Trang 36

24

Xem xét một hệ thống phi tuyến động mô tả như (2.56) và mặt trượt được định nghĩa như (2.57) Cho trước một quỹ đạo trạng thái mong muốn liên tục và giới hạn, nếu luật điều khiển trượt phân ly mạng nơ-ron được thiết kế như (2.69), trong đó luật thích nghi của bộ điều khiển mạng nơ-ron được thiết kế như (2.71), (2.72), và bộ điều khiển bền vững được thiết kế như (2.74)

Luật cập nhật thích nghi cho mạng để đảm bảo luật điều khiển (2.69) ở ngõ ra của mạng như sau:

sign s

v&=−γ2 ∆ ( 1).σ′ & ∆ & (2.72)

Hình 2-4 Hệ thống DNNSMC của Lon-Chen Hung và Hung Yuan Chung

Trang 37

mà Kuo và Lo đã thực hiện bằng các hệ thống điều khiển trượt mờ phân ly DFSM [7]

“Các kết quả thực mô phỏng và thực nghiệm đã cho thấy đáp ứng và tính bền vững của

hệ thống DNNSMC tốt hơn so với hệ thống do Kuo & Lo đề nghị “ [8],[9]

Hình 2-6 Đáp ứng góc con lắc ngược của điều khiển DNNSMC so với DFSM

Tổng luận về điều khiển trượt phân ly dùng mạng nơ-ron

Trang 38

26

Chương này đã trình bày lý thuyết cơ sở về mạng nơ-ron, sơ lược một số ứng dụng về nhận dạng và điều khiển ứng dụng mạng nơ-ron, điều khiển trượt cổ điển và một số phương pháp điều khiển trượt dùng mạng nơ-ron

Về mặt lý thuyết thì việc áp dụng mạng nơ-ron trong nhận dạng và điều khiển là khá lý tưởng Tuy nhiên trong thực tế việc áp dụng mạng nơ-ron để nhận dạng và điều khiển là không dễ dàng, nhất là khi áp dụng lên các đối tượng phi tuyến động học có

độ phức tạp cao Hơn nữa bất kỳ bộ điều khiển dùng mạng nơ-ron nào đều cũng phải

áp dụng một trong các phương pháp điều khiển kinh điển là cơ sở để điều khiển

Điều khiển trượt thích nghi dùng mạng nơ-ron trong những năm gần đây đã có những thành quả nhất định trong việc thay thế thành phần điều khiển tương đương bằng một mạng nơ-ron với luật cập nhật thích nghi trực tuyến cho các trọng số của mạng với tín hiệu hồi tiếp cập nhật thích nghi là tín hiệu mặt trượt mà không cần biết trước các hàm phi tuyến của đối tượng Với việc chỉ duy trì điều khiển bền vững ở vùng xa mặt trượt hoặc thay thế hàm dấu trong thành phần điều khiển bền vững bằng hàm bão hòa đã hạn chế được hiện tượng chattering

Tuy nhiên về mặt bản chất thì các luật điều khiển trượt dùng mạng nơ-ron như đã nêu trên vẫn là luật điều khiển trượt cổ điển, vì vậy các phương pháp làm hạn chế hiện tượng chattering sẽ làm giảm tính bền vững của hệ thống ở vùng sát mặt trượt và ngược lại

Bài toán điều khiển trượt phân ly với phân ly các hệ thống bậc cao thành các hệ thống con có bậc thấp hơn theo các phương pháp điều khiển trượt phân ly mà Kuo và

Lo đã giới thiệu đã cơ bản giải quyết được bài toán điều khiển trượt phân ly cho các

hệ thống phi tuyến bậc bốn Tuy nhiên, khi áp dụng phương pháp trên cho các hệ thống có bậc cao hơn bậc bốn cần phải áp dụng thêm các phương pháp biến đổi khác

để phân ly hệ thống thành các hệ thống con có bậc nhỏ hơn hoặc bằng bốn

Bài toán dùng mạng nơ-ron như bộ điều khiển thích nghi trực tiếp duy nhất mà không cần nhận dạng trước các thông số mô hình đối tượng và có khả năng huấn luyện trực tuyến trong quá trình điều khiển, không cần áp dụng các phương pháp thử sai là một bài toán hết sức thú vị và có nhiều ý nghĩa khi áp dụng được trong thực tiễn Điều khiển trượt là một phương pháp điều khiển đơn giản có thể được áp dụng để làm cơ sở cho các luật điều khiển của một bộ điều khiển nơ-ron trực tiếp, với điều kiện cần phải

Trang 39

27

cải biên dạng tín hiệu điều khiển thành dạng hàm trơn và luật điều khiển phải thích nghi được với sự thay đổi của các chặn trên của các thành phần bất định, để có thể thống nhất các thành phần điều khiển trượt vào một bộ điều khiển duy nhất dùng mạng nơ-ron Chương ba của luận án sẽ tiếp tục hướng nghiên cứu dùng mạng nơ-ron như

bộ điều khiển thích nghi trực tiếp với các luật điều khiển trượt được cải biên theo dạng hàm trơn và phát triển thành bộ điều khiển trượt thích nghi phân ly áp dụng được cho các hệ phi tuyến đa biến

Trang 40

điều khiển trượt dùng mạng nơ-ron không thông qua nhận dạng đối tượng Áp dụng thành công các phương pháp thiết kế các bộ điều khiển trực tiếp không thông qua nhận dạng, sẽ giúp đơn giản hóa quy trình và giảm chi phí thiết kế Tuy nhiên hạn chế của các phương pháp này là mạng nơ-ron vẫn chưa thay thế hoàn toàn bộ điều khiển trượt, luật điều khiển vẫn là luật điều khiển trượt cổ điển và phải có sự lựa chọn giữa chất lượng điều khiển và việc hạn chế hiện tượng chattering

Chương này sẽ giới thiệu một bộ điều khiển trượt thích nghi phân ly mới DANSMC (Decoupled Adaptive Neural Sliding Mode Control) áp dụng được cho các

hệ thống phi tuyến đa biến Các nghiên cứu được trình bày trong chương này đã được công bố trên các bài báo [CB1]-[CB6] (Mục các tài liệu công bố của tác giả)

Ý tưởng chính là sử dụng một mạng mạng nơ-ron truyền thẳng làm thành một bộ

điều khiển trực tiếp Luật điều khiển được đưa ra dựa trên cơ sở lý thuyết điều khiển trượt sao cho có thể điều khiển được các trạng thái bám theo một quỹ đạo đã được

định trước trong quá trình tiến đến mặt trượt và bám chặt vào mặt trượt nhằm khắc phục hiện tượng chattering Luật điều khiển ở đây có dạng hàm trơn thích hợp để huấn luyện cho hàm mạng nơ-ron Trên cơ sở của lý thuyết ổn định của Lyapunov đưa ra các luật cập nhật cần thiết để huấn luyện mạng Cuối cùng là kết hợp giữa bộ điều khiển trượt thích nghi dùng mạng nơ-ron đã nêu trên và lý thuyết điều khiển trượt phân

ly để hình thành bộ điều khiển trượt thích nghi phân ly dùng mạng nơ-ron DANSMC

3.1 Điều khiển trượt thích nghi dùng mạng nơ-ron

3.1.1 Mô tả bộ điều khiển

Mô hình đối tượng và các định nghĩa về hệ thống phi tuyến như đã mô tả ở mục 2.2

Ngày đăng: 03/04/2016, 15:20

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] V.I. Utkin et al, Sliding Mode Control in Electromechanical Systems. Taylor &amp; Francis, 1999 Sách, tạp chí
Tiêu đề: Sliding Mode Control in Electromechanical Systems
[2] A. Sabanovic, K. Jezernik, M. Rodic, "Neural network Application in Sliding Mode Control Systems," in IEEE Internationl Workshop Proceedings on Variable Structure Systems, 1996, pp. 143-147 Sách, tạp chí
Tiêu đề: Neural network Application in Sliding Mode Control Systems
[3] C.H. Tsai, H.Y. Chung and F.M. Yu , "Neuro-Sliding Mode Control With Its Applications to Seesaw Systems," IEEE Transactions on Neural Networks, vol.15, no. 1, pp. 124-134, 2004 Sách, tạp chí
Tiêu đề: Neuro-Sliding Mode Control With Its Applications to Seesaw Systems
[4] H. Morioka et al, "Neural Network Based Chattering Free Sliding Mode Control," in Proceedings of the 34th SICE Annual Conference, 1995, pp. 1303-1308 Sách, tạp chí
Tiêu đề: Neural Network Based Chattering Free Sliding Mode Control
[5] M. Onder Efe, O. Kaynak, X. Yu and B.M. Wilamowski, "Sliding Mode Control of Nonlinear Systems Using Gaussian Radial Basis Function Neural Networks,"in Neural Networks, 2001. Proceedings. IJCNN '01. International Joint Conference on, 2001, pp. 474-479 Sách, tạp chí
Tiêu đề: Sliding Mode Control of Nonlinear Systems Using Gaussian Radial Basis Function Neural Networks
[6] N.T. Hiệp, P.T. Cát, " Đ iều khiển Rôbôt theo nguyên lý trượt sử dụng mạng nơ- ron," Tạp chí tin học và điều khiển học, vol. 24, no. 3, pp. 236-246, 2008 Sách, tạp chí
Tiêu đề: Điều khiển Rôbôt theo nguyên lý trượt sử dụng mạng nơ-ron
[7] J.C. Lo and Y.H. Kuo, "Decoupled Fuzzy Sliding Mode Control," IEEE Transactions On Fuzzy Systems, vol. 6, no. 3, pp. 426-435, 1998 Sách, tạp chí
Tiêu đề: Decoupled Fuzzy Sliding Mode Control
[8] L.C. Hung and H.Y. Chung, "Decoupled control using neural network-based sliding-mode controller for nonlinear systems," Expert Systems with Applications, vol. 32, no. 4, pp. 1168-1182, 2007 Sách, tạp chí
Tiêu đề: Decoupled control using neural network-based sliding-mode controller for nonlinear systems
[9] L.C. Hung and H.Y. Chung, "Decoupled sliding-mode with fuzzy-neural network controller for nonlinear systems," International Journal of Approximate Reasoning, vol. 46, no. 1, pp. 74-97, 2007 Sách, tạp chí
Tiêu đề: Decoupled sliding-mode with fuzzy-neural network controller for nonlinear systems
[10] C.H. Lee et alt, "Neural Network-based Decoupled Sliding mode Controller Design forDiscrete-time Nonlinear MIMO Systems by SPSA Algorithm," in IMECS 2010, Hong Kong, 2010, pp. 978-988 Sách, tạp chí
Tiêu đề: Neural Network-based Decoupled Sliding mode Controller Design forDiscrete-time Nonlinear MIMO Systems by SPSA Algorithm

TỪ KHÓA LIÊN QUAN

w