Bài viết đề xuất một phương pháp tổng hợp bộ điều khiển cho một lớp đối tượng phi tuyến bất định trên cơ sở điều khiển trượt và mạng nơ ron RBF nhằm làm giảm hiện tượng rung trên mặt trượt. Trọng số mạng nơ ron được cập nhật thích nghi theo một tiêu chuẩn tối ưu.
Trang 1MỘT PHƯƠNG PHÁP TỔNG HỢP BỘ ĐIỀU KHIỂN CHO LỚP ĐỐI TƯỢNG PHI TUYẾN BẤT ĐỊNH HÀM TRÊN CƠ SỞ ĐIỀU KHIỂN
TRƯỢT VÀ MẠNG NƠ RON RBF
Ngô Trí Nam Cường*
Tóm tắt: Bài báo đề xuất một phương pháp tổng hợp bộ điều khiển cho một lớp
đối tượng phi tuyến bất định trên cơ sở điều khiển trượt và mạng nơ ron RBF nhằm làm giảm hiện tượng rung trên mặt trượt Trọng số mạng nơ ron được cập nhật thích nghi theo một tiêu chuẩn tối ưu Kết quả mô phỏng đã một lần nữa xác nhận bằng thực nghiệm hiệu quả của luật cập nhật và bộ điều khiển đề xuất đảm bảo hệ bám tín hiệu đầu vào mong muốn
Từ khóa: Điều khiển trượt; Mạng nơ ron RBF; Hệ phi tuyến bất định
1 ĐẶT VẤN ĐỀ
Trong công nghiệp, giao thông vận tải và năng lượng thường gặp các đối tượng điều khiển phi tuyến có mô hình bất định hàm Việc tổng hợp hệ thống điều khiển cho các đối tượng dạng này sao cho đầu ra của hệ bám theo được tín hiệu đặt mong muốn mà không phụ thuộc vào các thành phần bất định hàm đó cũng như chất lượng bám là tốt, không dao động hoặc nếu có thì cũng nằm trong phạm vi dao động cho phép là vấn đề thời sự hiện nay Chúng thu hút sự chú ý của các nhà khoa học trong lĩnh vực điều khiển và tự động hóa Trong các thập kỷ gần đây, có nhiều nghiên cứu để tổng hợp luật điều khiển cho các đối tượng phi tuyến bất định bằng các phương pháp khác nhau Đặc biệt phương pháp tổng hợp luật điều khiển trên cơ sở ưu điểm của điều khiển trượt và mạng nơ ron đang được quan tâm, đã thu được nhiều kết quả, đơn cử [1, 2, 3] Tuy vậy, các luật học của mạng nơ ron trong các công trình trên còn phụ thuộc vào mặt trượt S, trong khi đó tín hiệu điều khiển trên mặt trượt luôn dao động với tần số cao, do đó ảnh hưởng rất lớn đến quá trình hội tụ của thuật toán, thậm chí khi biên độ dao động của S lớn còn có thể gây mất ổn định của hệ thống, nhất là đối với các hệ bám Dưới đây, bài báo đề xuất một phương pháp tổng hợp bộ điều khiển cho lớp đối tượng phi tuyến bất định trên cơ sở điều khiển trượt kết hợp mạng nơ ron RBF để khắc phục nhược điểm trên
2 TỔNG HỢP LUẬT ĐIỀU KHIỂN
Giả sử động học của đối tượng điều khiển được mô tả bằng hệ phương trình:
1
1
, 1, 2, , 1 ( ) , 0
i i
n
y x
(1)
trong đó, x x x1, 2, , xnT là véc tơ trạng thái; u là đầu vào, y là đầu ra và chúng
đều có giá trị thực, f x là hàm phi tuyến trơn bất định của mô hình, b là tham số động ( ) học của đối tượng đã biết Với đối tượng đối tượng phi tuyến bất định nêu trên, luật điều khiển sau đây sẽ được thiết lập dưới dạng:
smc fb
u u u (2)
với usmc là thành phần điều khiển được xây dựng trên cơ sở lý thuyết điều khiển trượt và
fb
u là thành phần điều khiển phản hồi trạng thái:
Trang 2u K x b (3)
có K k k1, 2, , kn với các hệ số k k1, 2, , kn của một đa thức Hurwitz:
1
P p p k p k p k (4) Tiếp đến, thay luật (2) cùng chú ý (3),(4) vào hệ (1), được:
1
1 1 2 2
1
( )
i i
y x
Bởi vậy nếu đặt:
1 2
( )
n
thì công thức (5) ở trên viết lại được thành:
( ) , 1, 0, , 0
smc
y C x C
(6)
Cấu trúc hệ thống điều khiển được thể hiện ở hình vẽ dưới đây, trong đó, ĐT là đối tượng điều khiển; SMC là bộ điều khiển trượt; M là mô hình; K là ma trận phản hồi; ND là khối nhận dạng
Hình 1 Sơ đồ cấu trúc rút gọn của hệ thống điều khiển kết hợp SMC và mạng RBF
2.1 Tổng hợp luật cập nhật trọng số mạng nơ ron
Vấn đề đặt ra tiếp theo là xác định cấu trúc thuật toán của khối ND Để bộ ND thực hiện chức năng nhận dạng véc tơ hàm phi tuyến bất định F x trên cơ sở mạng nơ ron ( ) RBF Kết quả nhận dạng này sẽ được ta ký hiệu bởi ˆ ( )F x với:
ˆ
ˆ ( ) [0, ,0, ( )]T
Giả sử đã có ˆ ( )F x Thay kết ˆ ( ) F x vào mô hình (6), khi đó do giữa F x và ˆ ( )( ) F x có sai số nên tương ứng ta sẽ không thu được x mà chỉ là x có một sai lệch kéo theo so với m
x, tức là lúc này hệ (6) trở thành:
Trang 3ˆ ( )
m m smc
x Ax Bu F x (7) trong đó, xm [ x1m, , xn m T] Nhiệm vụ chỉnh định mạng nơ ron là phải làm cho sai lệch trạng thái Exx m giữa (6) và (7) tiến về 0 Sai lệch này được biểu diễn bởi:
( )
m
E x x AE F x (8)
với:
ˆ ˆ
( ) ( ) ( ) [0, , 0, ( ) ( )]T [0, , 0, ( )]T
F x F x F x f x f x f x
trong đó, f x ( ) f x ( ) f x ˆ ( ) là sai số nhận dạng Vì f x ( ) được giả thiết là hàm trơn,
nên trong một miền compact và thông qua bộ cơ sở thích hợp, cùng các các trọng số lý tưởng w*i, nó luôn biểu diễn được bằng một mạng nơ ron RBF:
* 1
( ) m i i( )
i
(9)
có x là tổ hợp các đầu vào của nơ ron thứ i
Chọn các hàm cơ sở:
i x x ci i
(10)
Trong đó: ci là véc tơ có chiều bằng chiều của véc tơ x ,i là độ trải rộng của hàm
cơ sở thứ i , i =1,2…m
Khi đó, việc nhận dạng hàm bất định f x với bộ hàm cơ sở này là tương đương với ( ) việc hiệu chỉnh trọng số ˆw i của:
1
ˆ ( ) m ˆ ( )
i i i
(11)
sao cho có được f x ˆ ( ) f x ( ), tức là f x ( ) 0, hay hệ (8) là ổn định Ký hiệu:
* ˆ
i i i
w w w (12)
rồi sử dụng ứng hàm Lyapunov sau có ma trận đối xứng xác định dương P nào đó:
2 1
m T
i i
, (13)
ta sẽ có:
1
2m
i i i
(14)
Tiếp theo, thay (8) vào (14) sẽ được:
1
m
i i i
và cùng với (9),(11),(12) có:
Trang 4Bởi vậy để có được V 0 là điều kiện hiệu chỉnh trọng số mạng nơ ron, ta cần có từ công thức (16) hai điều kiện sau:
T T
E A P PA E (17)
và
(18)
Xét điều kiện thứ nhất (17) Do A là Hurwitz nên phương trình Lyapunov:
T
A PPA Q
với mọi ma trận đối xứng xác định dương cho trước Q luôn có nghiệm P cũng đối xứng xác định dương Sử dụng ma trận P này cho hàm Lyapunov (13) ta sẽ có từ (17):
0
T
E QE
(19) Tiếp theo, từ điều kiện thứ hai (18) ta có:
( )
T
i n i
w E P x
trong đó P là vector cột thứ n của P Cuối cùng, do n *
i
w const nên cùng với (12) ta
có luật cập nhật trọng số ˆw cho mạng nơ ron như sau: i
ˆi T n i( )
w E P x (20)
2.2 Tổng hợp bộ điều khiển trượt
Sau đây ta sẽ xây dụng luật điều khiển usmc của khối SMC Trước tiên ta ký hiệu vector sai lệch giữa véc tơ trạng thái mong muốn xd ( y yd, d, , yd(n1))T và véc tơ
trạng thái x của hệ (6) là:
d
e x x (21) Khi đó với mặt trượt:
s S e (22)
có S s1, ,s n được chọn để từ s suy ra được 0 e 0, cũng như khi sử dụng ứng hàm Lyapunov V s2 2, thì để có s rõ ràng ta phải có 0 V ss 0 Hiển nhiên ta
sẽ có được điều kiện đủ này nếu có:
sgn( )
s s , (23) với 0 tùy chọn Như vậy, sau khi đạo hàm hai vế (22) thì cùng với (23) ta được:
sS eS x x s (24) Cuối cùng, thay (6) vào (24) có:
S x Ax Bu F x s , (25) hay:
1
(26)
Trang 52.3 Kết hợp bộ điều khiển trượt và mạng nơ ron
Bộ điều khiển trượt (26) có chứa thành phần bất định hàm f x ( ) nên không sử dụng được trực tiếp Khi thay nó bằng kết quả nhận dạng (11) theo luật cập nhật (20) từ mạng
nơ ron thì cùng với (2) ta sẽ có bộ điều khiển kết hợp (2) gồm (26) có thêm cơ cấu nhận dạng và (3) cho hệ (1) như sau:
1
ˆ
m
T d
i i i
Định lý: Bộ điều khiển (27) với luật cập nhật (20) sẽ đưa được đầu ra y của hệ phi tuyến
bất định hàm (1) bám tiệm cận theo được tín hiệu mẫu y khả vi n lần d
Chứng minh:
Ta thấy ngay rằng bộ điều khiển (27) đã cho chính là:
Tiếp theo, do (26) là bộ điều khiển trượt cho hệ (6) ứng với mọi hàm bất định F x ( )
trơn nên nó cũng đúng khi F x trong (6) được thay bởi ˆ ( )( ) F x Lúc này (26) sẽ trở thành:
1
ˆ ( ) d sgn( )
smc
và tất nhiên bộ điều khiển usmc đó sẽ làm cho đầu ra ym C xm của hệ rõ (7), là hệ tương ứng với (6), bám tiệm cận theo được tín hiệu mẫu yd khả vi n lần Suy ra, khi được kết hợp thêm thành phần ufb cho trong công thức (3) thì nó trở thành bộ điều khiển (28) ở trên và bộ điều khiển này cũng sẽ làm đầu ra y của hệ rõ tương ứng với hệ bất m
định (1) ban đầu, được hiểu là hệ:
1
1
, 1, 2, , 1
ˆ ( )
m m
i i m n m m
(29)
bám tiệm cận theo được y , hay d ym yd
Cuối cùng, do cơ cấu nhận dạng bằng mạng nơ ron với luật cập nhật (20) luôn làm cho sai lệch E x xm tiến tiệm cận về gốc nên nó cũng sẽ làm cho sai số đầu ra y và ym
giữa hai hệ (1) và (29) tiến về 0, tức là có y ym Kết hợp với kết luận trên ta đên được
m d
y y y và đó là đ.p.c.m
3 KẾT QUẢ MÔ PHỎNG
Xét đối tượng có mô hình:
4
1
.
y x
Trang 6trong đó, f x( ) 2(x141)x2(x1tanh( ))x1 được xem như hàm bất định của đối tượng
Sử dụng bộ điều khiển (27) cùng với luật cập nhật (20) có các tham số cụ thể là:
1 0.0002, 2 0.03, 1 2, 2 1, 0.1
ta sẽ thu đươc kết quả mô phỏng bằng phần mềm Matlab-Simulink như thể hiện ở hình 2
và 3, trong đó hình 2 là đồ thị hàm f x ( ) cùng kết quả nhận dạng f x ˆ ( ) của nó bằng mạng nơ ron RBF với luật cập nhật trọng số cho ở công thức (20), còn hình 3 là quỹ đạo đặt yd và tín hiệu đầu ra y của hệ khi sử dụng bộ điều khiển kết hợp (27)
Hình 2 cho thấy kết quả nhận dạng f x ˆ ( ) cho hàm phi tuyến f x ( ) hoàn toàn đúng như yêu cầu, tức là sai số nhận dạng đã tiệm cận về 0 Kết quả mô phỏng ở hình 3 khẳng định chất lượng điều khiển đã được đảm bảo, tức là đáp ứng của hệ thống y đã bám chặt theo được tín hiệu đặt mong muốn yd Như vậy, những kết quả mô phỏng này đã lần nữa minh chứng bằng thực nghiệm tính hiệu quả của thuật toán điều khiển đề xuất
Hình 2 Kết quả nhận dạng Hình 3 Đáp ứng của hệ thống
4 KẾT LUẬN
Với công cụ của lý thuyết điều khiển trượt và mạng nơ ron RBF bài báo đã tổng hợp được hệ thống điều khiển cho đối tượng có phương trình động học (1) Xây dựng được thuật toán nhận dạng cho hàm phi tuyến bất định f x ( ) trên cơ sở sử dụng công cụ mạnh của mạng nơ ron nhân tạo Luật nhận dạng đơn giản, hiệu quả, dễ thực hiện trong kỹ thuật Đặc biệt, phương pháp nhận dạng bài báo đề xuất có ứu điểm quá trình hiệu chỉnh luật nhận dạng chỉ diễn ra khi f x ( ) thay đổi, nghĩa là khi có sai lệch E giữa đối tượng và mô
hình mà không phụ thuộc vào yếu tố nào khác; luật cập nhật trọng số mạng nơ ron khắc phục được một số nhược điểm hiện có ở [1, 2, 3] Đã thiết lập được luật điều khiển trượt đảm bảo hệ thống kín hoạt động trong chế độ trượt trên mặt trượt s 0 Kết quả mô phỏng thể hiện tính đúng đắn của phương pháp
TÀI LIỆU THAM KHẢO
[1].T Zhang, S S Ge, and C C Hang, “Stable Adaptive Control for a Class of Nonlinear Systems Using a Modified Lyapunov Function,” IEEE Transactions on automatic
control, Vol 45, No 1, January 2000,pp 129-131
[2] L X Wang, “A Course in Fuzzy Systems and Fuzzy Control”, Englewood Cliffs, NJ,
USA: Prentice-Hall, 1997
[3] Mou Chen, Shuzhi Sam Ge,” Direct Adaptive Neural Control for a Class of Uncertain Nonaffine Nonlinear Systems Based on Disturbance Observer”, IEEE Transactuons
on cyberynetics, vol 43, no 4, august, pp.1213 -1225
Trang 7[4] Ngô Trí Nam Cường ,” Một phương pháp nhận dạng và bù trừ các thành phần bất định cho một lớp đối tượng phi tuyến,” Tạp chí Nghiên cứu khoa học và công nghệ
Quân sự, số 50, tháng 08 năm 2017, trang 53-61
[5].Utkin, Vadim, “Sliding Modes in Control and Optimization,” Springer – Verlag
Berlin, Heidelberg 1992
[6] James M Ortega ,“Matrix Theory,” Plenum Press 1987
ABSTRACT
A METHOD OF SYNTHESIZING ADAPTIVE CONTROLLER FOR A CLASS OF UNCERTAIN NONLINEAR PLANTS BASED ON THE THEORY OF SLIDING
MODE CONTROL AND NEURAL RBF NETWORK
The paper proposes a method for the systhesis of adaptive control system for
a class of uncertain nonlinear plants based on the theory of sliding mode control and neural RBF network to reduce the vibration in the sliding surface Weights of the neural network are updated to adapt to an optimal standard The simulation result has once again verified by experiment the effectiveness of proposed weight updating and control law rules in assuring the tracking desirable input signals of the system
Keywords: Sliding mode control; RBF neural network; Uncertain nonlinear systems
Nhận bài ngày 01 tháng 7 năm 2018 Hoàn thiện ngày 10 tháng 9 năm 2018 Chấp nhận đăng ngày 20 tháng 9 năm 2018
Địa chỉ: Công ty CP Systemtec, Phòng 2207 nhà CT1-B2 khu đô thị Xa La, phường Phúc La, Hà
Đông, Hà Nội;
* Email: ncuong792000@gmail.com