The remarkable feature of sliding mode control (SMC) is the stability robustness against disturbances and variations of the system. However to design SMC, the exact model of the plant has to be known. Moreover the large gain of an SMC may intensify the chattering on the sliding surface. To cope with the above drawbacks, we propose to use a radial basis function neural network (RBFNN) to estimate the plant model and to use a fuzzy based gain for the SMC. This SMC gain is developed based on Lyapunov stability theory. The proposed algorithm is applied to control a three degrees of freedom robot manipulator, which is a complex MIMO (Multi input multi output) nonlinear system. Simulation results are provided to illustrate the proposed method.
Tạp chí Khoa học 2010:15a 273-282 Trường Đại học Cần Thơ ĐIỀU KHIỂN TRƯỢT THÍCH NGHI DÙNG MÔ HÌNH NƠRON MỜ Nguyễn Hoàng Dũng1 Dương Hoài Nghĩa2 ABSTRACT The remarkable feature of sliding mode control (SMC) is the stability robustness against disturbances and variations of the system However to design SMC, the exact model of the plant has to be known Moreover the large gain of an SMC may intensify the chattering on the sliding surface To cope with the above drawbacks, we propose to use a radial basis function neural network (RBFNN) to estimate the plant model and to use a fuzzy based gain for the SMC This SMC gain is developed based on Lyapunov stability theory The proposed algorithm is applied to control a three degrees of freedom robot manipulator, which is a complex MIMO (Multi input multi output) nonlinear system Simulation results are provided to illustrate the proposed method Keywords: Neural network, radial basis function, nonlinear system control, system modeling, robot manipulators Title: Adaptive sliding mode control using fuzzy based Neural Network TÓM TẮT Ưu điểm bậc điều khiển trượt tính ổn định bền vững hệ thống có nhiễu thông số đối tượng thay đổi theo thời gian Tuy nhiên, để thiết kế điều khiển trượt, người thiết kế cần biết xác mô hình đối tượng Trong thực tế, vấn đề lúc thực Hơn nữa, biên độ luật điều khiển trượt lớn gây tượng dao động (chattering) quanh mặt trượt Để giải khó khăn trên, báo đề nghị sử dụng mạng nơron hàm sở xuyên tâm (RBFNN) để ước lượng trực tuyến hàm phi tuyến luật điều khiển Và sử dụng logic mờ để ước lượng biên độ luật điều khiển dựa vào lý thuyết ổn định Lyapunov Giải thuật đề nghị áp dụng để điều khiển hệ tay máy ba bậc tự Với điều khiển này, đáp ứng hệ tay máy: độ vọt lố 3%( Rad ) , thời gian tăng 3%( s ) sai số xác lập xấp xỉ 1% Kết điều khiển kiểm chứng phần mềm mô Matlab Từ khóa: Mạng nơron, hàm sở xuyên tâm, điều khiển hệ phi tuyến, mô hình hóa hệ thống, hệ tay máy GIỚI THIỆU Khái niệm điều khiển trượt cho hệ thống bậc hai đưa Emelyanov vào cuối năm 1960 (M Önder Efe et al., 2000; M Önder Efe et al., 2001; Wilfrid Perruquetti et al., 2002; Trần Quang Thuận, 2006) Sau phương pháp nhiều nhà khoa học quan tâm tính ổn định bền vững nhiễu thay đổi thông số mô hình Khoa Công Nghệ, Trường Đại học Cần Thơ Khoa Điện-Điện Tử, Trường Đại học Bách Khoa TPHCM 273 Tạp chí Khoa học 2010:15a 273-282 Trường Đại học Cần Thơ Để có điều khiển trượt, người thiết phải biết xác mô hình đối tượng Trong thực tế, vấn đề lúc thực Do để giải khó khăn trên, đề nghị dùng mạng RBFNN để ước lượng trực tuyến hàm phi tuyến luật điều khiển Ngoài biên độ luật điều khiển trượt lớn, quỹ đạo pha dao động quanh mặt trượt (Nasser Sadati et al, 2005) Để làm giảm tượng dao động, báo đề nghị sử dụng logic mờ để ước lượng biên độ luật điều khiển Giải thuật áp dụng để điều khiển hệ tay máy ba bậc tự Đây hệ phi tuyến MIMO Đối với đối tượng này, có số nhà khoa học nghiên cứu như: (Ayca Gokhan Ak et al., 2006) sử dụng luật điều khiển tương đương luật điều khiển chuyển đổi để đưa quỹ đạo pha quay mặt trượt trì ổn định mặt trượt đó; (Xie Jian et al., 2003) khảo sát đặc tính động học hệ tay máy; (Subashini Elangovan et al.,2004) sử dụng logic mờ để ước lượng hàm phi tuyến nhiễu nhằm loại bỏ dao động điều khiển trượt MÔ HÌNH HỆ TAY MÁY Mô hình động học hệ tay máy bậc tự sau (Ayca Gokhan Ak et al., 2006) M ( ) F ( , ) G ( ) d (t ) u (1) M 11 với M M 21 M 31 M 12 M 22 M 32 M 13 M 23 ma trận quán tính, F=[F1 F2 F3]T vector ma sát, M 33 G=[G1 G2 G3]T vector trọng lực, d(t) tín hiệu nhiễu, u=[u1 u2 u3]T vector tín hiệu điều khiển, =[1 2 3]T góc khớp hệ tay máy, M 12 M 21 m l 22 l1l cos(θ ) m l 22 l 32 l1l cos(θ ) m l1l cos(θ θ ) 2l l cos(θ ) , m l m l l 2l l cos(θ ) , M m l l l cos(θ ) , M 13 M 31 m l 32 l1l cos(θ θ ) m l l cos(θ ), M 22 M 23 2 32 2 3 3 3 3 M 33 m l 32 , F1 (m m )l1l (2θ 1θ θ 22 )sin(θ ) m l1l qsin(θ θ ) m l l (2θ θ 2θ θ θ )sin(θ ), 3 3 3 3 3 3 q 212 213 223 22 32 , F2 (m2 m3 )12 sin( ) m3 l1l312 sin( ) m l l (2 2 ) sin( ), F3 m3l1l312 sin( ) m2 l l3 (1 2 ) sin( ), G1 m1 gl1 cos(1 ) m2 g l cos(1 ) l1 cos(1 ) m3 g l1 cos(1 ) l cos(1 ) m3 g l3 cos(1 ) , G2 m2 gl cos(1 ) m3 g l cos(1 ) m3 g l3 cos(1 ) , G3 m3 gl3 cos(1 ), Các thông số hệ tay máy: m1=1kg khối lượng khớp 1, 274 Tạp chí Khoa học 2010:15a 273-282 Trường Đại học Cần Thơ m2=0.8kg khối lượng khớp 2, m3=0.5kg khối lượng khớp 3, l1=1m chiều dài khớp 1, l2=0.8m chiều dài khớp 2, l3=0.6m chiều dài khớp 3, g=9.81 m/s2 gia tốc trọng trường ĐIỀU KHIỂN TRƯỢT THÍCH NGHI DÙNG MẠNG RBFNN VÀ LOGIC MỜ 3.1 Điều khiển trượt Gọi d đáp ứng mong muốn hệ tay máy, ngõ thực hệ tay máy Mục tiêu điều khiển đưa tiến d với sai số bé Định nghĩa sai số điều khiển (2) e=-d (2) Mặt trượt si (với i 1,3 ) si ei ei , ai>0 (3) Chọn luật điều khiển u cho s1 k1 sign( s1 ) s s2 k sign( s ) s3 k sign( s3 ) Luật điều khiển trượt (4) 1d a1 1d k1sign( s1 ) u F (, ) G () M 2 d a2 d k2 sign( s2 ) 3d a3 3d k3sign( s3 ) (5) với ki: biên độ luật điều khiển khớp thứ i 3.2 Điều khiển trượt mờ Biên độ luật điều khiển ước lượng trực tuyến hệ suy diễn mờ với luật mờ có dạng sau: IF si is Aim THEN ki is Bim , với i 1,3 Aim Bim tập mờ (Hình 1) Hình 1: Tập mờ si ki 275 Tạp chí Khoa học 2010:15a 273-282 Trường Đại học Cần Thơ Các hàm thành viên sử dụng hàm Gauss (Ayca Gokhan Ak et al., 2006) s i A ( si ) exp i i , i 1,3 (6) i, i tâm độ rộng hàm Gauss thứ i Chọn hàm xác định dương V si i 1 (7) 3 i 1 i 1 Suy V si k i sign( si ) s i k i (8) Do đó, luật mờ định nghĩa sau: IF si is ZE THEN ki is ZE IF si is PS THEN ki is PS IF si is PM THEN ki is PM IF si is PB THEN ki is PB với ZE: Zero, PS: Positive Small, PM: Positive Medium, PB: Positive Big 3.3 Điều khiển trượt dùng mạng RBFNN Hệ phi tuyến cho (9) x f ( x) g ( x)u y h( x ) (9) với x=[x1, x2, ,xn]T vector trạng thái, u tín hiệu vào, y tín hiệu ra, f(x) g(x)là hàm phi tuyến mô tả đặc tính động học hệ thống Giả sử (10) không chứa u (11) có chứa u d r 1 y L(fr 1) h( x) L(fr 2) L g h( x)u (10) r 1 dt dry L(fr ) h( x) L(fr 1) L g h( x)u (11) dt r h( x) h( x) với L f h( x) f ( x) đạo hàm Lie theo phương f(x) L g h( x) g ( x) x x đạo hàm Lie theo phương g(x) Từ (11) suy y ( r ) a( x) b( x)u Với a( x) L(fr ) h( x) , b( x) L(fr 1) Lg h( x) Luật điều khiển u xác định cho y ( r ) v(t ) Với v(t) tín hiệu điều khiển Từ (12) (13) suy u * ( x) a( x) v(t ) b( x ) (12) (13) (14) Luật điều khiển v(t) xác định dựa phương pháp gán cực với phương trình đặc trưng: e ( r ) k1e ( r 1) k r 1e (15) với e(t ) y m (t ) y (t ) (16) k1, k2, , kr-1 chọn cho (15) có nghiệm xác định âm 276 Tạp chí Khoa học 2010:15a 273-282 Trường Đại học Cần Thơ Từ (13), (15) (16) suy (17) (18) y m( r ) (t ) v(t ) k1e ( r 1) k r 1e ( r 1) hay v(t ) y (t ) k1e k r 1e ( r 1) k r 1e Đặt es es (t ) k1e ( r 1) ( r 2) Với es (t ) e k1e k r 1e , số dương es es e ( r ) , (Huỳnh Thái Hoàng, 2006) (19) Luật điều khiển (14) xấp xỉ mạng RBFNN uˆ ( x) uT u ( x) Trong u ( x) hàm sở Gauss, u trọng số cập nhật cho uˆ tiến đến u* Do uˆ ước lượng mạng RBFNN với số nơron lớp ẩn hữu hạn nên không tránh khỏi sai số Gọi u(x) sai số cấu trúc, ta có u * ( x) u*T u ( x) u ( x) (20) * Sai lệch uˆ u ~ uˆ ( x) u * ( x) uT u ( x) u ( x) (21) (r ) m ~ với uT u u* sai số thông số ước lượng Do có sai số cấu trúc nên luật điều khiển có dạng sau [9] u uˆ u s (22) với us luật điều khiển trượt chọn cho hệ kín ổn định Từ (12) suy y ( r ) a ( x) b( x)u (t ) a( x) b( x)u * (t ) b( x) u (t ) u * (t ) (23) so sánh (14) (23), ta có: y ( r ) v(t ) b( x) u (t ) u * (t ) Sai số ngõ thiết lập (24) e ( r ) y m( r ) y ( r ) (25) Thay (24) vào (25) ~ e ( r ) es es buT u b u bu s Từ (26) ta có ~ es es buT u b u bu s Chọn hàm xác định dương ~T ~ e s u Qu u 2b b ~ V es e s es2 uT Quu b 2b ~ với , Qu ma trận xác định dương Thay (27) vào (29) V u V (26) (27) (28) (29) u es2 b ~T u es u s es u b Quu u e s e s2 2b (30) Dựa (Huỳnh Thái Hoàng, 2006) (30) luật cập nhật thông số thích nghi u Qu1 u es (31) 277 Tạp chí Khoa học 2010:15a 273-282 Trường Đại học Cần Thơ Thay (31) vào (30), ta có e b V s es u s es u es b 2b D es u s es u b2 es b 2b với b x D , Db hàm liên tục (Huỳnh Thái Hoàng, 2006) es2 (32) b Nếu chọn u s u Db e s Suy hệ kín , (32) trở thành V e sign ( e ) s s b 2b ổn định theo tiêu chuẩn Lyapunov Mạng RBFNN (Hình 2) giữ vai trò ước lượng hàm phi tuyến luật điều khiển cho hệ kín ổn định Ngõ vào mạng [ i ,i ]T, ngõ luật điều khiển thích nghi uce Trọng số cập nhật trực tuyến dựa (31) Hình 2: Mạng RBFNN i 1i 2i 9i T hàm sở Gauss, i 1i 2i 9i T thông số cập nhật Hàm sở Gauss thứ j định nghĩa sau: ( i c1 j ) (i c j ) j2 ji exp (33) với j 1,9 , độ rộng hàm sở Gauss chọn j =0.9 ckj ( k 1,2 ) tâm hàm sở 3.4 Bộ điều khiển trượt thích nghi dùng mô hình nơron mờ Bộ điều khiển trượt thích nghi dùng mô hình nơron mờ kết hợp điều khiển trượt mờ điều khiển trượt dùng mạng RBFNN Bộ điều khiển us (22) ước lượng trực tuyến logic mờ nhằm giảm dao động Và mạng RBFNN nhận dạng luật điều khiển dựa việc ước lượng hàm phi tuyến luật điều khiển cho hệ kín ổn định Sơ đồ mô tả điều khiển trượt thích nghi dùng mô hình nơron mờ trình bày (Hình 3) 278 Tạp chí Khoa học 2010:15a 273-282 Trường Đại học Cần Thơ Hình 3: Sơ đồ điều khiển trượt thích nghi dùng mô hình nơron mờ KẾT QUẢ MÔ PHỎNG Khi cho nhiễu d(t)=0.01*sin(0.06t) nhiễu ngẫu nhiên (có trung bình không, phương sai 0.01, giá trị ban đầu ngẫu nhiên) tác động lên hệ tay máy thông số đối tượng thay đổi sau: khối lượng khớp tăng 50% thời điểm 10s, khớp tăng 10% 20s khớp tăng 20% 40s Kết cho thấy, đáp ứng hệ tay máy dao động vọt lố, sai số xác lập tiến đến zero (xem Bảng 1) Độ phù hợp đáp ứng hệ tay máy tín hiệu chuẩn đạt 96% (Hình 4) Quỹ đạo pha tượng dao động quanh mặt trượt (hình 8) Có kết ước lượng trực tuyến luật điều khiển us sử dụng logic mờ (Hình 7) nhận dạng trực tuyến luật điều khiển dựa việc ước lượng hàm phi tuyến dùng mạng RBFNN (Hình 6) Luật điều khiển trượt thích nghi dùng mô hình nơron mờ trình bày hình Bảng 1: Thông số chất lượng đáp ứng hệ tay máy Khớp Overshoot Risetime Ess Khớp 3% ( Rad ) 5±3%(s) 0.68% Khớp 4% ( Rad ) 5±3%(s) 1.24% 4% ( Rad ) 5±3%(s) 1.32% Amplitude[Rad] The response of link1 tracking on desired reference signal with validate fitness 96.3775% Ref1 -2 1 50 100 150 200 250 Time [sec] Amplitude[Rad] The response of link2 tracking on desired reference signal with validate fitness 95.5114% Ref2 -2 2 50 100 150 200 250 Time [sec] Amplitude[Rad] The response of link3 tracking on desired reference signal with validate fitness 95.4282% Ref3 -2 3 50 100 150 200 250 Time [sec] Hình 4: Đáp ứng hệ tay máy 279 Tạp chí Khoa học 2010:15a 273-282 Trường Đại học Cần Thơ Control law of link1 50 u -50 50 100 150 200 250 200 250 200 250 Time [sec] Control law of link2 50 u -50 50 100 150 Time [sec] Control law of link3 50 u -50 50 100 150 Time [sec] Hình 5: Luật điều khiển u uˆ u s Control law using RBFNN of Link uhat 50 -50 50 100 150 200 250 Time[sec] Control law using RBFNN of Link uhat 20 -20 50 100 150 200 250 Time[sec] Control law using RBFNN of link uhat 10 -10 50 100 150 200 250 Time[sec] Hình 6: Luật điều khiển thích nghi nhận dạng mạng RBFNN Fuzzy sliding mode control law of Link us 50 -50 50 100 150 200 250 Time[sec] Fuzzy sliding mode control law of Link us 50 -50 50 100 150 200 250 Time[sec] Fuzzy sliding mode control law of link us 50 -50 50 100 150 200 250 Time[sec] Hình 7: Luật điều khiển trượt ước lượng logic mờ 280 Tạp chí Khoa học 2010:15a 273-282 Trường Đại học Cần Thơ Sliding function of link1 s1 -5 50 100 150 200 250 200 250 200 250 Time [sec] Sliding function of link2 s2 -2 50 100 150 Time [sec] Sliding function of link3 s3 -5 50 100 150 Time [sec] Hình 8: Mặt trượt hệ tay máy KẾT LUẬN Bộ điều khiển trượt thích nghi dùng mô hình nơron mờ thể tính thích nghi nhiễu thông số đối tượng thay đổi theo thời gian Trong điều khiển này, sử dụng logic mờ để ước lượng trực tuyến biên độ luật điều khiển nhằm hạn chế dao động Đồng thời sử dụng mạng RBFNN để nhận dạng luật điều khiển dựa việc ước lượng hàm phi tuyến nhằm đảm bảo cho hệ kín ổn định Với giải thuật điều khiển đề nghị, kết mô cho thấy, đáp ứng hệ tay máy dao động vọt lố 3% ( Rad ) , sai số xác lập xấp xỉ 1% TÀI LIỆU THAM KHẢO Nasser Sadati, Rasoul Ghadami and Mahdi Bagherpour, 2005 Adaptive Neural Network Multiple Models Sliding Mode Control of Robotic Manipulators Using Soft Switching; Proceeding of The IEEE Conference on tools with Artificial Intelligence, p431-438 M Önder Efe,, Okyay Kaynak and Bogdan M Wilamowski, 2000 Creating a Sliding Mode in a Motion Control System by Adopting a Dynamic Defuzzification Strategy in an Adaptive Neuro Fuzzy Inference System; The 26th Annual Confjerence of the IEEE on Industrial Electronics Society, vol.2, p894-899 M Önder Efe, Okyay Kaynak, Xinghuo Yu and Bogdan M Wilamowski, 2001 Sliding Mode Control of Nonlinear Systems Using Gaussian Radial Basis Function Neural Networks; IEEE transaction on Neural Networks, vol.1, p474-479 Wilfrid Perruquetti and Jean Pierre Barbot, 2002 Sliding mode control in engineering, Chapter 1: Overview of classical sliding mode control, Marcel Dekker, Inc Ayca Gokhan Ak, Galip Canserver, 2006 Adaptive neural network based fuzzy sliding mode control of robot manipulator; 2006 IEEE Conference on Cybernetics and Intelligent Systems, Bangkok, p1-6 Trần Quang Thuận, 2006 Điều khiển trượt dùng mạng nơron hàm sở xuyên tâm; Luận văn thạc sỹ ngành tự động hóa, Trường Đại Học Bách Khoa, trang 37-86 281 Tạp chí Khoa học 2010:15a 273-282 Trường Đại học Cần Thơ Xie Jian, Li Zushu, 2003 Dynamic Model and Motion Control Analysis of Three-Link Gymnastic Robot on Horizontal Bar; The proceeding of the 2003 IEEE International conference on Robotics, Intelligent systems, System and signal Processing Changsha, China, p83-87 Subashini Elangovan, Peng-Yung Woo, 2004 Adaptive Fuzzy Sliding Control for a ThreeLink Passive Robotic Manipulator; The proceeding of the 2004 IEEE American control conference, Vol.6, p5274-5279 Huỳnh Thái Hoàng, 2006 Hệ thống điều khiển thông minh; Đại Học Quốc Gia TPHCM, lần 1, trang 307-336 282 ... sở 3.4 Bộ điều khiển trượt thích nghi dùng mô hình nơron mờ Bộ điều khiển trượt thích nghi dùng mô hình nơron mờ kết hợp điều khiển trượt mờ điều khiển trượt dùng mạng RBFNN Bộ điều khiển us (22)... logic mờ nhằm giảm dao động Và mạng RBFNN nhận dạng luật điều khiển dựa việc ước lượng hàm phi tuyến luật điều khiển cho hệ kín ổn định Sơ đồ mô tả điều khiển trượt thích nghi dùng mô hình nơron mờ. .. Time [sec] Hình 8: Mặt trượt hệ tay máy KẾT LUẬN Bộ điều khiển trượt thích nghi dùng mô hình nơron mờ thể tính thích nghi nhiễu thông số đối tượng thay đổi theo thời gian Trong điều khiển này,