điều khiển trượt thích nghi hệ thống động phi tuyến

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang	27
Dung lượng	1,03 MB

Nội dung

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA NGUYỄN ĐỨC MINH ĐIỀU KHIỂN TRƯỢT THÍCH NGHI HỆ THỐNG ĐỘNG PHI TUYẾN Chuyên ngành: Tự Động Hóa Mã số: 50006101 TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT Tp. Hồ Chí Minh - Năm 2012 Công trình được hoàn thành tại: Trường Đại học Bách Khoa – ĐHQG-HCM Người hướng dẫn khoa học 1: PGS. TS DƯƠNG HOÀI NGHĨA S. TS Dương Hoài Nghĩa Người hướng dẫn khoa học 2: TS NGUYỄN ĐỨC THÀNH . Nguyễn Đức Thành Phản biện độc lập 1: GS.TSKH NGUYỄN XUÂN QUỲNH Phản biện độc lập 2: PGS.TS NGUYỄN NGỌC PHƯƠNG Phản biện 1: TS. NGUYỄN CHÍ NGÔN Phản biện 2: PGS.TSKH HỒ ĐẮC LỘC Phản biện 3: PGS.TS NGUYỄN TẤN TIẾN Luận án sẽ được bảo vệ trước hội đồng chấm luận án họp tại ……………………………………………………………………… ……………………………………………………………………… vào lúc giờ ngày tháng năm Có thể tìm hiểu luận án tại thư viện: - Thư viện Khoa học tổng hợp TP.HCM - Thư viện trường Đại học Bách Khoa – ĐHQG-HCM 1 TÓM LƯỢC NỘI DUNG LUẬN ÁN Luận án gồm 5 chương (93 trang). Tài liệu tham khảo 85. Các chương chính của luận án có nội dung tóm lược như sau: Chương một là chương tổng quan về điều khiển trượt, điều khiển trượt dùng mạng nơ-rôn, lý do, mục đích cũng như phương pháp nghiên cứu của luận án. Chương hai tổng hợp các kiến thức cơ sở về mạng nơ-rôn và lý thuyết điều khiển trượt, và một số mô hình điều khiển trượt dùng mạng nơ-rôn. Chương ba bao hàm nội dung chính của luận án. Trong chương này giới thiệu phương pháp điều khiển trượt thích nghi phân ly dùng mạng nơ-rôn DANSMC với đầy đủ mô hình và phương pháp huấn luyện mạng. Chương bốn mô tả ứng dụng phương pháp điều khiển trượt thích nghi phân ly được giới thiệu trong chương ba vào hai mô hình con lắc ngược hai bậc xoay tự do và con lắc ngược hai chiều là các mô hình phi tuyến cao, bất ổn và không cực tiểu pha cùng với các kết quả mô phỏng và thực nghiệm. Chương năm tổng kết lại sự khác biệt và các kết quả đạt được của các phương pháp nghiên cứu trong luận án so với các phương pháp nghiên cứu khác và nêu lên một số tồn tại cũng như một số đề xuất hướng nghiên cứu tiếp theo. TỔNG QUAN Điều khiển trượt Điều khiển trượt là một phương pháp điều khiển phi tuyến đơn giản hiệu quả. Để thiết kế thành phần điều khiển trượt cần phải biết rõ các thông số của mô hình đối tượng cũng như các chặn trên của các thành phần bất định của mô hình. Điều khiển trượt có dạng hàm dấu và có hiện tượng chattering các trạng thái xung quanh mặt trượt. Điều khiển trượt thích nghi dùng mạng nơ-rôn Một số các nghiên cứu đã sử dụng mạng nơ-rôn để thay thế thành phần điều khiển tương đương trong điều khiển trượt hoặc để bù cho các thành 2 phần bất định của hệ thống. Ưu điểm của các phương pháp này là không cần nhận dạng các thông số của mô hình khi thiết kế thành phần điều khiển tương đương. Hàm dấu trong thành phần điều khiển bền vững thường được thay thế bằng hàm bảo hòa để hạn chế hiện tượng chattering. Tuy nhiên các chặn trên dùng trong thiết kế thành phần điều khiển bền vững vẫn là các giá trị hằng được chọn trước, vì vậy chất lượng điều khiển vẫn phụ thuộc vào việc lựa chọn các giá trị hằng khi thiết kế thành phần điều khiển bền vững. Nhược điểm của các phương pháp này là phải có sự trả giá giữa chất lượng điều khiển và tính bền vững của hệ thống. Trong bối cảnh đó luận án tiến sĩ nghiên cứu phương pháp điều khiển trượt thích nghi dùng mạng nơ-rôn áp dụng cho hệ phi tuyến động bất định không rõ thông số mô hình với ba nội dung chính: • Kết hợp lý thuyết điều khiển trượt và mạng nơ-rôn để thiết kế bộ điều khiển trượt thích nghi dùng mạng nơ-rôn áp dụng cho hệ thống phi tuyến động bất định không rõ thông số mô hình. Bộ điều khiển mới có các đặc điểm: (i) là một mạng nơ-rôn được dùng làm bộ điều khiển trực tiếp; (ii) không cần nhận dạng trước các thông số của mô hình đối tượng, luật điều khiển được suy ra trực tiếp trong quá trình huấn luyện trực tuyến; (iii) có khả năng thích nghi trước sự thay đổi của các chặn trên của các thành phần bất định và có khả năng kháng nhiễu tốt. • Phát triển bộ điều khiển trượt thích nghi nêu trên thành bộ điều khiển trượt thích nghi phân ly DANSMC cho hệ phi tuyến đa biến. • Áp dụng các nghiên cứu về điều khiển trượt thích nghi phân ly lên hệ con lắc ngược xoay và con lắc ngược hai chiều thông qua mô phỏng và thực nghiệm. CHƯƠNG 2: CƠ SỞ LÝ THUYẾT 2.1 MẠNG NƠ-RÔN Mạng một lớp ẩn SHL (Single Hidden Layer) 3 Mạng hai lớp với lớp ngõ ra có hàm tác động là hàm dốc còn được gọi là mạng một lớp ẩn SHL. Biểu diễn vào ra của mạng SHL 0 0 1 1 l n i ik h kj j k i k j u w v x v w σ = =   = + +     ∑ ∑ (2.20) 2.2 LÝ THUYẾT ĐIỀU KHIỂN TRƯỢT 2.2.1 ĐỐI TƯỢNG ĐIỀU KHIỂN Xét hệ thống phi tuyến biểu diễn bởi phương trình vi phân duyygyyfy nnn ++= −− ).,.,.,,(),.,.,( )1()1()( (2.46) Trong đó d là nhiễu Đặt )1( 321 ,,, − ==== n n yxyxyxyx &&& (2.47 ) và T n xxxx ] ,,[ 21 = ta được biểu diễn trạng thái :          ++= = = = − duxgxfx xx xx xx n nx ).()( 1 32 21 & & M & & (2.48) 1 xy = Bài toán điều khiển được đặt ra là xác định tín hiệu điều khiển u sao cho tín hiệu ra y bám theo tín hiệu đặt r. 2.2.2 MẶT TRƯỢT Định nghĩa tín hiệu sai lệch r y e − = (2.49) và tín hiệu s ecececes n n n 12 )2( 1 )1( ++++= − − − & (2.50) 4 Trong đó c 1 , , c n-1 , là các hệ số được chọn trước sao cho đa thức đặc trưng của phương trình vi phân sau Hurwitz (có tất cả các nghiệm với phần thực âm) 0 12 )2( 1 )1( =++++ − − − ececece n n n & (2.51) Khi đó các nghiệm của phương trình đặc trưng của (2.2.6) đều nằm bên trái mặt phẳng phức, nên e(t) sẽ tiến tới 0 khi t tiến tới ∞. Phương trình s=0 xác định một mặt cong S trong không gian n chiều gọi là mặt trượt (sliding surface) S. Vấn đề đặt ra là xác định luật điều khiển u để đưa các quỹ đạo pha của hệ thống về mặt trượt và duy trì trên mặt trượt một cách bền vững đối với các biến động của )(xf và )(xg . 2.2.3 LUẬT ĐIỀU KHIỂN TRƯỢT KINH ĐIỂN Luật điều khiển trượt cổ điển: ( ) )( 12 )1( 1 )( )( )( 1 nn n rdssignkecececxf xg u +−+++++−= − − &&& (2.56) Luật điều khiển trượt có tính đến các thành phần bất định Trong thực tế luật điều khiển trượt cần tính tới các thành phần bất định như nhiễu hệ thống cũng sự biến thiên theo thời gian của )(xf và )(xg . Gọi ),( txf ∆ , ),( txg ∆ là các thành phần bất định của hệ thống Luật điều khiển trượt có tính đến các thành phần bất định như sau: correctiveequivalent uuu += (2.66) Trong đó: )()).(().( 0 ssignxgsignxu equivalent δ −= là thành phần điều khiển phụ thuộc vào mô hình danh định của hệ thống còn gọi là thành phần điều khiển tương đương. )()).((),.( max ssignxgsigntxu corrective δ −= là thành phần điều khiển bền vững, còn gọi là thành phần điều khiển hiệu chỉnh có tác dụng bù cho các thành phần bất định của hệ thống và có giá trị phụ thuộc vào các chặn trên 5 của các thành phần bất định của hệ thống. Thường thì max δ được chọn bằng một hệ số dương k với ( ) ( ) Df gxg k x +∆ ∆+ = max min0 )( 1 sup (2.67) 2.2.4 ĐIỀU KHIỂN TRƯỢT CHO HỆ THỐNG MIMO Xét một hệ thống phi tuyến MIMO ( ) ( ) x = f x + g x .u & (2.68) ( ) y h x = Luật điều khiển trượt cho hệ MIMO ( ) ( ) ( ) 1 ( 1) ( ) ( 1) 1 1 . ( ) m m m g f f m u L L h L h c e c e k diag sign s − − − − = − + + + + & (2.77) 2.2.5 ĐẶC ĐIỂM CỦA ĐIỀU KHIỂN TRƯỢT Từ mục 2.2.3 cho thấy để tính toán thành phần điều khiển tương đương của điều khiển trượt đòi hỏi phải biết đầy đủ các hàm danh định của đ ối tượng, và để tính toán thành phần điều khiển bền vững cần phải biết các chặn trên của hệ thống và nhiễu. Hàm dấu trong thành phần điều khiển của điều khiển trượt cổ điển tạo nên hiện tượng đảo cực trong tín hiệu điều khiển cộng với hiện tượng trễ vật lý của các đối tượng được điều khiển tạo nên hiện tượng chattering (dao động của các quỹ đạo pha xung quanh mặt trượt). 2.3 MỘT SỐ MÔ HÌNH ĐIỀU KHIỂN TRƯỢT DÙNG MẠNG NƠ- RÔN 2.3.1 MÔ HÌNH SỬ DỤNG MẠNG NƠ-RÔN LÀM THÀNH PHẦN ĐIỀU KHIỂN TƯƠNG ĐƯƠNG Trong mô hình điều khiển trượt dạng này tín hiệu điều khiển trượt được phân chia như sau: 6 - Ở vùng xa mặt trượt thành phần điều khiển hiệu chỉnh được sử dụng để hướng các trạng thái tiến về mặt trượt )()).((. ssignxgsignku corrective −= (2.78) Với k được tính theo công thức 2.67 - Ở lân cận mặt trượt thành phần điều khiển tương đương được thay thế bằng một mạng hai lớp như mô tả ở mục 2.1 dùng để điều khiển các trạng thái bám trên mặt trượt. Ngõ vào của mạng chính là tín hiệu mặt trượt s. Các trọng số của mạng được cập nhật thích nghi trực tuyến. Mục tiêu của luật cập nhật thích nghi là cực tiểu hóa hàm năng lượng của mặt trượt (2.60). Luật cập nhật mạng dựa trên phương pháp gradient descent được triển khai theo công thức : ij ij w V w ∂ ∂ −=∆ η . (2.79) Triển khai luật cập nhật cho các trọng số của lớp ngoài cùng : ( ) jj uxsw oij .' ση −=∆ (2.80) Trong đó η là hằng số học, o σ là hàm tác động ngõ ra, j u là ngõ ra thứ j của mạng. Các trọng số của lớp giữa của mạng thì được cập nhật dựa trên thuật toán lan truyền ngược. 2.3.2 MÔ HÌNH ĐIỀU KHIỂN TRƯỢT PHÂN LY DÙNG MẠNG NƠ-RÔN Năm 2007 Lon-Chen Hung và Hung Yuan Chung ở khoa kỹ thuật điện tử đại học quốc gia Đài Loan đã giới thiệu kỹ thuật điều khiển trượt phân ly dùng mạng nơ-rôn DNNSMC (Decoupled Nơ-rôn Network Sliding Mode Control) cho các hệ thống phi tuyến bậc bốn. Tính hiệu quả của bộ điều khiển đã được kiểm chứng thông qua việc mô phỏng trên nhiều đối tượng có tính phi tuyến cao như con lắc đơn, con lắc đôi, hệ cầu banh, Mô tả hệ thống 7 Xét một hệ thống bậc bốn có dạng như sau 22224 43 11112 21 ).()( ).()( duxgxfx xx duxgxfx xx ++= = ++= = & & & & (2.81) Trong đó [ ] T xxxxx 4321 = là vector trạng thái, 1 f , 2 f , và 1 g , 2 g là các hàm phi tuyến, 1 u , 2 u là các ngõ vào điều khiển và 1 d , 2 d là nhiễu bên ngoài. Các nhiễu được giả thiết là bị chặn: 11 Dd ≤ , 22 Dd ≤ Định nghĩa tín hiệu mặt trượt thứ nhất ( ) [ ] [ ] zcxczcxxcxzxcs T T 11212112111 1 −=−=+−= (2.82) Định nghĩa tín hiệu mặt trượt thứ hai 4322 xxcs += (2.83) Trong thiết kế bộ điều khiển trượt phân ly, điều khiển tương đương có nhiệm vụ duy trì các trạng thái trên mặt trượt. Điều khiển tương đương có thể đạt được bằng cách chọn 0 1 =s & . ( ) 1111212111 . dugfzcxcxzxcs + + + − = + − = & & & && (2.84) Ngõ vào điều khiển trượt phân ly được chọn với hàm Lyapunov như sau: 2 1 2 1 sV = (2.85) Lấy đạo hàm (2.85) ta có ( ) 111121111 . dugfzcxcsssV +++−== & & & (2.86) Từ (2.86) suy ra luật điều khiển trượt bao gồm cả thành phần điều khiển tương đương và điều khiển bền vững trước nhiễu 1 . eq s u u M sign ϕ   = −     trong đó 11 / gDM > (2.87) Vì hàm dấu của công thức (2.87) gây nên hiện tượng chattering nên được thay thế bằng hàm bão hòa trong (2.88) ( ) 1 . ssatMuu eq −= (2.88) Như vậy trong chuyển động trượt, tín hiệu điều khiển tương đương sẽ là 8 ( ) 111121 1 1 kssfzcxc g u eq ++−+−= & & (2.89) Trong đó k là hằng số dương. Mục đích của đ iều khiển là lái các trạng thái hệ thống về điểm cân bằng gốc. Các biến 1 s , 2 s cùng suy giảm thông qua biến tạm thời z. Phương trình (2.82) chỉ ra rằng mục đích điều khiển của 1 u được thay đổi từ 0 1 =x , 0 2 =x thành zx = 1 , 0 2 =x (Lo & Kuo, 1998). Biến tạm thời z có thể được định nghĩa 2 . upper z s z sat z ϕ   =     , 10 << upper z (2.90) Trong đ ó z φ là h ệ s ố để đ i ề u ch ỉ nh độ tr ơ n c ủ a z . Hàm ( ) ⋅sat đượ c đị nh ngh ĩ a ( ) ( )    < ≥ = 1 1 ϕϕ ϕϕ ϕ if ifsign sat (2.91) Thi ế t k ế b ộ đ i ề u khi ể n tr ượ t phân ly dùng m ạ ng n ơ -rôn DNNSMC 2 s 1 s 1 x 2 x 3 x 4 x y u Hình 2.13 H ệ th ố ng DNNSMC c ủ a Lon-Chen Hung và Hung Yuan Chung M ộ t m ạ ng n ơ -rôn SHL nh ư mô t ả ở m ụ c 2.1.2 đượ c dùng để thay th ế thành ph ầ n đ i ề u khi ể n t ươ ng đươ ng (2.89) v ớ i ngõ vào là tín hi ệ u m ặ t tr ượ t 1 s . Trong đ ó hàm tác độ ng l ớ p ẩ n có d ạ ng [...]... hi u ch nh đư c đ ngh đ ư c lư ng E là & E = γ 3 s∆ (2.96) (2.97) CHƯƠNG BA: ĐI U KHI N TRƯ T THÍCH NGHI PHÂN LY DÙNG M NG NƠ-RÔN Chương này s gi i thi u m t b đi u khi n trư t thích nghi phân ly m i DANSMC (Decoupled Adaptive Neural Sliding Mode Control) áp d ng đư c cho các h th ng phi tuy n đa bi n Các nghi n c u đư c trình bày trong chương này đã đư c công b trên các bài báo [1], [2],[3] (M c các... khi n u, lu t c p nh t thích nghi đ hu n luy n m ng là các lu t (3.22) và (3.23) v i s = s 2 Mô hình đi u khi n trư t thích nghi phân ly cho như hình 3.2 13 d / dt d / dt 4 x3 x x 1 x2 & s2 z x uN & x1 = x2 & x2 = f1 ( x ) + g1 ( x` ).u & x3 = x4 & x4 = f 2 ( x) + g 2 ( x).u x3 x1 (3.38) c2 > 0 s 2 = c 2 ( x3 − z ) + x 4 , s2 d / dt s1 Hình 3.2 Mô hình đi u khi n trư t thích nghi phân ly Đ nh nghĩa... pháp nghi n c u tương t không ch có th đư c phát tri n đi u khi n trư t thích nghi phân ly trên m ng truy n th ng m t l p n th ng mà còn có th áp d ng cho các lo i m ng khác như m ng RBF và m ng nơ-rôn m Vi c nghi n c u áp d ng m ng nơ-rôn m làm b đi u khi n s giúp làm gi m th i gian hu n luy n và hi u qu hơn đ i v i m t s các đ i tư ng th c 24 D a trên cơ s c a lý thuy t đi u khi n trư t thích nghi. .. đi u khi n trư t thích nghi phân ly đư c vi t b ng ngôn ng C trên n n ph n m m máy tính CSS Các k t qu đi u khi n có th đư c th hi n l i dư i d ng đ h a T n s l y m u c a b đi u khi n đư c cài đ t c a b đi u đ ng xung đư c cài đ t t n s 0.5 KHz, và t n s t n s g p năm l n t n s l y m u Hình 4.17 Mô hình th c con l c ngư c trong phòng thí nghi m Các k t qu th c nghi m Con l c th c nghi m (hình 4.17),... kh năng h c thích nghi c a các phương pháp đi u khi n thông minh đ ti n t i hình thành các b đi u khi n thích nghi b n v ng mà không c n bi t đ y đ tính ch t c a đ i tư ng Các phương pháp dùng m ng nơ-rôn hay nơ-rôn m đ nh n d ng đ i tư ng sau đó áp d ng k t qu nh n d ng đ th c hi n vào lý thuy t thuy t đi u khi n d a trên mô hình r t khó có th th chi n trên các đ i tư ng th c có tính phi tuy n cao... ng, và thư ng ph i có b đi u khi n thích nghi đ bù cho các sai s này Nguyên lý c a phương pháp đi u khi n trư t dùng m ng nơ-rôn đư c gi i thi u trong các tài li u [2]-[22] đã cho phép thay th thành ph n đi u khi n tương đương trong đi u khi n trư t c đi n b ng m t m ng nơ-rôn hai l p v i các lu t c p nh t thích nghi đơn gi n, mà không c n ph i nh n d ng trư c các hàm phi tuy n c a đ i tư ng Tuy nhiên... hình thành lu t đi u khi n và ch t lư ng đi u khi n tăng d n sau nhi u phi n hu n luy n Hình 4.13 Qu đ o pha các bi n tr ng thái c a đi u khi n DANSMC Mô hình th c nghi m Mô hình k t c u cơ khí con l c như hình 4.17 v i cánh tay con l c có chi u dài 30cm có th g n lên nó các con l c khác nhau qua kh p n i đ th 17 nghi m kh năng thích nghi c a b đi u khi n khi thông s mô hình thay đ i Cánh tay con l c... m t trư t, m ng nơ ron c a b đi u khi n DANSMC là ngõ vào tr ng thái còn tín hi u h i ti p bao g m c tín hi u m t trư t và đ o hàm c a nó B đi u khi n trư t thích nghi phân ly DANSMC đư c đ ngh đã đư c ch ng minh là có kh năng t hu n luy n thích nghi đ h c đư c các lu t đi u khi n trư t (3.8) phù h p v i các thông s bi n đ ng c a đ i tư ng và nh hư ng c a nhi u, cũng như kh năng kh c ph c đư c hi n... n c a h th ng qua t ng phi n đi u khi n - Lý thuy t và mô ph ng cũng đã cho th y kh năng t thay đ i đ thích nghi c a b đi u khi n DANSMC trư c s thay đ i c a các thông s c a đ i tư ng cũng như các ch n trên c a các thành ph n b t đ nh - Mô hình đi u khi n phân ly đư c đ ngh trong lu n án đã đư c ch ng minh là có kh năng đáp ng yêu c u đi u khi n ngay c đ i v i các đ i tư ng phi tuy n và có tri n v... ng cho nhi u đ i tư ng phi tuy n đa bi n ph c t p khác - Các nghi n c u v lý thuy t đã minh ch ng v i các ng d ng c th lên các đ i tư ng có tính phi tuy n cao và ph c t p như con l c ngư c hai b c xoay t do và con l c ngư c hai chi u Trong các mô hình đi u khi n t đ ng hi n nay, các h th ng có k t c u cơ khí d ng di chuy n ngang trên hai tr c (như CNC) có d ng gi ng như thí nghi m trên con l c ngư . lý thuyết điều khiển trượt và mạng nơ-rôn để thiết kế bộ điều khiển trượt thích nghi dùng mạng nơ-rôn áp dụng cho hệ thống phi tuyến động bất định không rõ thông số mô hình. Bộ điều khiển mới. chất lượng điều khiển và tính bền vững của hệ thống. Trong bối cảnh đó luận án tiến sĩ nghi n cứu phương pháp điều khiển trượt thích nghi dùng mạng nơ-rôn áp dụng cho hệ phi tuyến động bất định. đề xuất hướng nghi n cứu tiếp theo. TỔNG QUAN Điều khiển trượt Điều khiển trượt là một phương pháp điều khiển phi tuyến đơn giản hiệu quả. Để thiết kế thành phần điều khiển trượt cần phải

Ngày đăng: 10/05/2014, 21:58

Xem thêm