Giới thiệu về điều khiển trượt 2 Chương 2 : Mạng nơron nhân tạo 2.2 Mạng Perception một lớp single-layer perceptron networks 15 2.4 Mạng hồi quy recurrent neural networks, feedback n
Trang 1TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT Tp HCM
*****
ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CẤP TRƯỜNG
TÊN ĐỀ TÀI:
ĐIỂU KHIỂN TRƯỢT HỆ BỒN NƯỚC ĐƠI
MÃ SỐ: T2009 – 79
Thuộc nhĩm ngành: KHOA HỌC KỸ THUẬT
Chủ nhiệm đề tài: KS NGUYỄN THỊ NGỌC THẢO Người tham gia đề tài: THS PHÙ THỊ NGỌC HIẾU
Đơn vị: KHOA ĐIỆN-ĐIỆN TỬ
THÀNH PHỐ HỒ CHÍ MINH 07/ 2010
Trang 3A
PHẦN GIỚI THIỆU
Trang 4MỤC LỤC
A Phần giới thiệu
- Mục lục
- Tóm tắt kết quả nghiên cứu
- Tính cấp thiết của đề tài
- Mục tiêu nghiên cứu
- Phạm vi nghiên cứu
- Nội dung nghiên cứu
B Phần nội dung
Chương 1 : Cơ sở lý thuyết điều khiển trượt
1.1 Giới thiệu về điều khiển trượt 2
Chương 2 : Mạng nơron nhân tạo
2.2 Mạng Perception một lớp (single-layer perceptron networks) 15
2.4 Mạng hồi quy (recurrent neural networks, feedback networks) 25
Chương 3 : Kkhảo sát đối tượng bồn nước
3.1 Những cấu hình khác nhau của hệ bồn nước 38
3.2 Xây dựng phương trình toán cho đối tượng 40
Chương 4 : Xây dựng bộ điều khiển trượt cho hệ bồn nước
Trang 5điều khiển trượt cho hệ bồn nước
TĨM TẮT KẾT QUẢ NGHIÊN CỨU
ĐỀ TÀI KHOA HỌC VÀ CƠNG NGHỆ CẤP TRƯỜNG
Tên đề tài: Điều khiển trượt hệ bồn nước đơi
Mã số: T2009 - 79
Chủ nhiệm đề tài: Ks Nguyễn Thị Ngọc Thảo Tel.: 0909387648
Trang 6Cơ quan chủ trì đề tài: Trường Đại học sư phạm kỹ thuật Tp.HCM
Cơ quan và cá nhân phối hợp thực hiện: Ths Phù Thị Ngọc Hiếu
Thời gian thực hiện: 08 tháng
1 Mục tiêu:
- Nghiên cứu điều khiển trượt
- Xây dựng mô hình mô phỏng hệ bồn nước đôi trên Matlab
- Áp dụng phương pháp điều khiển trượt điều khiển mực nước của hệ bồn nước đôi
2 Nội dung chính:
- Phương pháp điều khiển trượt
- Mạng Nơron
- Hệ bồn nước đôi và xây dựng mô hình mô phỏng cho hệ bồn nước đôi
- Thực hiện mô phỏng điều khiển mực nước hệ bồn nước đôi bằng phương pháp điều khiển trượt
- Ứng dụng mạng Nơron để xấp xỉ luật điều khiển u trong phương pháp điều khiển trượt và mô phỏng kết quả bằng Matlab
3 Kết quả chính đạt đƣợc (khoa học, ứng dụng, đào tạo, kinh tế – xã hội, v.v
Sử dụng làm tài liệu tham khảo cho lĩnh vực điều khiển tự động, môn học Điều Khiển Đa Biến hay Điều Khiển Phi Tuyến
4 Điểm mới
- Xây dựng mô hình mô phỏng bằng Matlab cho hệ bồn nước đôi
- Ứng dụng phương pháp điều khiển trượt để điều khiển bồn nước đôi
và mô phỏng kết quả điều khiển bằng Matlab
- Ứng dụng mạng Nơron để xấp xỉ một hàm
5 Địa chỉ ứng dụng
Tài liệu tham khảo cho sinh viên, học viên cao học và những nhà nghiên cứu liên quan đến lĩnh vực điều khiển tự động
Trang 7sự chú ý của nhiều nhà khoa học vì ưu điểm của nó là mang lại sự ổn định bền vững cho hệ thống phi tuyến cho dù hệ thống đó có nhiễu hoặc có một vài thông số thay đổi theo thời gian Và từ đó cho đến nay, lý thuyết về điều khiển trượt đã được được phát triển một cách đáng kể bởi các nhà nghiên cứu
Thêm vào đó, điều khiển trượt cho ta các luật điều khiển hiệu quả đối với các đối tượng tuyến tính và không tuyến tính Một đặc trưng phân biệt khác là khả năng giảm bậc của nó có thể làm đơn giản thiết kế và có thể phân tách hệ thống Với những ưu điểm này, điều khiển trượt là một lãnh vực đầy hứa hẹn về nghiên cứu lý thuyết cũng như các vấn đề ứng dụng vào các đối tượng cụ thể Vì thế đề tài
“Điều khiển trượt hệ bồn nước đơi” mang tính cấp thiết và thực tiễn cao trong thời
gian hiện nay
MỤC TIÊU NGHIÊN CỨU
- Nghiên cứu điều khiển trượt
- Xây dựng mơ hình mơ phỏng hệ bồn nước đơi trên Matlab
- Áp dụng phương pháp điều khiển trượt điều khiển mực nước của hệ bồn nước đơi
PHƯƠNG PHÁP NGHIÊN CỨU
- Phương pháp tham khảo tài liệu
- Xây dựng mơ hình mơ phỏng và thực hiện mơ phỏng kết quả nghiên cứu trên phần mềm Matlab
PHẠM VI NGHIÊN CỨU
- Nghiên cứu điều khiển trượt và cách xây dựng một bộ điều khiển trượt
- Nghiên cứu về đối tượng bồn nước đôi
Trang 8- Áp dụng thuật toán điều khiển trượt để điều khiển giữ vững mực nước của bồn nước đôi
- Nghiên cứu về mạng Nơron và cách xấp xỉ bộ điều khiển trượt bằng mạng Nơron
- Aùp dụng mạng Nơron đã xấp xỉ để điều khiển mô hình bồn nước đôi (thực hiện mô phỏng)
NỘI DUNG NGHIÊN CỨU
- Phương pháp điều khiển trượt
- Mạng Nơron
- Hệ bồn nước đơi và xây dựng mơ hình mơ phỏng cho hệ bồn nước đơi
- Thực hiện mơ phỏng điều khiển mực nước hệ bồn nước đơi bằng phương pháp điều khiển trượt
- Ứng dụng mạng Nơron để xấp xỉ luật điều khiển u trong phương pháp điều khiển trượt và mơ phỏng kết quả bằng Matlab
Phần Phụ Lục :
TÀI LIỆU THAM KHẢO
Trang 9Khoa TP.HCM, nhà xuất bản : Đại Học Quốc Gia Thành Phố Hồ Chí Minh
[2] Sliding Mode Control in Engineering (Control Engineering Series, 11) (Hardcover)
by Wilfrid Perruquetti (Author)
[3] TS Dương Hoài Nghĩa, “Bài giảng mạng Nơron nhân tạo”, năm 2009
[4] Sliding Mode Control of Nonlinear Systems Using Gaussian Radial Basis
function Neural Networks - M Ưnder Efe, Okyay Kaynak, Xinghuo Yu
[5] Process Modelling, Identification, and Control 2007 , Ján Mikleš ·Miroslav
Fikar
[6] Jinzhu Peng, Yaonan Wang, Wei Sun and Yan Liu: A Neural network Sliding
Mode Controller with Application to Robotic Manipulator
[7] Shuanghe Yu*, Xinghuo Yu**, Mehmet Ưnder Efe*** với đề tài Modeling-Error
Based Adaptive Fuzzy Sliding Mode Control for Trajectory-Tracking of Nonlinear Systems
[8] Q P Ha, Member, IEEE, H Trinh, H T Nguyen, Senior Member, IEEE, and H D
Tuan, Member : Dynamic Output Feedback Sliding-Mode Control Using Pole
Placement and Linear Functional Observers
[9] F Qiao Q M Zhu, A Winfield and C Melhuish : Design of Takagi-Sugeno
fuzzy model based sliding mode controllers for nonlinear systems
[10] J´an Vittek, Stephen J Dodds, Peter Briˇs, Marek ˇStulrajter, Pavol Makyˇs :
Experimental Verification Of Chattering Free Sliding Mode Control Of The Drive Position Employing PMSM
[11] Don Krupp – Guidance and Control Division – Marshall Space Flight Center :
Chattering-free Sliding Mode Control with Unmodeled Dynamics
[12] Jingchuan Li, M.S.E.E : Adaptive Sliding Mode Observer And Loss
Minimization For Sensorless Field Orientation Control Of Induction Machine
[13] Abdul Rashid Husain, Mohamad Noh Ahmad, and Abdul Halim Mohd Yatim :
Chattering-free Sliding Mode Control for an Active Magnetic Bearing System
Trang 10Double Fed Asynchronous Machine Applayed by Current Sources
[15] Rafael Ramos, Domingo Biel, Francesc Guinjoan, Enric Fossas : Master-Slave
Sliding-Mode Control Design in Parallel-Connected Inverters
[16] M R Rafimanzelat and M J Yazdanpanah : A Novel Low Chattering Sliding
Mode Controller
[17] Kevin J Walchko, David Novick, and Michael C Nechyba - University of
Florida, Gainesville, FL, 32611-6200 : Development of a Sliding Mode Control
System with Extended Kalman Filter Estimation for Subjugator
[18] Jiunshian Phuah Student Member, Jianming Lu Member, Takashi Yahagi
Non-member: Chattering Free Sliding Mode Control in Magnetic Levitation System [19] Cem Ünsal and Pushkin Kachroo : Sliding Mode Measurement Feedback
Control for Antilock Braking Systems
[20] Halim Alwi B.Eng., Leicester : Fault Tolerant Sliding Mode Control Schemes
With Aerospace Applications
[21] Dr K B Mohanty, Member, Department of Electrical Engineering, National
Institute of Technology, Rourkela, India : A Fuzzy Sliding Mode Controller for a
Field-Oriented Induction Motor Drive
[22] Mustafa Resa Becan : Sliding Mode Control with Fuzzy Boundary Layer to
Air-Air Interception Problem
[23] Muhammad Yasser, Hiroo Sekiya, Takashi Yahagi, Ayman Haggag, Mohamed Ghoneim, and Jianming Lu Graduate School of Science and Technology Chiba
University : Adaptive Sliding Mode Control with Simple Adaptive Control for
Buck Converters
[24] Asif ˇSabanoviˇc, TUBITAK - Marmara Research Center : Chattering Free
Sliding Modes in Robotic Manipulators Control
[25] M S Srai1, H Sindano2, N E Gough3 and A C Cole4,1 : Sliding Mode Idle Speed
Trang 11and observability singularity in chaotic synchronization
[27] Mohammad S Islam, Iqbal Husain, Robert J Veillette, and Celal Batur : Design
and Performance Analysis of Sliding-Mode Observers for Sensorless
Operation of Switched Reluctance Motors
[28] N F AL-MUTHAIRI AND M ZRIBI : Sliding Mode Control Of A Magnetic
Levitation System
[29] Wen Yu : Sliding Mode Technique and Sliding Mode Observer
[30] A.S LEWIS a’*, A SINHAb and K.W WANGb : Sliding Mode Output
Feedback Control of a Flexible Rotor Supported by Magnetic Bearings
[31] Roy A McCann, Mohammad S Islam, Student Member, IEEE, and Iqbal Husain,
Senior Member, IEEE : Application of a Sliding-Mode Observer for Position and
Speed Estimation in Switched Reluctance Motor Drives
[32] A.B Potapov¤and M.K Aliy : Nonlinear dynamics and chaos in information
processing neural networks
[33] Michael C Nechyba and Yangsheng Xu : Neural Network Approach to Control
System Identification with Variable Activation Functions
[34] “Sliding mode control using radial basis function neural networks (Điều
khiển trƣợt dùng mạng Nơron hàm cơ sở xuyên tâm)” - Tran Quang Thuan,
Lecturer, PTIT-HCM, Duong Hoai Nghia, Lecturer, HCM City University of Technology, and Dong Si Thien Chau, Lecturer, Ton Duc Thang University
Trang 12B
PHẦN NỘI DUNG
Trang 13Chương 1 : CƠ SỞ LÝ THUYẾT
ĐIỀU KHIỂN TRƯỢT 1.1 Giới thiệu về điều khiển trượt :
Điều khiển trượt của hệ thống động đã có một lịch sử lâu dài về mặt lý thuyết và có nhiều sự phát triển trên thực tế Trong lý thuyết điều khiển, điều khiển trượt là một dạng của điều khiển cấu trúc biến đổi Đây là một phương pháp điều khiển phi tuyến làm thay đổi động học của hệ thống phi tuyến bằng cách áp dụng vào đó một phương pháp điều khiển chuyển đổi với một tần số cao Luật điều khiển hồi tiếp trạng thái không là một hàm liên tục theo thời gian Thay vào đó, nó chuyển đổi từ một cấu trúc liên tục sang một dạng khác dựa trên vị trí hiện tại của không gian trạng thái Do đó, điều khiển trượt là một phương pháp điều khiển cấu trúc biến đổi Các cấu trúc điều khiển đa dạng được thiết kế sao cho các quỹ đạo luôn tiến về trạng thái chuyển đổi, và vì thế quỹ đạo sau cùng sẽ không hoàn toàn tồn tại trong một cấu trúc điều khiển Thay vào đó, quỹ đạo sau cùng sẽ trượt dọc trên các biên giới của các cấu trúc điều khiển Chuyển động của hệ thống dọc theo các biên giới như vậy được gọi là chế độ trượt Và quỹ tích hình học chứa các giới hạn được gọi là mặt trượt Hình 2.1 dưới đây sẽ cho ta thấy một quỹ đạo của hệ thống trong điều khiển trượt
Hình 1.1
Trang 14Nói tóm lại, chế độ trượt là chuyển động của quỹ đạo pha của hệ thống dọc theo một đường thẳng/mặt phẳng/bề mặt của không gian trạng thái đã được chọn trước đó Điều khiển trượt là thiết kế bộ điều khiển nhằm đưa quỹ đạo pha của hệ thống về mặt trượt đã chọn và duy trì trên mặt trượt này một cách bền vững
Các hệ thống cần điều khiển trên thực tế có thể có mô hình không chính xác Sự không chính xác đó có thể đến từ các giá trị không xác định được trong thực tế về đối tượng (ví dụ như là các thông số của đối tượng mà ta chưa biết), hoặc là từ việc ta biểu diễn động học của hệ thống theo dạng đã đơn giản hóa (ví dụ như là mô hình hóa lực ma sát như là dạng tuyến tính, v.v…) Tuy nhiên, để thiết kế được bộ điều khiển trượt, thì điều quan trọng là phải xác định được mô hình chính xác của đối tượng điều khiển Để giải quyết vấn đề này, ta có thể áp dụng các phương pháp nhận dạng đối tượng : dùng mạng nơron, dùng mạng mờ, v.v…
1.2 Phương pháp điều khiển trượt :
1.2.1 Điều khiển trượt bám:
Xét hệ thống phi tuyến có dạng :
x x
x
n n
x x
Xem như f(x) và b(x) là bất định
Vấn đề điều khiển : là xác định một luật điều khiển mà nó giải quyết vấn
đề bám theo điểm đặt và cũng bền vững với những sự bất định trong f(x) và b(x)
Định nghĩa xd là điểm đặt và x~ là sự khác biệt giữa x và xd (còn gọi là tín
Trang 15
d
d d d d
x x x
x x x x
Nếu ta có thể giới hạn động học của hệ thống trên một bề mặt biết rõ, khi đó vấn đề điều khiển sẽ trở nên vô cùng đơn giản Bề mặt đó được gọi là mặt trượt và nó được định nghĩa sao cho các sai số động học ổn định theo hàm mũ khi hệ thống được giới hạn nằm trên mặt trượt này
Vấn đề điều khiển khi đó sẽ trở thành vấn đề lái hệ thống đến mặt trượt, và sau đó giữ cho nó luôn ở trên mặt trượt này
Định nghĩa mặt trượt S(t) như sau :
d t x s
Trên mặt trượt này, sai số sẽ tiến về 0 theo hàm mũ
Điều này ngụ ý rằng nếu tồn tại một ngõ vào điều khiển u(t) sao cho x(t) nằm trong S(t) thì nó sẽ có x(T) nằm trong S(T) với mọi T > t và sai số sẽ hội tụ về
0 theo hàm mũ với ngõ vào điều khiển này
Nhận xét : Việc chọn hàm s(x,t) có phần tùy ý Ta có thể chọn bất cứ sai số
động học nào mà dẫn đến hoạt động ổn định theo hàm mũ :
x
dt
d p t x
Trang 16Trong đó p(s) là một đa thức có tất cả zero nằm bên nửa trái mặt phẳng phức, khi đó sai số động học sẽ hội tụ theo hàm mũ Ví dụ, ta có thể có :
Trong đó x là vô hướng Đặt f x,x là một hàm bất định, trong đó chỉ có và ước lượng phương trình trạng thái thật fˆ x,x là đã biết, và do đó sai số có thể được chặn :
x x f x x F x x x x
Định nghĩa mặt trượt :
2,
d x x s
x x x
s d ~ , d ~ (1.11) Chọn :
x x x x f
uˆ ˆ , d ˆ, f fˆ và s 0 (1.12) Và định nghĩa luật điều khiển :
s k
u
Ta xem s(x,t) như là phép đo khoảng cách từ hệ thống đến mặt trượt Để giữ
Trang 17Để chứng minh sự hội tụ về mặt trượt, xét đạo hàm của khoảng cách của một
điểm xác định từ mặt trượt 2
sgn ,
ˆ ,
2
s s k x x f x x f
s s s dt d
Với luật điều khiển uuˆksgn s ta có được sự hội tụ về mặt trượt Để đối
phó với tính bất định, ta chọn một hệ số k lớn trong luật điều khiển
Ví dụ 2 : Xét hệ thống bậc 2 :
x g x u h
x
x x
(1.16)
Trong đó h và g là các hàm phi tuyến chưa biết và g(x) g0 > 0 với mọi x Ta
muốn thiết kế một luật điều khiển hồi tiếp trạng thái để hệ thống ổn định Giả sử ta
có thể thiết kế một luật điều khiển lái chuyển động của hệ thống đến mặt trượt
s = a1x1 + x2 = 0 Trên mặt trượt này, chuyển động bị chi phối bởi x1 a1x1 Việc
chọn a1 > 0 bảo đảm rằng x(t) hướng về 0 khi t dần tới vô cùng và tốc độ hội tụ có
thể được điều khiển bởi việc chọn giá trị a1 Chuyển động của hệ thống trên mặt
trượt s = 0 phụ thuộc vào h và g
Biến s thỏa phương trình :
x g x u h
x a x x a
,
x x x
g
x h x
s s
Lấy :
Trang 180,
0
0,
1sgn
s s
s
Thế vào phương trình (2.19), ta có :
x s x g x x s s g x s g s g
Hình 1.2 Sơ đồ pha Chúng ta phải chú ý rằng bộ điều khiển là không liên tục tại s = 0 Do ảnh hưởng của việc lấy mẫu, việc chuyển đổi và thời gian trễ trong thiết bị được sử dụng để thực hiện bộ điều khiển, và ảnh hưởng do các phương tiện mô phỏng được sử dụng khi mô hình hóa hệ thống được điều khiển, điều khiển trượt bị hiện tượng chattering
Hình kế tiếp cho thấy thời gian trễ có thể gây ra chattering như thế nào Nó vẽ một quỹ đạo trong vùng s > 0 hướng thẳng đến mặt trượt s = 0 Đầu tiên nó chạm đến mặt trượt tại điểm một điểm a Trong bộ điều khiển trượt lý tưởng, quỹ đạo sẽ bắt đầu trượt trên mặt trượt từ một điểm a Trên thực tế, sẽ có thời gian trễ giữa thời gian hàm sign của s thay đổi và thời gian bộ điều khiển chuyển đổi Suốt thời gian trễ này, quỹ đạo vượt qua mặt trượt vào vùng s < 0
Trang 19Hình 1.3 Hiện tượng chattering Chattering dẫn đến việc chính xác trong điều khiển thấp, mất nhiều nhiệt trong các mạch công suất và và mài mòn các phần cơ khí chuyển động Nó cũng có thể làm kích động các động học tần số cao không trược mô hình hóa, mà các thành phần này làm giảm chất lượng của hệ thống và thậm chí có thể dẫn việc hệ thống mất ổn định
Có nhiều cách được sử dụng để tránh hiện tượng chattering, ví dụ ta có thể đưa vào một lớp giới hạn (chặn) Ở đây hàm sgn được làm cho liên tục bằng cách sử dụng hàm sat
Sau đây là một số hàm thường gặp :
Hình 1.4: Các hàm thường dùng trong bộ điều khiển trượt
Trang 20 Hàm sat:
Hàm tanh:
e e
e e
Với Ks là độ lợi trượt
1.2.2 Điều khiển trượt ổn định hóa :
Đối tượng điều khiển : Xét hệ thống :
x x f x
2 1 2
1 2 2
2 1 1 1
,,
,
Mục tiêu điều khiển : đưa vectơ trạng thái x về 0
Mặt trượt : Định nghĩa
S không phụ thuộc tường minh vào u nhưng S phụ thuộc tường minh vào u
Luật điều khiển : Ta có
1 1 2
1 2
1 2
1 2 2 1 1 1
x u x x g x x f x x f x x S
Trang 21 S sign
1 2
Trang 22Chöông 2 : MAÏNG NÔRON NHAÂN TAÏO 2.1 Khaùi nieäm cô baûn :
Maïng neuron nhaân taïo (artificial neural networks : ANN) :
Moâ phoûng hoaït ñoäng cuûa naõo ngöôøi ñeå giaûi quyeát caùc baøi toaùn kyõ thuaät
Maïng neuron nhaân taïo ñöôïc ñaëc tröng bôûi ba yeáu toá :
- phaàn töû xöû lyù
- caáu truùc vaø gheùp noái cuûa caùc phaàn töû xöû lyù
- phöông phaùp huaán luyeän maïng
Phaàn töû xöû lyù (processing element PE) hình 3.1
Hình 2.1 : Phaàn töû xöû lyù (neuron)
x = [x1, x2, … , xm]T : vectô tín hieäu vaøo, y : tín hieäu ra, : ngöôõng taùc ñoäng cuûa neuron, ặ) : haøm taùc ñoäng (activation function), f(.) : haøm tích hôïp (integration function) Thöôøng keát hôïp trong f(x)
Haøm tích hôïp (integration function) : keát hôïp caùc thoâng tin nhaän ñöôïc ôû tín
hieäu vaøọ Moät soá daïng thoâng duïng cuûa haøm tích hôïp :
Haøm tích hôïp tuyeán tính (thoâng duïng nhaát) :
Trang 23net = f(x) - =
m 1 j
j
j x - θ
với w = [w1, w2, … , wm]T : vectơ các trọng số
Dạng toàn phương (quaratic function) :
net = f(x) - =
m 1 j
2 j
j x
Hàm tác động (hàm kích hoạt, hàm truyền, activation function, transfer function) : tạo tín hiệu ra
Một số dạng thông dụng của hàm tác động
Bước nhảy đơn vị (step function) :
0netnếu 1
0netnếu 1
1net 0nếunet
0netnếu 0
Hàm sigmoid đơn cực (unipolar sigmoid function, logsig) :
e 1
1 a(net)
2
Trong (2.7) và (2.8), là hằng số dương xác định độ dốc của hàm tác động ở lân cận điểm net = 0
Trang 24Hình 2.2 : A) hàm dốc B) Hàm sigmoid đơn cực C) Hàm sigmoid lưỡng cực
Kết nối :
Hình 2.3 Các cấu trúc của mạng neuron A) mạng truyền thẳng 1 lớp (single layer feedforward network) B) mạng truyền thẳng nhiều lớp (multi layer feedforward network) C) nút đơn hồi tiếp (single node with feedback to itself)
D) mạng hồi quy nhiều lớp (multi layer recurrent network)
Huấn luyện mạng neuron (training, learning) :
Trang 25A) học có giám sát (supervised learning) B) học tăng cường (reinforcement learning) C) học không có giám sát (unsupervised learning, self organizing)
Hình 2.5 : Luật học các trọng số (weight learning rule) Luật học các trọng số
2.2 Mạng Perception một lớp (single-layer perceptron networks) :
Hình 2.6 trình bày mạng perceptron một lớp với m-1 tín hiệu vào xj và p tín hiệu ra yi (xm = -1 tương ứng với ngưỡng tác động wim của neuron)
Trang 26yi = )
m 1 j
j
ij x w
j
j x w
Mục tiêu : huấn luyện mạng dùng N mẫu dữ liệu {x(k), d(k), k = 1, 2, … N}
sao cho y(k) = d(k), k = 1, 2, … N
2.2.1 Đơn vị tuyến tính (linear unit) :
Đơn vị tuyến tính là 1 neuron với hàm tích hợp tuyến tính và hàm tác động tuyến tính a(net) = net
m 1
j j j
(k) x
Mạng neuron với 1 đơn vị tuyến tính được gọi là phần tử tuyến tính thích
nghi (adaptive linear element, Adaline)
Hàm mục tiêu : Xác định vectơ thông số w sao cho
Trang 27Điều kiện cần và đủ để tồn tại nghiệm w là các mẫu dữ liệu x(k) độc lập tuyến tính
Hình 2.8 Sử dụng giải thuật gradient descent, ta có
2.2.2 Đơn vị phân loại tuyến tính (linear graded unit, LGU) :
LGU là 1 neuron với hàm tích hợp tuyến tính và hàm tác động là hàm sigmoid Ta có :
Trang 28j wjxj(k) a
2.2.3 Đơn vị ngưỡng tuyến tính (Linear threshold unit, LTU) :
LTU là 1 neuron với hàm tích hợp tuyến tính và hàm tác động là hàm dấu Vì a() là hàm dấu nên d(k) và y(k) chỉ có thể nhận các giá trị 1 hoặc –1 :
m 1
j j j
(k)xwsign( = sign(wTx) (2.22)
Điều kiện cần và đủ để tồn tại nghiệm wi là các mẫu dữ liệu {x(k), d(k), k = 1, 2, … p} phân chia một cách tuyến tính (linearly separable) Nghĩa là tồn tại một siêu phẳng :
Trang 29Thay vào (3.9), ta có
d(k) y(k)nếu d(k)x(k)2
0
η
Định lý: Giả thiết vectơ thông số chính xác tồn tại (xác định bởi siêu phẳng
(2.23) sao cho các dữ liệu cùng nhóm nằm cùng một phía đối với siêu phẳng) Với luật học perceptron (2.25), vectơ thông số w hội tụ đến vectơ thông số chính xác sau một số bước học hữu hạn
2.2.4 Ứng dụng trong phân nhóm :
Hàm tác động của lớp ra thường là hàm sigmoid hoặc hardlim
2.2.5 Ứng dụng trong nhận dạng hệ thống động :
Ứng dụng : - dự báo - cân bằng kênh thông tin
Hình 2.9 : Mô hình dùng mạng neuron Hình 2.10 : Dự báo Hình 2.11 : Mô
phỏng
Trang 30
Hình 2.12: Cân bằng kênh thông tin Hình 2.13 : Điều khiển mô hình nội
2.2.6 Ứng dụng trong điều khiển :
Điều khiển mô hình nội, điều khiển trượt …
2.2.7 Ứng dụng trong nhận dạng ký tự (OCR : optical character recognition)
2.3 Mạng truyền thẳng nhiều lớp :
2.3.1 Tổng quan :
Mọi quan hệ phi tuyến đều có thể được xấp xỉ với độ chính xác tùy ý bởi một mạng truyền thẳng nhiều lớp với số nút ẩn đủ lớn, hàm tích hợp tuyến tính hoặc đa thức, và hàm tác động squashing
Hàm a(f) : R [0,1] (hoặc R [-1,1]) được gọi là hàm squashing nếu, a(f) không giảm khi f tăng, a(-) = 0 (hoặc –1), và a(+) = 1 Các hàm định nghĩa bởi (2.5), (2.6), (2.7), (2.8) đều là các hàm squashing
Với mạng perceptron nhiều lớp (có lớp ẩn), các điều kiện :
- các mẫu dữ liệu phân chia một cách tuyến tính (LTU)
- các mẫu dữ liệu độc lập tuyến tính (LGU) là không cần thiết
2.3.2 Giải thuật huấn luyện lan truyền ngược (back propagation) :
Dữ liệu huấn luyện : {x(k), d(k), k = 1, 2, … N}
Trường hợp p = 1
Lớp ẩn (hidden layer) :
Trang 31netq =
m 1
x v
T q
q q q
zw
m
1 qj j
q a v x w
T q
qa(v x)w
q q q
z w a -
T q
q a(v x) w
a -
Trang 32Trường hợp tổng quát p > 1
Lớp ẩn (hidden layer) : netq = T
q
v x =
m 1
j qj j
xv
m 1
z w
m 1
j qj j
iq a v x w
r 1
q iq q
i - a w z d
Trang 33vqj =
p 1
Luật học lan truyền ngược (back propagation learning rule) :
Bước 0 : Khởi động trị
Chọn hằng số học , ngưỡng dừng Emax
Các trọng số có trị số nhỏ và ngẫu nhiên
J = 0, k = 1
Bước 1 : Lan truyền thuận dữ liệu
Ap dụng mẫu dữ liệu thứ k
Xác định tín hiệu tại các nút trong mạng
Xác định hàm mục tiêu J
Xác định tín hiệu học tại các nút ra theo (2.43)
Bước 2 : Lan truyền ngược sai lệch
Cập nhật các vectơ trọng số theo (2.42), (2.44)
wiq = oizq
vqj = hqxj
Xác định các tín hiệu học theo (2.45)
Trang 34Bước 3 : Nếu k < p : k = k + 1, nhảy đến bước 1
Nếu k = p : (kết thúc 1 epoch)
Nếu J > Jmax : k = 1, nhảy đến bước 1 Nếu J Jmax : Kết thúc
2.3.3 Các thông số của luật học lan truyền ngược :
Việc huấn luyện mạng chịu tác động bởi các yếu tố sau
a) Trị khởi động của các trọng số : Các trọng số nên khởi động với các giá trị
bé và ngẫu nhiên Các giá trị lớn của vectơ trọng số có thể làm các hàm tác động bảo hòa khi bắt đầu học
b) Hằng số học: lớn hội tụ nhanh nhưng có thể gây vọt lố Có thể chọn
giảm dần Nếu hàm mục tiêu giảm chậm tăng Nếu hàm mục tiêu dao động