điều khiển trượt hệ bồn nước đôi

Giới thiệu về điều khiển trượt 2 Chương 2 : Mạng nơron nhân tạo 2.2 Mạng Perception một lớp single-layer perceptron networks 15 2.4 Mạng hồi quy recurrent neural networks, feedback n

Trang 1

TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT

Trang 2

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT Tp HCM

*****

ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CẤP TRƯỜNG

TÊN ĐỀ TÀI:

ĐIỂU KHIỂN TRƯỢT HỆ BỒN NƯỚC ĐƠI

MÃ SỐ: T2009 – 79

Thuộc nhĩm ngành: KHOA HỌC KỸ THUẬT

Chủ nhiệm đề tài: KS NGUYỄN THỊ NGỌC THẢO Người tham gia đề tài: THS PHÙ THỊ NGỌC HIẾU

Đơn vị: KHOA ĐIỆN-ĐIỆN TỬ

THÀNH PHỐ HỒ CHÍ MINH 07/ 2010

Trang 3

A

PHẦN GIỚI THIỆU

Trang 4

MỤC LỤC

A Phần giới thiệu

- Mục lục

- Tóm tắt kết quả nghiên cứu

- Tính cấp thiết của đề tài

- Mục tiêu nghiên cứu

- Phạm vi nghiên cứu

- Nội dung nghiên cứu

B Phần nội dung

Chương 1 : Cơ sở lý thuyết điều khiển trượt

1.1 Giới thiệu về điều khiển trượt 2

Chương 2 : Mạng nơron nhân tạo

2.2 Mạng Perception một lớp (single-layer perceptron networks) 15

2.4 Mạng hồi quy (recurrent neural networks, feedback networks) 25

Chương 3 : Kkhảo sát đối tượng bồn nước

3.1 Những cấu hình khác nhau của hệ bồn nước 38

3.2 Xây dựng phương trình toán cho đối tượng 40

Chương 4 : Xây dựng bộ điều khiển trượt cho hệ bồn nước

Trang 5

điều khiển trượt cho hệ bồn nước

TĨM TẮT KẾT QUẢ NGHIÊN CỨU

ĐỀ TÀI KHOA HỌC VÀ CƠNG NGHỆ CẤP TRƯỜNG

Tên đề tài: Điều khiển trượt hệ bồn nước đơi

Mã số: T2009 - 79

Chủ nhiệm đề tài: Ks Nguyễn Thị Ngọc Thảo Tel.: 0909387648

Trang 6

Cơ quan chủ trì đề tài: Trường Đại học sư phạm kỹ thuật Tp.HCM

Cơ quan và cá nhân phối hợp thực hiện: Ths Phù Thị Ngọc Hiếu

Thời gian thực hiện: 08 tháng

1 Mục tiêu:

- Nghiên cứu điều khiển trượt

- Xây dựng mô hình mô phỏng hệ bồn nước đôi trên Matlab

- Áp dụng phương pháp điều khiển trượt điều khiển mực nước của hệ bồn nước đôi

2 Nội dung chính:

- Phương pháp điều khiển trượt

- Mạng Nơron

- Hệ bồn nước đôi và xây dựng mô hình mô phỏng cho hệ bồn nước đôi

- Thực hiện mô phỏng điều khiển mực nước hệ bồn nước đôi bằng phương pháp điều khiển trượt

- Ứng dụng mạng Nơron để xấp xỉ luật điều khiển u trong phương pháp điều khiển trượt và mô phỏng kết quả bằng Matlab

3 Kết quả chính đạt đƣợc (khoa học, ứng dụng, đào tạo, kinh tế – xã hội, v.v

Sử dụng làm tài liệu tham khảo cho lĩnh vực điều khiển tự động, môn học Điều Khiển Đa Biến hay Điều Khiển Phi Tuyến

4 Điểm mới

- Xây dựng mô hình mô phỏng bằng Matlab cho hệ bồn nước đôi

- Ứng dụng phương pháp điều khiển trượt để điều khiển bồn nước đôi

và mô phỏng kết quả điều khiển bằng Matlab

- Ứng dụng mạng Nơron để xấp xỉ một hàm

5 Địa chỉ ứng dụng

Tài liệu tham khảo cho sinh viên, học viên cao học và những nhà nghiên cứu liên quan đến lĩnh vực điều khiển tự động

Trang 7

sự chú ý của nhiều nhà khoa học vì ưu điểm của nó là mang lại sự ổn định bền vững cho hệ thống phi tuyến cho dù hệ thống đó có nhiễu hoặc có một vài thông số thay đổi theo thời gian Và từ đó cho đến nay, lý thuyết về điều khiển trượt đã được được phát triển một cách đáng kể bởi các nhà nghiên cứu

Thêm vào đó, điều khiển trượt cho ta các luật điều khiển hiệu quả đối với các đối tượng tuyến tính và không tuyến tính Một đặc trưng phân biệt khác là khả năng giảm bậc của nó có thể làm đơn giản thiết kế và có thể phân tách hệ thống Với những ưu điểm này, điều khiển trượt là một lãnh vực đầy hứa hẹn về nghiên cứu lý thuyết cũng như các vấn đề ứng dụng vào các đối tượng cụ thể Vì thế đề tài

“Điều khiển trượt hệ bồn nước đơi” mang tính cấp thiết và thực tiễn cao trong thời

gian hiện nay

MỤC TIÊU NGHIÊN CỨU

- Nghiên cứu điều khiển trượt

- Xây dựng mơ hình mơ phỏng hệ bồn nước đơi trên Matlab

- Áp dụng phương pháp điều khiển trượt điều khiển mực nước của hệ bồn nước đơi

PHƯƠNG PHÁP NGHIÊN CỨU

- Phương pháp tham khảo tài liệu

- Xây dựng mơ hình mơ phỏng và thực hiện mơ phỏng kết quả nghiên cứu trên phần mềm Matlab

PHẠM VI NGHIÊN CỨU

- Nghiên cứu điều khiển trượt và cách xây dựng một bộ điều khiển trượt

- Nghiên cứu về đối tượng bồn nước đôi

Trang 8

- Áp dụng thuật toán điều khiển trượt để điều khiển giữ vững mực nước của bồn nước đôi

- Nghiên cứu về mạng Nơron và cách xấp xỉ bộ điều khiển trượt bằng mạng Nơron

- Aùp dụng mạng Nơron đã xấp xỉ để điều khiển mô hình bồn nước đôi (thực hiện mô phỏng)

NỘI DUNG NGHIÊN CỨU

- Phương pháp điều khiển trượt

- Mạng Nơron

- Hệ bồn nước đơi và xây dựng mơ hình mơ phỏng cho hệ bồn nước đơi

- Thực hiện mơ phỏng điều khiển mực nước hệ bồn nước đơi bằng phương pháp điều khiển trượt

- Ứng dụng mạng Nơron để xấp xỉ luật điều khiển u trong phương pháp điều khiển trượt và mơ phỏng kết quả bằng Matlab

Phần Phụ Lục :

TÀI LIỆU THAM KHẢO

Trang 9

Khoa TP.HCM, nhà xuất bản : Đại Học Quốc Gia Thành Phố Hồ Chí Minh

[2] Sliding Mode Control in Engineering (Control Engineering Series, 11) (Hardcover)

by Wilfrid Perruquetti (Author)

[3] TS Dương Hoài Nghĩa, “Bài giảng mạng Nơron nhân tạo”, năm 2009

[4] Sliding Mode Control of Nonlinear Systems Using Gaussian Radial Basis

function Neural Networks - M Ưnder Efe, Okyay Kaynak, Xinghuo Yu

[5] Process Modelling, Identification, and Control 2007 , Ján Mikleš ·Miroslav

Fikar

[6] Jinzhu Peng, Yaonan Wang, Wei Sun and Yan Liu: A Neural network Sliding

Mode Controller with Application to Robotic Manipulator

[7] Shuanghe Yu*, Xinghuo Yu**, Mehmet Ưnder Efe*** với đề tài Modeling-Error

Based Adaptive Fuzzy Sliding Mode Control for Trajectory-Tracking of Nonlinear Systems

[8] Q P Ha, Member, IEEE, H Trinh, H T Nguyen, Senior Member, IEEE, and H D

Tuan, Member : Dynamic Output Feedback Sliding-Mode Control Using Pole

Placement and Linear Functional Observers

[9] F Qiao Q M Zhu, A Winfield and C Melhuish : Design of Takagi-Sugeno

fuzzy model based sliding mode controllers for nonlinear systems

[10] J´an Vittek, Stephen J Dodds, Peter Briˇs, Marek ˇStulrajter, Pavol Makyˇs :

Experimental Verification Of Chattering Free Sliding Mode Control Of The Drive Position Employing PMSM

[11] Don Krupp – Guidance and Control Division – Marshall Space Flight Center :

Chattering-free Sliding Mode Control with Unmodeled Dynamics

[12] Jingchuan Li, M.S.E.E : Adaptive Sliding Mode Observer And Loss

Minimization For Sensorless Field Orientation Control Of Induction Machine

[13] Abdul Rashid Husain, Mohamad Noh Ahmad, and Abdul Halim Mohd Yatim :

Chattering-free Sliding Mode Control for an Active Magnetic Bearing System

Trang 10

Double Fed Asynchronous Machine Applayed by Current Sources

[15] Rafael Ramos, Domingo Biel, Francesc Guinjoan, Enric Fossas : Master-Slave

Sliding-Mode Control Design in Parallel-Connected Inverters

[16] M R Rafimanzelat and M J Yazdanpanah : A Novel Low Chattering Sliding

Mode Controller

[17] Kevin J Walchko, David Novick, and Michael C Nechyba - University of

Florida, Gainesville, FL, 32611-6200 : Development of a Sliding Mode Control

System with Extended Kalman Filter Estimation for Subjugator

[18] Jiunshian Phuah Student Member, Jianming Lu Member, Takashi Yahagi

Non-member: Chattering Free Sliding Mode Control in Magnetic Levitation System [19] Cem Ünsal and Pushkin Kachroo : Sliding Mode Measurement Feedback

Control for Antilock Braking Systems

[20] Halim Alwi B.Eng., Leicester : Fault Tolerant Sliding Mode Control Schemes

With Aerospace Applications

[21] Dr K B Mohanty, Member, Department of Electrical Engineering, National

Institute of Technology, Rourkela, India : A Fuzzy Sliding Mode Controller for a

Field-Oriented Induction Motor Drive

[22] Mustafa Resa Becan : Sliding Mode Control with Fuzzy Boundary Layer to

Air-Air Interception Problem

[23] Muhammad Yasser, Hiroo Sekiya, Takashi Yahagi, Ayman Haggag, Mohamed Ghoneim, and Jianming Lu Graduate School of Science and Technology Chiba

University : Adaptive Sliding Mode Control with Simple Adaptive Control for

Buck Converters

[24] Asif ˇSabanoviˇc, TUBITAK - Marmara Research Center : Chattering Free

Sliding Modes in Robotic Manipulators Control

[25] M S Srai1, H Sindano2, N E Gough3 and A C Cole4,1 : Sliding Mode Idle Speed

Trang 11

and observability singularity in chaotic synchronization

[27] Mohammad S Islam, Iqbal Husain, Robert J Veillette, and Celal Batur : Design

and Performance Analysis of Sliding-Mode Observers for Sensorless

Operation of Switched Reluctance Motors

[28] N F AL-MUTHAIRI AND M ZRIBI : Sliding Mode Control Of A Magnetic

Levitation System

[29] Wen Yu : Sliding Mode Technique and Sliding Mode Observer

[30] A.S LEWIS a’*, A SINHAb and K.W WANGb : Sliding Mode Output

Feedback Control of a Flexible Rotor Supported by Magnetic Bearings

[31] Roy A McCann, Mohammad S Islam, Student Member, IEEE, and Iqbal Husain,

Senior Member, IEEE : Application of a Sliding-Mode Observer for Position and

Speed Estimation in Switched Reluctance Motor Drives

[32] A.B Potapov¤and M.K Aliy : Nonlinear dynamics and chaos in information

processing neural networks

[33] Michael C Nechyba and Yangsheng Xu : Neural Network Approach to Control

System Identification with Variable Activation Functions

[34] “Sliding mode control using radial basis function neural networks (Điều

khiển trƣợt dùng mạng Nơron hàm cơ sở xuyên tâm)” - Tran Quang Thuan,

Lecturer, PTIT-HCM, Duong Hoai Nghia, Lecturer, HCM City University of Technology, and Dong Si Thien Chau, Lecturer, Ton Duc Thang University

Trang 12

B

PHẦN NỘI DUNG

Trang 13

Chương 1 : CƠ SỞ LÝ THUYẾT

ĐIỀU KHIỂN TRƯỢT 1.1 Giới thiệu về điều khiển trượt :

Điều khiển trượt của hệ thống động đã có một lịch sử lâu dài về mặt lý thuyết và có nhiều sự phát triển trên thực tế Trong lý thuyết điều khiển, điều khiển trượt là một dạng của điều khiển cấu trúc biến đổi Đây là một phương pháp điều khiển phi tuyến làm thay đổi động học của hệ thống phi tuyến bằng cách áp dụng vào đó một phương pháp điều khiển chuyển đổi với một tần số cao Luật điều khiển hồi tiếp trạng thái không là một hàm liên tục theo thời gian Thay vào đó, nó chuyển đổi từ một cấu trúc liên tục sang một dạng khác dựa trên vị trí hiện tại của không gian trạng thái Do đó, điều khiển trượt là một phương pháp điều khiển cấu trúc biến đổi Các cấu trúc điều khiển đa dạng được thiết kế sao cho các quỹ đạo luôn tiến về trạng thái chuyển đổi, và vì thế quỹ đạo sau cùng sẽ không hoàn toàn tồn tại trong một cấu trúc điều khiển Thay vào đó, quỹ đạo sau cùng sẽ trượt dọc trên các biên giới của các cấu trúc điều khiển Chuyển động của hệ thống dọc theo các biên giới như vậy được gọi là chế độ trượt Và quỹ tích hình học chứa các giới hạn được gọi là mặt trượt Hình 2.1 dưới đây sẽ cho ta thấy một quỹ đạo của hệ thống trong điều khiển trượt

Hình 1.1

Trang 14

Nói tóm lại, chế độ trượt là chuyển động của quỹ đạo pha của hệ thống dọc theo một đường thẳng/mặt phẳng/bề mặt của không gian trạng thái đã được chọn trước đó Điều khiển trượt là thiết kế bộ điều khiển nhằm đưa quỹ đạo pha của hệ thống về mặt trượt đã chọn và duy trì trên mặt trượt này một cách bền vững

Các hệ thống cần điều khiển trên thực tế có thể có mô hình không chính xác Sự không chính xác đó có thể đến từ các giá trị không xác định được trong thực tế về đối tượng (ví dụ như là các thông số của đối tượng mà ta chưa biết), hoặc là từ việc ta biểu diễn động học của hệ thống theo dạng đã đơn giản hóa (ví dụ như là mô hình hóa lực ma sát như là dạng tuyến tính, v.v…) Tuy nhiên, để thiết kế được bộ điều khiển trượt, thì điều quan trọng là phải xác định được mô hình chính xác của đối tượng điều khiển Để giải quyết vấn đề này, ta có thể áp dụng các phương pháp nhận dạng đối tượng : dùng mạng nơron, dùng mạng mờ, v.v…

1.2 Phương pháp điều khiển trượt :

1.2.1 Điều khiển trượt bám:

Xét hệ thống phi tuyến có dạng :

x x

x

n n

x x

Xem như f(x) và b(x) là bất định

Vấn đề điều khiển : là xác định một luật điều khiển mà nó giải quyết vấn

đề bám theo điểm đặt và cũng bền vững với những sự bất định trong f(x) và b(x)

Định nghĩa xd là điểm đặt và x~ là sự khác biệt giữa x và xd (còn gọi là tín

Trang 15

 

d

d d d d

x x x

x x x x

Nếu ta có thể giới hạn động học của hệ thống trên một bề mặt biết rõ, khi đó vấn đề điều khiển sẽ trở nên vô cùng đơn giản Bề mặt đó được gọi là mặt trượt và nó được định nghĩa sao cho các sai số động học ổn định theo hàm mũ khi hệ thống được giới hạn nằm trên mặt trượt này

Vấn đề điều khiển khi đó sẽ trở thành vấn đề lái hệ thống đến mặt trượt, và sau đó giữ cho nó luôn ở trên mặt trượt này

Định nghĩa mặt trượt S(t) như sau :

d t x s

Trên mặt trượt này, sai số sẽ tiến về 0 theo hàm mũ

Điều này ngụ ý rằng nếu tồn tại một ngõ vào điều khiển u(t) sao cho x(t) nằm trong S(t) thì nó sẽ có x(T) nằm trong S(T) với mọi T > t và sai số sẽ hội tụ về

0 theo hàm mũ với ngõ vào điều khiển này

Nhận xét : Việc chọn hàm s(x,t) có phần tùy ý Ta có thể chọn bất cứ sai số

động học nào mà dẫn đến hoạt động ổn định theo hàm mũ :

  x

dt

d p t x

Trang 16

Trong đó p(s) là một đa thức có tất cả zero nằm bên nửa trái mặt phẳng phức, khi đó sai số động học sẽ hội tụ theo hàm mũ Ví dụ, ta có thể có :

Trong đó x là vô hướng Đặt f x,x là một hàm bất định, trong đó chỉ có và ước lượng phương trình trạng thái thật fˆ  x,x là đã biết, và do đó sai số có thể được chặn :

   x x f x x F x x x x

Định nghĩa mặt trượt :

2,

d x x s

x x x

s  d ~  ,   d ~ (1.11) Chọn :

 x x x x f

uˆ ˆ ,  d ˆ, f  fˆ và s 0 (1.12) Và định nghĩa luật điều khiển :

 s k

u

Ta xem s(x,t) như là phép đo khoảng cách từ hệ thống đến mặt trượt Để giữ

Trang 17

Để chứng minh sự hội tụ về mặt trượt, xét đạo hàm của khoảng cách của một

điểm xác định từ mặt trượt 2

sgn ,

ˆ ,

2

s s k x x f x x f

s s s dt d

Với luật điều khiển uuˆksgn s ta có được sự hội tụ về mặt trượt Để đối

phó với tính bất định, ta chọn một hệ số k lớn trong luật điều khiển

Ví dụ 2 : Xét hệ thống bậc 2 :

   x g x u h

x

x x



(1.16)

Trong đó h và g là các hàm phi tuyến chưa biết và g(x)  g0 > 0 với mọi x Ta

muốn thiết kế một luật điều khiển hồi tiếp trạng thái để hệ thống ổn định Giả sử ta

có thể thiết kế một luật điều khiển lái chuyển động của hệ thống đến mặt trượt

s = a1x1 + x2 = 0 Trên mặt trượt này, chuyển động bị chi phối bởi x1 a1x1 Việc

chọn a1 > 0 bảo đảm rằng x(t) hướng về 0 khi t dần tới vô cùng và tốc độ hội tụ có

thể được điều khiển bởi việc chọn giá trị a1 Chuyển động của hệ thống trên mặt

trượt s = 0 phụ thuộc vào h và g

Biến s thỏa phương trình :

   x g x u h

x a x x a

,   





x x x

g

x h x

s s

Lấy :

Trang 18

0,

0

0,

1sgn

s s

s

Thế vào phương trình (2.19), ta có :

       x s x g x  x s  s g x s g s g

Hình 1.2 Sơ đồ pha Chúng ta phải chú ý rằng bộ điều khiển là không liên tục tại s = 0 Do ảnh hưởng của việc lấy mẫu, việc chuyển đổi và thời gian trễ trong thiết bị được sử dụng để thực hiện bộ điều khiển, và ảnh hưởng do các phương tiện mô phỏng được sử dụng khi mô hình hóa hệ thống được điều khiển, điều khiển trượt bị hiện tượng chattering

Hình kế tiếp cho thấy thời gian trễ có thể gây ra chattering như thế nào Nó vẽ một quỹ đạo trong vùng s > 0 hướng thẳng đến mặt trượt s = 0 Đầu tiên nó chạm đến mặt trượt tại điểm một điểm a Trong bộ điều khiển trượt lý tưởng, quỹ đạo sẽ bắt đầu trượt trên mặt trượt từ một điểm a Trên thực tế, sẽ có thời gian trễ giữa thời gian hàm sign của s thay đổi và thời gian bộ điều khiển chuyển đổi Suốt thời gian trễ này, quỹ đạo vượt qua mặt trượt vào vùng s < 0

Trang 19

Hình 1.3 Hiện tượng chattering Chattering dẫn đến việc chính xác trong điều khiển thấp, mất nhiều nhiệt trong các mạch công suất và và mài mòn các phần cơ khí chuyển động Nó cũng có thể làm kích động các động học tần số cao không trược mô hình hóa, mà các thành phần này làm giảm chất lượng của hệ thống và thậm chí có thể dẫn việc hệ thống mất ổn định

Có nhiều cách được sử dụng để tránh hiện tượng chattering, ví dụ ta có thể đưa vào một lớp giới hạn (chặn) Ở đây hàm sgn được làm cho liên tục bằng cách sử dụng hàm sat

Sau đây là một số hàm thường gặp :

Hình 1.4: Các hàm thường dùng trong bộ điều khiển trượt

Trang 20

 Hàm sat:

 Hàm tanh:

e e

Với Ks là độ lợi trượt

1.2.2 Điều khiển trượt ổn định hóa :

Đối tượng điều khiển : Xét hệ thống :

x x f x

2 1 2

1 2 2

2 1 1 1

,,

,



Mục tiêu điều khiển : đưa vectơ trạng thái x về 0

Mặt trượt : Định nghĩa

 S không phụ thuộc tường minh vào u nhưng S phụ thuộc tường minh vào u

Luật điều khiển : Ta có

      1 1 2

1 2

1 2 2 1 1 1

x u x x g x x f x x f x x S

Trang 21

 S sign

1 2

Trang 22

Chöông 2 : MAÏNG NÔRON NHAÂN TAÏO 2.1 Khaùi nieäm cô baûn :

Maïng neuron nhaân taïo (artificial neural networks : ANN) :

Moâ phoûng hoaït ñoäng cuûa naõo ngöôøi ñeå giaûi quyeát caùc baøi toaùn kyõ thuaät

Maïng neuron nhaân taïo ñöôïc ñaëc tröng bôûi ba yeáu toá :

- phaàn töû xöû lyù

- caáu truùc vaø gheùp noái cuûa caùc phaàn töû xöû lyù

- phöông phaùp huaán luyeän maïng

Phaàn töû xöû lyù (processing element PE) hình 3.1

Hình 2.1 : Phaàn töû xöû lyù (neuron)

x = [x1, x2, … , xm]T : vectô tín hieäu vaøo, y : tín hieäu ra,  : ngöôõng taùc ñoäng cuûa neuron, ặ) : haøm taùc ñoäng (activation function), f(.) : haøm tích hôïp (integration function) Thöôøng keát hôïp  trong f(x)

Haøm tích hôïp (integration function) : keát hôïp caùc thoâng tin nhaän ñöôïc ôû tín

hieäu vaøọ Moät soá daïng thoâng duïng cuûa haøm tích hôïp :

 Haøm tích hôïp tuyeán tính (thoâng duïng nhaát) :

Trang 23

net = f(x) -  = 



m 1 j

j

j x - θ

với w = [w1, w2, … , wm]T : vectơ các trọng số

 Dạng toàn phương (quaratic function) :

net = f(x) -  = 



m 1 j

2 j

j x

Hàm tác động (hàm kích hoạt, hàm truyền, activation function, transfer function) : tạo tín hiệu ra

Một số dạng thông dụng của hàm tác động

Bước nhảy đơn vị (step function) :

0netnếu 1

1net 0nếunet

0netnếu 0

 Hàm sigmoid đơn cực (unipolar sigmoid function, logsig) :

e 1

1 a(net) 

2

Trong (2.7) và (2.8),  là hằng số dương xác định độ dốc của hàm tác động ở lân cận điểm net = 0

Trang 24

Hình 2.2 : A) hàm dốc B) Hàm sigmoid đơn cực C) Hàm sigmoid lưỡng cực

Kết nối :

Hình 2.3 Các cấu trúc của mạng neuron A) mạng truyền thẳng 1 lớp (single layer feedforward network) B) mạng truyền thẳng nhiều lớp (multi layer feedforward network) C) nút đơn hồi tiếp (single node with feedback to itself)

D) mạng hồi quy nhiều lớp (multi layer recurrent network)

Huấn luyện mạng neuron (training, learning) :

Trang 25

A) học có giám sát (supervised learning) B) học tăng cường (reinforcement learning) C) học không có giám sát (unsupervised learning, self organizing)

Hình 2.5 : Luật học các trọng số (weight learning rule) Luật học các trọng số

2.2 Mạng Perception một lớp (single-layer perceptron networks) :

Hình 2.6 trình bày mạng perceptron một lớp với m-1 tín hiệu vào xj và p tín hiệu ra yi (xm = -1 tương ứng với ngưỡng tác động wim của neuron)

Trang 26

yi =  )



m 1 j

j

ij x w

j

j x w

Mục tiêu : huấn luyện mạng dùng N mẫu dữ liệu {x(k), d(k), k = 1, 2, … N}

sao cho y(k) = d(k), k = 1, 2, … N

2.2.1 Đơn vị tuyến tính (linear unit) :

Đơn vị tuyến tính là 1 neuron với hàm tích hợp tuyến tính và hàm tác động tuyến tính a(net) = net



m 1

j j j

(k) x

Mạng neuron với 1 đơn vị tuyến tính được gọi là phần tử tuyến tính thích

nghi (adaptive linear element, Adaline)

Hàm mục tiêu : Xác định vectơ thông số w sao cho

Trang 27

Điều kiện cần và đủ để tồn tại nghiệm w là các mẫu dữ liệu x(k) độc lập tuyến tính

Hình 2.8 Sử dụng giải thuật gradient descent, ta có

2.2.2 Đơn vị phân loại tuyến tính (linear graded unit, LGU) :

LGU là 1 neuron với hàm tích hợp tuyến tính và hàm tác động là hàm sigmoid Ta có :

Trang 28

j wjxj(k) a

2.2.3 Đơn vị ngưỡng tuyến tính (Linear threshold unit, LTU) :

LTU là 1 neuron với hàm tích hợp tuyến tính và hàm tác động là hàm dấu Vì a() là hàm dấu nên d(k) và y(k) chỉ có thể nhận các giá trị 1 hoặc –1 :



m 1

j j j

(k)xwsign( = sign(wTx) (2.22)

Điều kiện cần và đủ để tồn tại nghiệm wi là các mẫu dữ liệu {x(k), d(k), k = 1, 2, … p} phân chia một cách tuyến tính (linearly separable) Nghĩa là tồn tại một siêu phẳng : 

Trang 29

Thay vào (3.9), ta có

d(k) y(k)nếu d(k)x(k)2

0

η

Định lý: Giả thiết vectơ thông số chính xác tồn tại (xác định bởi siêu phẳng

(2.23) sao cho các dữ liệu cùng nhóm nằm cùng một phía đối với siêu phẳng) Với luật học perceptron (2.25), vectơ thông số w hội tụ đến vectơ thông số chính xác sau một số bước học hữu hạn

2.2.4 Ứng dụng trong phân nhóm :

Hàm tác động của lớp ra thường là hàm sigmoid hoặc hardlim

2.2.5 Ứng dụng trong nhận dạng hệ thống động :

Ứng dụng : - dự báo - cân bằng kênh thông tin

Hình 2.9 : Mô hình dùng mạng neuron Hình 2.10 : Dự báo Hình 2.11 : Mô

phỏng

Trang 30

Hình 2.12: Cân bằng kênh thông tin Hình 2.13 : Điều khiển mô hình nội

2.2.6 Ứng dụng trong điều khiển :

Điều khiển mô hình nội, điều khiển trượt …

2.2.7 Ứng dụng trong nhận dạng ký tự (OCR : optical character recognition)

2.3 Mạng truyền thẳng nhiều lớp :

2.3.1 Tổng quan :

Mọi quan hệ phi tuyến đều có thể được xấp xỉ với độ chính xác tùy ý bởi một mạng truyền thẳng nhiều lớp với số nút ẩn đủ lớn, hàm tích hợp tuyến tính hoặc đa thức, và hàm tác động squashing

Hàm a(f) : R  [0,1] (hoặc R  [-1,1]) được gọi là hàm squashing nếu, a(f) không giảm khi f tăng, a(-) = 0 (hoặc –1), và a(+) = 1 Các hàm định nghĩa bởi (2.5), (2.6), (2.7), (2.8) đều là các hàm squashing

Với mạng perceptron nhiều lớp (có lớp ẩn), các điều kiện :

- các mẫu dữ liệu phân chia một cách tuyến tính (LTU)

- các mẫu dữ liệu độc lập tuyến tính (LGU) là không cần thiết

2.3.2 Giải thuật huấn luyện lan truyền ngược (back propagation) :

Dữ liệu huấn luyện : {x(k), d(k), k = 1, 2, … N}

Trường hợp p = 1

Lớp ẩn (hidden layer) :

Trang 31

netq = 



m 1

x v

T q

q q q

zw

m

1 qj j

q a v x w

T q

qa(v x)w

q q q

z w a -

T q

q a(v x) w

a -

Trang 32

Trường hợp tổng quát p > 1

Lớp ẩn (hidden layer) : netq = T

q

v x = 



m 1

j qj j

xv

m 1

z w

m 1

j qj j

iq a v x w

r 1

q iq q

i - a w z d

Trang 33

vqj = 



p 1

Luật học lan truyền ngược (back propagation learning rule) :

Bước 0 : Khởi động trị

Chọn hằng số học , ngưỡng dừng Emax

Các trọng số có trị số nhỏ và ngẫu nhiên

J = 0, k = 1

Bước 1 : Lan truyền thuận dữ liệu

Ap dụng mẫu dữ liệu thứ k

Xác định tín hiệu tại các nút trong mạng

Xác định hàm mục tiêu J

Xác định tín hiệu học tại các nút ra theo (2.43)

Bước 2 : Lan truyền ngược sai lệch

Cập nhật các vectơ trọng số theo (2.42), (2.44)

wiq = oizq

vqj = hqxj

Xác định các tín hiệu học theo (2.45)

Trang 34

Bước 3 : Nếu k < p : k = k + 1, nhảy đến bước 1

Nếu k = p : (kết thúc 1 epoch)

Nếu J > Jmax : k = 1, nhảy đến bước 1 Nếu J  Jmax : Kết thúc

2.3.3 Các thông số của luật học lan truyền ngược :

Việc huấn luyện mạng chịu tác động bởi các yếu tố sau

a) Trị khởi động của các trọng số : Các trọng số nên khởi động với các giá trị

bé và ngẫu nhiên Các giá trị lớn của vectơ trọng số có thể làm các hàm tác động bảo hòa khi bắt đầu học

b) Hằng số học:  lớn  hội tụ nhanh nhưng có thể gây vọt lố Có thể chọn 

giảm dần Nếu hàm mục tiêu giảm chậm  tăng  Nếu hàm mục tiêu dao động

Định dạng
Số trang	69
Dung lượng	5,99 MB