Mạng nơ-ron nhân tạo RBF

CHƯƠNG 3: ĐIỀU KHIỂN TRƯỢT THÍCH NGHI CHO CẦN CẨU TREO TRÊN CƠ SỞ MẠNG NƠ-RON NHÂN TẠO

3.1. Nền tảng cơ sở cho giải thuật điều khiển

3.1.2 Mạng nơ-ron nhân tạo RBF

Mạng nơ-ron nhân tạo có rất nhiều ứng dụng trong điều khiển học, tài liệu [6] đã tóm tắt lại quá trình phát triển của mạng nơ-ron như sau: Mạng nơ-ron ra đời từ những năm 1940 bởi McCulloch và Pitts [39]. Hai tác giả này là những người đầu tiên đưa ra một mô hình toán học của nơ-ron. Với mô hình này, các đầu vào của nơ ron được nhân với các trọng số, sau đó được đưa vào bộ tổng. Đầu ra của bộ tổng sẽ được so sánh với một giá trị ngưỡng để xác định đầu ra của nơ-ron có kích thích hay không. Mạng nơ-ron này đã được chứng tỏ là có khả năng xấp xỉ các hàm lô gíc và hàm đại số. Sau đó mạng nơ-ron nhiều lớp được đưa ra vào những năm 1960, tuy nhiên ở giai đoạn đó chưa có phương pháp huấn luyện mạng nào để có thể huấn luyện được mạng nhiều lớp. Do đó có một khoảng thời gian dài những nghiên cứu về mạng nơ-ron gần như bế tắc.

Cho đến năm 1986, Rumelhart and McClelland đã đưa ra thuật toán lan truyền ngược để huấn luyện mạng nơ-ron [50]. Từ đó những nghiên cứu về mạng nơ-ron lại bắt đầu bùng nổ. Dựa trên cơ sở thuật toan lan truyền ngược, đã có rất nhiều phương pháp huấn luyện mạng khác nhau như hạ nhanh nhất, hướng liên hợp, hiệu chỉnh hệ số học và Marquardt [26]. Thuật toán Marquardt ra đời từ năm 1963 [38] bởi tác giả Marquardt. Ông đã phát triển thuật toán dựa trên nghiên cứu của Leverberg. Hagan [26] đã chỉ ra rằng thuật toán Marquardt hiệu quả hơn hẳn so với các phương pháp khác đặc biệt về tốc độ hội tụ khi kích thước của mạng nơ-ron lên tới hàng trăm thông số.

Mặc dù mạng nơ-ron ra đời từ rất lâu và đã được ứng dụng rộng rãi và thành công trong các lĩnh vực như phân loại mẫu, nhận dạng mẫu, xấp xỉ dữ liệu, nhưng những ứng dụng trong lĩnh vực nhận dạng và điều khiển các hệ thống động học vẫn còn khá mới mẻ và ít được quan tâm. Cho đến những năm đầu của thập kỷ 90, mạng nơ-ron mới được nghiên cứu và ứng dụng vào nhận

dạng và điều khiển [24, 41]. Mạng nơ-ron có thể được sử dụng như mô hình cho đối tượng hoặc bộ điều khiển. Lớp các mạng nơ-ron này thường là mạng nơ-ron động học và có hồi qui.

Để huấn luyện mạng hồi qui này người ta thường sử dụng thuật toán lan truyền ngược [21]. Horn đã chỉ ra rằng khi huấn luyện một lớp mạng hồi qui sẽ gặp những khó khăn vì có rất nhiều vùng giả cực trị [27]. Tác giả này đã sử dụng phương pháp phân tích các nghiệm của đa thức ngẫu nhiên để phân tích những nguyên nhân gây ra các vùng giả cực trị này. Trên cơ sở đó một số giải pháp đã được đưa ra để tránh các vùng giả cực trị này trong quá trình huấn luyện mạng như: (1) dùng hàm mục tiêu gồm tổng các sai số bình phương cộng với tích của hệ số điều chỉnh nhân với tổng bình phương các trọng số, phương pháp này sẽ ép các trọng số của mạng nơ-ron về vùng ổn định trong quá trình huấn luyện mạng; (2) dùng nhiều chuỗi dữ liệu huấn luyện mạng khác nhau, ta có thể dùng một chuỗi để huấn luyện mạng với một số lần học, sau đó chuyển sang sử dụng chuỗi khác hoặc có thể tính gradient cho các chuỗi, sau đó lấy giá trị gradient trung bình; (3) chọn các giá trị ban đầu cho các trọng số của mạng một cách ngẫu nhiên. Phan [46] cũng đưa ra một đề xuất mới cho việc tránh các điểm cực trị cục bộ dựa trên thông tin gradient lớn nhất của các chuỗi, chuỗi có gradient lớn nhất sẽ bị loại bỏ khỏi quá trình huấn luyện mạng. Jafari [29] đã đưa ra phương pháp chọn khoảng dự báo tối ưu trong quá trình huấn luyện mạng. Phương pháp này giúp quá trình huấn luyện mạng nhanh hơn và tránh được những vùng giả cực trị.

Có nhiều cấu trúc điều khiển sử dụng mạng nơ-ron khác nhau đã được đề xuất. Trong [25] giới thiệu một số ứng dụng của mạng nơ-ron trong điều khiển như trong điều khiển dự báo, điều khiển tuyến tính hóa phản hồi và điều khiển tham chiếu mô hình.

Việc lựa chọn cấu trúc cho mạng nơ-ron như thế nào cho phù hợp với vấn đề cần giải quyết là vô cùng quan trọng vì nó liên quan đến độ chính xác, thời gian huấn luyện mạng ... Nhưng đến nay vẫn chưa có nghiên cứu nào có thể chỉ ra chính xác điều đó. Gần đây có một số nghiên cứu đã được đề xuất được những kỹ thuật sử dụng để chỉnh định cấu trúc mang trọng quá trình huấn luyện mạng [30, 36, 55, 68] như thêm hoặc bớt nơ-ron đi.

Trong ứng dụng xấp xỉ các hàm phi tuyến, người ta thường sử dụng mạng nơ-ron hướng tâm (Radial Basis Function Neural Network). Theo các tài liệu [18, 42] thì các hàm phi tuyến trơn đáp ứng các điều kiện trong định lý Stone-Weiestrass [19] đều có thể xấp xỉ được bằng mạng nơ- ron RBF với độ chính xác tùy ý. Xu thế ngày nay, thường sử dụng mạng nơ-ron hướng tâm hai lớp bao gồm lớp vào và lớp ra, lớp vào là những nơ-ron hướng tâm, để tăng tốc độ hội tụ thường lựa chọn số lượng lớn, lớp ra là các nơ-ron tuyến tính. Cấu trúc của mạng RBF được mô tả trong

hình 3.2. Trong đó:  1 2 

T n

x x x xn R là véc-tơ đầu vào,

11 21 1

12 22 2

1 2

r l r

l l rl

w w w

W R

w w w



 

 

 

 

 

là ma trận trọng số,  1 2 

T l

h h h hl R là véc-tơ ra của

lớp vào,  1 2 

T r

y y y yr R là véc-tơ đầu ra của mạng RBF. Các đầu ra hi của véc-tơ h được tính như sau:

2 2

2 2 1

exp

i i i

l j

j j

x c b h

x c

 b

  



 

 

   

 

 



(3.30)

với i=1,2,…, l.

Và đầu ra của mạng nơ-ron được tính như sau:

yW hT (3.31)

Hình 3.2: Cấu trúc mạng nơ-ron hướng tâm

Mô phỏng cho trường hợp cẩu treo 2D

Xây dựng bàn thí nghiệm