MẠNG NƠ-RON VÀ ỨNG DỤNG
Lịch sử phát triển mạng nơ-ron
Từ những năm 1890, nhà tâm lý học William đã khám phá hệ nơ-ron thần kinh của con người, mở đầu cho nghiên cứu về mạng nơ-ron Đến năm 1943, Warren McCulloch và Walter Pitts đã phát triển mạng nơ-ron nhân tạo thông qua các mạch điện, đánh dấu sự khởi đầu của lĩnh vực này Vào đầu những năm 1950, Nathanial Rochester thực hiện những mô phỏng đầu tiên của mạng nơ-ron tại IBM, và năm 1956, dự án Dartmouth về trí tuệ nhân tạo đã khởi xướng một giai đoạn mới cho cả trí tuệ nhân tạo và nơ-ron John von Neumann sau đó đã sử dụng role điện áp và đèn chân không để mô phỏng các nơ-ron đơn giản.
Vào năm 1958, nhà sinh học Frank Rosenblatt đã tiến hành nghiên cứu về perception và luật học, phát triển mạng perceptron với khả năng nhận dạng mẫu, nhưng chỉ giải quyết được một số bài toán hạn chế, không áp dụng cho các hàm logic phức tạp Đến năm 1959, Bernard Windrow và Ted Hoff từ Đại học Stanford đã giới thiệu luật học mới và sử dụng nó để huấn luyện mạng nơ-ron tuyến tính thích nghi đầu tiên mang tên MADALINE, có cấu trúc và khả năng tương tự mạng perceptron của Rosenblatt Luật học của Windrow và Hoff vẫn được áp dụng cho đến ngày nay, mặc dù nghiên cứu về lĩnh vực này đã bị tạm dừng trong nhiều thập kỷ sau đó.
Một mạng nơ-ron độc lập đã được phát triển, tương tự như các bộ nhớ mà Kohonen và Anderson nghiên cứu vào năm 1972 Năm 1973, Von Der Marlsburg giới thiệu quá trình học cạnh tranh và mạng tự tổ chức Năm 1974, Paul Werbos phát triển phương pháp lan truyền ngược (Back-propagation), được áp dụng rộng rãi cho đến nay Vào đầu những năm 80, John Hopfield giới thiệu mạng nơ-ron hồi quy, trong khi David Rumelhart và James Mcclelland là những người đầu tiên phát triển thuật toán lan truyền ngược để huấn luyện mạng Perceptron nhiều lớp.
1 download by : skknchat@gmail.com
Vào đầu những năm 1990, Martin Hagan đã đề xuất thuật toán Levenberg-Marquardt để huấn luyện mạng nơ-ron Ngoài ra, phương pháp Bayes cũng được áp dụng phổ biến trong việc đào tạo mạng nhiều lớp.
Trong thời gian này, Lecun cùng đồng tác giả đã nghiên cứu và ứng dụng mạng nơ-ron nhiều lớp, được gọi là mạng tích chập (Convolutional Networks), để xử lý ảnh Mạng nơ-ron này đã được áp dụng rộng rãi trong các lĩnh vực như xử lý ảnh, giọng nói và tín hiệu.
Từ năm 1987, mạng nơ-ron đã thu hút sự chú ý lớn từ các quốc gia, dẫn đến việc tổ chức nhiều hội thảo quốc tế nhằm phát triển công nghệ này Năm 1985, Viện Vật lý Hoa Kỳ đã tổ chức cuộc họp thường niên về ứng dụng mạng nơ-ron trong lĩnh vực tin học, và sau đó, Viện các Kỹ sư Điện và Điện tử IEEE đã tổ chức hội thảo quốc tế đầu tiên về mạng nơ-ron Hàng năm, hội nghị toàn cầu IJCNN (International Joint Conference on Neural Networks) được tổ chức, khẳng định tầm quan trọng và sự phát triển không ngừng của mạng nơ-ron trong nghiên cứu và ứng dụng.
Mạng nơ-ron nhân tạo
Mạng nơ-ron nhân tạo (ANN) là hệ thống tính toán lấy cảm hứng từ cấu trúc của não bộ, bao gồm các đơn vị kết nối gọi là tế bào thần kinh nhân tạo Mỗi khớp giữa các nơ-ron cho phép truyền tín hiệu đến nơ-ron khác, trong khi tế bào thần kinh nhân tạo có khả năng xử lý và truyền tín hiệu xuống các nơ-ron kết nối Các nơ-ron này có trạng thái được biểu thị bằng số thực trong khoảng từ 0 đến 1, và trọng số của chúng có thể thay đổi trong quá trình học tập, ảnh hưởng đến cường độ tín hiệu mà chúng truyền đi.
Nơ-ron thường được sắp xếp thành các lớp, mỗi lớp thực hiện các biến đổi khác nhau trên dữ liệu đầu vào Tín hiệu di chuyển từ lớp đầu vào đến lớp đầu ra cuối cùng, có thể trải qua nhiều lớp trung gian trước khi đạt được kết quả.
Mạng nơ-ron được phát triển với mục tiêu mô phỏng cách giải quyết vấn đề của bộ não con người Qua thời gian, trọng tâm đã chuyển hướng vào việc tối ưu hóa khả năng phù hợp của mạng trong các tác vụ khác nhau.
Tải xuống từ skknchat@gmail.com có khả năng cụ thể, dẫn đến những sai lệch so với sinh học như việc truyền ngược thông tin Điều này cho phép điều chỉnh mạng để phản ánh chính xác thông tin đã được truyền theo hướng ngược lại.
Hình 1.1 Mạng nơ-ron sinh học [8].
Neural Networks đã được áp dụng rộng rãi trong nhiều lĩnh vực như thị giác máy tính, nhận dạng giọng nói, dịch máy, lọc mạng xã hội và chẩn đoán y tế Đến năm 2017, các Neural Networks thường có từ vài nghìn đến vài triệu đơn vị và hàng triệu kết nối Mặc dù số lượng này thấp hơn so với tế bào thần kinh trong não người, nhưng các mạng này có khả năng thực hiện nhiều nhiệm vụ vượt trội hơn con người, chẳng hạn như nhận diện khuôn mặt và chơi cờ "Go".
Ứng dụng của mạng nơ-ron
Mạng nơ-ron hiện đang được ứng dụng rộng rãi trong nhiều lĩnh vực thực tiễn, bao gồm phân loại hình ảnh, giọng nói và tín hiệu, cũng như trong các bài toán xấp xỉ, dự báo, nhận dạng hệ thống và thiết kế bộ điều khiển Dưới đây là một số ứng dụng nổi bật của mạng nơ-ron.
• Điện tử: sự bố trí chíp IC, điều khiển quá trình, phân tích lỗi chip, thị lực máy, tổng hợp tiếng nói, mô hình hóa phi tuyến.
• Robot: điều khiển quỹ đạo, xe nâng hàng, các bộ điều khiển tay máy, các hệ thống thị giác, xe tự hành.
3 download by : skknchat@gmail.com
Ô tô hiện đại tích hợp nhiều hệ thống tiên tiến như dẫn hướng tự động, điều khiển bơm nhiên liệu, và phanh tự động Ngoài ra, các công nghệ dò động cơ không nổ và cảm biến phát hiện khí ảo cũng được trang bị, nhằm nâng cao hiệu suất và an toàn cho người lái.
Sản xuất bao gồm việc điều khiển quá trình sản xuất, phân tích và thiết kế sản phẩm, cũng như chuẩn đoán máy móc và quy trình Các hoạt động như nhận dạng hạt thời gian thực, kiểm tra chất lượng, thử bia, phân tích chất lượng hàn, dự đoán chất lượng giấy, và phân tích chất lượng chip máy tính đều đóng vai trò quan trọng Bên cạnh đó, việc phân tích hoạt động nghiền, thiết kế sản phẩm hóa học, bảo trì máy móc, đấu thầu dự án, quản lý và lập kế hoạch, cùng với mô hình động của các quá trình hóa học cũng là những yếu tố thiết yếu trong ngành sản xuất.
• Vũ trụ, ngân hàng, quốc phòng, giải trí, tài chính, bảo hiểm, y tế, dầu khí, an ninh, giao thông và truyền thông [3].
Mô hình nơ-ron nhân tạo
1.4.1 Mô hình nơ-ron a) Mô hình nơ-ron một đầu vào
Hình 1.2 Sơ đồ mô hình nơ-ron một đầu vào
Sơ đồ cấu trúc của một nơ-ron nhân tạo với một đầu vào được biểu thị trong Hình 1.2 Quan hệ giữa đầu vào và đầu ra của nơ-ron được mô tả bằng công thức n = wp + b, trong đó p là đầu vào, w là trọng số đầu vào, b là ngưỡng (bias), và Σ là bộ tổng số.
4 download by : skknchat@gmail.com n : là đầu vào net f : là hàm truyền a : đầu ra của nơ-ron Một số hàm truyền cơ bản: [3].
Hàm giới hạn cứng Hardlim: a = hardlim(n)
= 1 1+ e −n Hàm tuyến tính dương: a = posline(n)
Hàm khuếch đại bão hòa: a = satlins (n)
Vì bài toán này chỉ sử dụng đến hàm tansig nên chỉ nghiên cứu về hàm tansig
5 download by : skknchat@gmail.com Đồ thị hàm tansig(n) được biểu diễn như sau:
Hình 1.3 Đồ thị hàm a=tansig(n) [7].
Hàm này có giá trị dương trong khoảng từ -1 đến 1, có đạo hàm liên tục với mọi n, và thường được áp dụng trong các lớp ẩn của mô hình nơ-ron với nhiều đầu vào.
Hình 1.4 Mô hình nơ-ron với R đầu vào
Hình 1.5 Sơ đồ rút gọn nơ-ron với R đầu vào
Nơ-ron có nhiều đầu vào được mô tả như hình 1.4, trong đó đầu vào là một véc-tơ p có R thành phần:
6 download by : skknchat@gmail.com p =[ p1, p2, , pR] T (1.9) và véc-tơ trọng số như sau: w =[w , w , , w ]
Mỗi đầu vào pi sẽ được đưa vào bộ tổng thông qua một trọng số vào net được tính theo công thức sau: n =w p +w p + + w p +b
1,1 1 1,2 2 1,R R Đầu ra của nơ-ron là: w 1,i Đầu
Với f là hàm truyền nơ-ron Công thức (1.11) có thể được viết gọn như sau:
Khi nhiều nơ-ron chia sẻ cùng một đầu vào, chúng được gọi là một lớp nơ-ron Số đầu ra của lớp này tương ứng với số lượng nơ-ron có chung đầu vào Trong mỗi lớp, các hàm truyền thường được lựa chọn giống nhau, ví dụ như sử dụng hàm tuyến tính Cấu trúc của một lớp nơ-ron có thể được minh họa như hình 1.6, trong đó đầu ra của nơ-ron thứ i được biểu diễn là ai = fi(ni).
T T 12 m của lớp sẽ là a = f (n) , trong đó: n = Wp + b và f =[ f1 f3 f m ] T
7 download by : skknchat@gmail.com
Hình 1.6 Sơ đồ cấu trúc của một lớp nơ-ron [3].
• Cấu trúc mạng một lớp
Hình 1.7 Cấu trúc mạng nơ-ron 1 lớp
Cấu trúc toán học của mạng nơ-ron một lớp với R đầu vào và S nơ-ron được mô tả trong hình 1.7 Trong mạng này, mỗi phần tử của véc-tơ đầu vào p được kết nối với đầu vào của mỗi nơ-ron thông qua ma trận trọng số W Bộ cộng của nơ-ron thứ i thu thập các trọng số liên kết đầu vào và độ dốc, từ đó tạo ra đầu ra vô hướng ni Các đầu ra ni này sẽ được sử dụng trong quá trình xử lý tiếp theo.
8 download by : skknchat@gmail.com hợp với nhau tạo thành s phần tử của véc-tơ vào n Cuối cùng ở lớp nơ-ron thu được véc-tơ a gồm s phần tử.
Có thể dễ dàng thiết lập lớp đơn của các nơ-ron với các hàm truyền khác nhau bằng cách đặt song song hai mạng Tất cả các mạng này có thể chia sẻ đầu vào chung, trong khi mỗi mạng có thể tạo ra một số đầu ra riêng biệt.
Các phần tử của véc-tơ đầu vào được đưa vào mạng thông qua ma trận trọng số W , với: w11 w
Chỉ số hàng trong các phần tử của ma trận W xác định nơ-ron đích, trong khi chỉ số cột xác định nơ-ron nguồn của trọng liên kết Để đơn giản, ta ký hiệu một mạng nơ-ron gồm S nơ-ron và R đầu vào như hình 1.8.
Hình 1.8 Sơ đồ rút gọn mạng một lớp R đầu vào và S nơ-ron
Trong hình 1.8 có véc-tơ vào P có kích thước R, ma trận trọng liên kết W có kích thước SxR, còn a và b là các véc-tơ có kích thước S, b là bias.
Một mạng nơ-ron có thể có một vài lớp Mỗi lớp có ma trận trọng số W , bias b và đầu ra a
Mạng nơ-ron 3 lớp được mô tả qua sơ đồ cấu trúc trong hình 1.9, bao gồm R đầu vào và các nơ-ron S i ở lớp i, với aS i i là đầu ra của lớp i, trong đó i = 1, 2, 3 Hình 1.10 trình bày sơ đồ rút gọn của mạng nơ-ron 3 lớp để dễ hiểu hơn.
9 download by : skknchat@gmail.com
Hình 1.9 Cấu trúc mạng nơ-ron 3 lớp
Hình 1.10 Sơ đồ rút gọn mạng nơ-ron 3 lớp
Mạng hồi quy (mạng phản hồi) là loại mạng tự liên kết thành các vòng và liên kết hồi quy giữa các nơ-ron [2].
Khi các hàm liên thuộc có dạng Gaussmf, độ thỏa mãn được tính bằng công thức PROD α i = α i,1 α i,2 α i,m, trong đó các hàm gi là các hằng số Mô hình mờ Sugeno có thể được biểu diễn dưới dạng y′ = θ T Φ( x).
10 download by : skknchat@gmail.com trong đó θ= [ y1 , y2 , , yn ] T , Φ( x) =[α 1 ( x),α 2 ( x), ,α n ( x)] T , x =[ x1, x2 , , x m ] T m và α i (x) = ∑ à A j, i ( x j ) Cụng thức (1.16) cú quan hệ vào ra của mạng xuyờn tõm j=1
Hàm α i (x) trong mạng nơ-ron được gọi là các hàm cơ sở hoặc hàm truyền, trong khi θ đại diện cho véc-tơ trọng số của mạng.
Mạng RBF gồm hai lớp Lớp thứ nhất gồm các nơ-ron với hàm truyền như sau: ai 1
Hàm truyền của nơ-ron i được xác định bởi công thức e −( ni 1 ) 2, trong đó ni 1 là khoảng cách giữa véc-tơ đầu vào p và véc-tơ trọng số w 1 i, với b 1 là ngưỡng của nơ-ron i Khoảng cách này được tính bằng || p − (w 1 i) T || Khi ngưỡng b 1 bằng 1/(σ 2), trong đó σ là độ lệch chuẩn, hàm truyền sẽ có dạng cụ thể hơn.
Gaussmf Lớp thứ hai có hàm truyền là tuyến tính: a 2 = W 2 a 1 + b 2 (1.19)
Mạng này thường được sử dụng để xấp xỉ các thành phần bất định của tượng trong quá trình thiết kế bộ điều khiển.
Hình 1.11 Sơ đồ mạng hồi quy
11 download by : skknchat@gmail.com
Ứng dụng trong điều khiển
Để thiết kế bộ điều khiển cho hệ thống phản hồi đầu ra, điều quan trọng đầu tiên là phải hiểu rõ đối tượng cần điều khiển, thông qua một mô hình toán học chính xác Việc thiếu hiểu biết về đối tượng sẽ cản trở khả năng điều khiển hiệu quả Chất lượng của bộ điều khiển được tổng hợp phụ thuộc nhiều vào độ chính xác của mô hình mô tả đối tượng; mô hình càng chính xác, hiệu suất điều khiển càng cao.
Hình 1.12 điều khiển theo nguyên tắc phản hồi đầu ra [2].
Việc xây dựng mô hình cho đối tượng gọi là mô hình hóa Thường phân chia các mô hình hóa làm hai loại:
Một số bài toán trong nhận dạng:
- Nhận dạng trực tuyến mô hình không tham số hệ tuyến tính
- Nhận dạng chủ động tham số mô hình AR
- Nhận dạng tham số mô hình ARMA.
1.5.2 Thiết kế bộ điều khiển Để thiết kế bộ điều khiển có các cách sau:
- Bộ điều khiển theo mô hình mẫu
- Điều khiển thích nghi trực tiếp
- Điều khiển thích nghi gián tiếp
- Điều khiển sử dụng ADP
Để thiết kế bộ điều khiển nơ-ron, cần có tín hiệu vào ra mẫu, trong đó sử dụng một mô hình mẫu thể hiện đáp ứng đầu ra mong muốn Đáp ứng quá độ của hệ kín cần đảm bảo thời gian xác lập và độ quá điều chỉnh theo yêu cầu, do đó có thể lựa chọn mô hình mẫu là một khâu ổn định, có thể là quán tính hoặc dao động.
Bộ điều khiển nơ-ron thường có cấu trúc mạng hồi quy với hai lớp Mạng vòng điều khiển phản hồi sử dụng giá trị đặt làm đầu vào cho mạng NNc, trong khi đầu ra của mạng NNc sẽ được đưa vào đầu vào của mạng NNp Như vậy, đầu vào của mạng NN là giá trị đặt và đầu ra là kết quả từ mạng NNp Để thiết kế bộ điều khiển NNc, quá trình huấn luyện mạng NN sẽ sử dụng bộ tín hiệu vào ra mẫu, trong đó chỉ điều chỉnh các tham số của mạng NNc, trong khi các tham số của mạng NNp sẽ giữ nguyên giá trị đã xác định từ quá trình nhận dạng.
Mạng nơ-ron thường được cấu trúc dưới dạng mạng sâu với ít nhất bốn lớp, bao gồm hai lớp đầu vào và đầu ra Đây là một mạng hồi quy có tối thiểu ba vòng phản hồi, yêu cầu sử dụng thuật toán lan truyền ngược để tính toán gradient.
Bài toán thiết kế bộ điều khiển mạng nơ-ron trở thành bài toán nhận dạng hệ thống với cấu trúc phức tạp hơn Để thiết kế bộ điều khiển dự báo bằng mạng nơ-ron, cần phải xây dựng một mô hình toán cho đối tượng trước tiên.
Mô hình mạng nơ-ron được sử dụng để dự đoán đầu ra của đối tượng trong tương lai Tiếp theo, thuật toán tối ưu sẽ được áp dụng để xác định tín hiệu điều khiển tối ưu, dựa trên hàm mục tiêu đã định.
J = ∑ [y d + ρ ∑[ u( t + k −1) − u( t + k −2)] 2 k= N 1 k=1, trong đó N2 − N1 là tầm dự báo, Nu là tầm điều khiển, u là tín hiệu điều khiển, yd là đầu ra mong muốn và yp là đầu ra của mô hình nơ-ron của đối tượng NNp.
13 download by : skknchat@gmail.com
Hàm mục tiêu (1.20) sẽ được giải quyết trực tuyến, cho phép tìm ra các giá trị tối ưu của tín hiệu điều khiển trong khoảng thời gian u* = [u*(t), u*(t + 1), u*(t + Nu - 1)], với t là thời điểm hiện tại Khi đến thời điểm t + 1, giá trị u*(t) sẽ được sử dụng để điều khiển đối tượng tại thời điểm tiếp theo Sau đó, hàm mục tiêu (1.20) sẽ được giải quyết trực tuyến một lần nữa để tìm ra giá trị tối ưu cho chu kỳ tiếp theo Để giải bài toán tối ưu này, thường áp dụng phương pháp hạ sâu nhất hoặc phương pháp bình phương cực tiểu sau khi đã tuyến tính hóa mô hình mạng nơ-ron của đối tượng.
Xét đối tượng phi tuyến có dạng như sau: [3]. x ( n) = f (x, x, , x ( n −1) )+ bu (1.21) trong đó
, u là tín hiệu đầu vào, f và b > 0 là các hàm số và hằng số x dt i chưa biết,
( n−1) T y = x là đầu ra của đối tượng Đặt x = [x, x, , x ]
Bài toán đặt ra là thiết kế bộ điều khiển mờ trực tiếp uD = uD ( x| θ) y → ym , trong đó ym là đầu ra mong muốn hay giá trị đặt.
Bộ điều khiển mờ trực tiếp có dạng như sau: uD =θ T ζ ( x) trong đó ζ(x) là véc-tơ các hàm cơ sở.
Tín hiệu điều khiển lý tưởng trong các trường hợp hệ xác định là : u* = 1 b [− f ( x) + ym (n ) + k T e]
Thay (1.22) vào (1.23), sau khi biến đổi được: e ( n) = −k T e + b(u* −u D ) với k =[k , k , , k ] T
(1.24) Định nghĩa e = [e, e, , e (n−1) ] T Có thể viết lại (1.24) dưới dạng phương trình trạng thái như sau: e = Λe +b[u * −ue +b[u * −uD (x,θ)] download by : skknchat@gmail.com trong đó:
Gọi sai số xấp xỉ là: w= uD ( x,θ*) − u*
Với θ* là véc-tơ tham số tối ưu của hệ mờ Viết lại phương trình (1.25) thu được:
(1.28) e = Λe +b[u * −ue + b(θ* −θ) ζ ( x) − bw Chọn hàm Lyapunov:
Với γ > 0 Đạo hàm V thu được:
2 e Qe+ −θ) [γe p n ζ( x) −θ] − e p n γ trong đó pn là véc-tơ cột cuối cùng của ma trận P
Giá trị riêng nhỏ nhất của ma trận Q được ký hiệu là λ Khi sai lệch nằm ngoài miền min Γ ={e|e|< 2 | p n w |}, thì V sẽ nhỏ hơn 0 Điều này cho thấy rằng sai lệch điều khiển sẽ hướng về λ min trong vùng Γ, nơi có chứa gốc 0.
15 download by : skknchat@gmail.com d) Điều khiển thích nghi gián tiếp x = f ( x, x, , x ) + g( x, x, , x ) u (1.33)
( n) ( n−1) ( n−1) trong đó x ( i) = d i là đạo hàm bậc i của x, u là tín hiệu đầu vào, f và g là các dt i hàm số chưa biết, y = x là đầu ra của đối tượng.
Bài toán đặt ra là thiết kế bộ điều khiển sao cho y → ym , trong đó ym là đầu ra mong muốn hay giá trị đặt.
Mô hình xác định Đầu tiên xét trường hợp các hàm số f và g là xác định. Đặt x = [x, x, , x ( n−1) ] T
Khi đó phương trình (1.14) có dạng: x ( n) = f ( n) + g(x)u (1.34) Đặt e = y − y và e = [e, e, , e (n−1) ] T m
Thiết kế bộ điều khiển cho hệ cho mô hình xác định (1.34) như sau: u* = 1 [− f ( x) + ym (n) + k T e] (1.35) g(x) với k =[ k1, k2 , , kn ] T Thay bộ điều khiển (1.35) vào (1.34) được: e ( n) + k s n −1 + k − s n −2 + + k = 0 n n 1 1
Như vậy đa thức trên sẽ ổn định nếu như đa thức sau là Hurwitz (điểm cực nằm bên trái trục ảo): n n −1 n −2
Tóm lại, khi đối tượng (1.33) xác định thì với bộ điều khiển (1.35) thỏa mãn điều kiện (1.36) là đa thức Hurwitz sẽ làm cho hệ thống ổn định.
Khi mô hình của đối tượng (1.33) là bất định, các hàm bất định f x và g (x) sẽ được xấp xỉ bởi các mạng nơ-ron như sau:
16 download by : skknchat@gmail.com fˆ
Trong mô hình (x,θ) = θ T ς(x) f f gˆ(x, θ) = θη(x) T g, ζ(x) và η(x) đại diện cho các véc-tơ hàm cơ sở, thường sử dụng hàm gaussmf Các véc-tơ tham số θ f và θ g được xác định ở đầu ra của mạng xuyên tâm.
Khi đó bộ điều khiển mờ thích nghi gián tiếp được thiết kế như sau sẽ làm cho hệ ổn định.
1 ˆ (n ) T u I = [− f ( x,θ f ) + y m + k e] gˆ(x,θ g ) với luật chỉnh định thích nghi là :
(1.39) trong đó P là ma trận đối xứng xác định dương thỏa mãn phương trình Lyapunov và k được chọn như ở trên.
Thay (1.38) vào (1.33) và biến đổi được:
Viết lại dưới dạng ma trận có: ˆ( x,θ ) − f( x)] +[ ˆg( x,θ ) − g( x)] u} e = Λe +b[u * −ue + b{[ f f g trong đó:
Kí hiệu θ * và θ * là các tham số tối ưu của hệ mờ (mạng nơ-ron) Khi đó có thể f g viết lại phương trình (1.41) dưới dạng sau: ˆ * *
17 download by : skknchat@gmail.com với ˆ *
* g( x)] uI w = [ f (x,θ f x,θ g ) − Định nghĩa hàm Lyapunov:
1 2 với P thỏa mãn phương trình Lyapunov: Λe +b[u * −u T P+PΛe +b[u * −u=−Q trong đó Q là ma trận đối xứng xác định dương Đạo hàm (1.44) có:
Theo luật thích nghi và bộ điều khiển, điều kiện V < 0 được xác định khi véc-tơ sai lệch e nằm ngoài miền hấp dẫn, tức là e không thuộc Γ và |e| ≤ Pbw, với λ là giá trị riêng nhỏ nhất của ma trận Q Do đó, hệ thống sẽ duy trì sự ổn định.
1.5.3 Ứng dụng trong cánh tay Robot một bậc tự do Định nghĩa theo tiêu chuẩn AFNOR (Pháp): Robot công nghiệp là một cơ cấu chuyển động tự động có thể lập trình, lặp lại các chương trình, tổng hợp các chương trình đặt ra trên các trục toạ độ; có khả năng định vị , định hướng , di chuyển các đối tượng vật chất: chi tiết, đạo cụ, giá lắp theo những hành trình thay đổi đã chương trình hoá nhằm thực hiện các nhiệm vụ công nghệ khác nhau
Robot, theo định nghĩa của Viện Robot Hoa Kỳ (RCA), là một tay máy vạn năng có khả năng lặp lại các chương trình nhằm di chuyển vật liệu, chi tiết, dụng cụ hoặc thiết bị chuyên dụng thông qua các chương trình chuyển động linh hoạt để thực hiện nhiều nhiệm vụ khác nhau Trong khi đó, theo tiêu chuẩn GHOCT 25686-85 của Nga, robot công nghiệp được mô tả là một máy tự động, có thể cố định hoặc di động, kết nối giữa tay máy và hệ thống điều khiển theo chương trình, với khả năng lập trình lại để thực hiện các chức năng vận động và điều khiển trong quy trình sản xuất.
18 download by : skknchat@gmail.com
Robot công nghiệp là thiết bị tự động linh hoạt, có khả năng thay thế một phần hoặc toàn bộ các hoạt động cơ bắp và trí tuệ của con người, phù hợp với nhiều ứng dụng khác nhau.
Kết luận chương 1
Chương 1 đã tóm tắt lịch sử hình thành và phát triển của mạng nơ-ron từ năm 1980 đến nay, đồng thời khám phá khái niệm, mô hình và cấu trúc của mạng nơ-ron nhân tạo Với sự phát triển mạnh mẽ trong thực tiễn, mạng nơ-ron hiện đang được ứng dụng rộng rãi trong cả nghiên cứu điều khiển và lĩnh vực công nghiệp.
Trên cơ sở tính năng của mạng nơ-ron trong điều khiển, từ đó có thể nhận dạng được hệ thống, hay thiết kế bộ điều khiển.
Các chương tiếp theo sẽ phân tích chi tiết việc ứng dụng mạng nơ-ron trong phương pháp điều khiển dự báo, tập trung vào việc thiết kế bộ điều khiển dự báo cho cánh tay máy có một bậc tự do.
19 download by : skknchat@gmail.com
PHƯƠNG PHÁP ĐIỀU KHIỂN DỰ BÁO DỰA TRÊN MẠNG NƠ-
Phương pháp điều khiển dự báo
Điều khiển hệ thống là quá trình can thiệp vào đối tượng điều khiển nhằm điều chỉnh và biến đổi nó để đạt được chất lượng mong muốn.
Tối ưu hóa trong điều khiển hệ thống là quá trình lựa chọn các tham số điều khiển phù hợp nhằm đạt được chất lượng tối ưu cho hệ thống Bài toán này được gọi là điều khiển tối ưu tĩnh, hay còn được biết đến với tên gọi tối ưu hóa.
Điều khiển dự báo, ra đời từ những năm 1960, đã trở thành chiến lược phổ biến trong điều khiển quá trình công nghiệp (Richalet, 1993) Bộ điều khiển này sử dụng mô hình để dự đoán phản ứng tương lai của đối tượng tại các thời điểm rời rạc trong một khoảng thời gian nhất định, gọi là phạm vi dự báo Dựa trên phản ứng dự báo, thuật toán tối ưu hóa được áp dụng để tính toán chuỗi tín hiệu điều khiển tương lai trong phạm vi điều khiển, nhằm giảm thiểu sai lệch giữa phản ứng dự đoán và tín hiệu chuẩn Phương pháp điều khiển dự báo là một cách tiếp cận tổng quát, có thể áp dụng cho cả hệ thống tuyến tính và phi tuyến.
Điều khiển dự báo là một phương pháp chủ yếu được sử dụng cho các quá trình, với chất lượng hệ thống điều khiển phụ thuộc vào bài toán tối ưu hóa và thuật toán tìm nghiệm tối ưu cho bài toán đó.
Hình 2.1 mô tả cấu trúc cơ bản của một hệ thống điều khiển dự báo Nó gồm ba phần chính như sau:
Hàm mục tiêu Q(p) được thiết lập với nguyên tắc rằng nghiệm tối ưu của nó sẽ tối thiểu hóa tổng bình phương các sai lệch e_k+i, với i = 0, 1, 2,…, M − 1, giữa tín hiệu ra dự đoán ˆy_k+i trong toàn bộ khoảng thời gian dự báo.
[ k, k + M ), kể từ thời điểm k hiện tại, và tín hiệu đặt w k+i , đạt giá trị nhỏ nhất.
Mô hình dự báo được áp dụng để ước lượng các tín hiệu đầu ra yˆk+ i dựa trên giá trị đầu vào trong quá khứ tại thời điểm k + i, cụ thể là xác định yˆ k+ i = ϕ i.
Các thuật toán tìm nghiệm cho bài toán tối ưu rất đa dạng, nhưng những thuật toán giải tích và các thuật toán lặp trực tuyến với tốc độ hội tụ nhanh là phù hợp nhất cho điều khiển dự báo.
Các phương pháp trong điều khiển dự báo: b) Điều khiển dự báo theo hệ tuyến tính
Bộ điều khiển dự báo được gọi là tuyến tính khi mô hình dự báo là tuyến tính Hệ LTI (tuyến tính tham số hằng) có bốn mô hình toán học tương đương nhau.
Tương ứng cũng sẽ có bốn mô hình dự báo và từ đó là bốn phương pháp điều khiển dự báo tuyến tính khác nhau, bao gồm:
• Điều khiển dự báo theo mô hình MAC (Model Algorithmic Control)
• Ma trận động học điều khiển DMC (Dynamic Matrix Control)
21 download by : skknchat@gmail.com
• Điều khiển dự báo tổng quát GPC (Generalized Predictive Control)
Bộ điều khiển dự báo phản hồi trạng thái là một công cụ quan trọng trong việc điều khiển hệ thống song tuyến Phương pháp này được áp dụng cho từng bài toán cụ thể, giúp tối ưu hóa hiệu suất và cải thiện độ chính xác trong các ứng dụng thực tiễn.
• Điều khiển ổn định hệ
• Điều khiển bám tín hiệu mẫu ở đầu ra
Phương pháp điều khiển dự báo dựa trên mạng nơ-ron
2.2.1 Nhận dạng dùng mạng nơ-ron Định nghĩa nhận dạng: Nhận dạng là phương pháp thực nghiệm để xác định một mô hình cụ thể trong lớp các mô hình thích hợp, sao cho sai lệch giữa mô hình đó với hệ thống là nhỏ nhất.[3]
Bài toán nhận dạng có ba đặc điểm để nhận biết đó là:
+ Thực nghiệm, nhận biết qua việc đo các tín hiệu vào và ra.
+ Lớp các mô hình thích hợp, có được từ những thông tin ban đầu về thống (gọi chung lại là thông tin A-priori ).
Sai lệch giữa mô hình thu được và hệ thống thực tế là tối thiểu, điều này được xác định thông qua hàm mục tiêu mô tả sai lệch và được thực hiện bằng phương pháp tối ưu.
Dựa trên các định luật cơ bản như định luật bảo toàn năng lượng, bảo toàn vật chất, Newton, Kirchhoff và Ohm, có thể xây dựng mô hình toán cho các hệ thống Việc xác định các tham số của mô hình toán có thể thực hiện thông qua dữ liệu đầu vào và đầu ra hoặc ước lượng trực tiếp Tuy nhiên, trong ngành công nghiệp, đặc biệt là trong các hệ thống truyền nhiệt và động học chất lỏng, việc xây dựng mô hình toán trở nên phức tạp, do đó, mạng nơ-ron nhân tạo được sử dụng để giải quyết vấn đề này.
Mạng nơ-ron nhiều lớp có khả năng xấp xỉ gần đúng bất kỳ hàm nào Quá trình huấn luyện là bước quan trọng để điều chỉnh các thông số của mạng cho một nhiệm vụ cụ thể.
22 download by : skknchat@gmail.com
Hiện nay có rất nhiều phương pháp huấn luyện mạng Chúng có thể huấn luyện mạng bằng các phương pháp như:
• Dùng thuật toán lan truyền ngược
• Sử dụng công cụ Matlab huấn luyện nơ-ron như:
- Tạo mạng nơ-ron mô phỏng trong Matlab
- Các hàm huấn luyện mạng nơ-ron trong Matlab
Trong bài toán này sẽ sử dụng Matlab để huấn luyện mạng, mà phương pháp dùng sẽ là Thuật toán lan truyền ngược. a) Thuật toán lan truyền ngược
Xét một mạng truyền thẳng với M lớp, R đầu vào và S đầu ra Cho tập dữ liệu mẫu Ω = {p i ;t i }, với i = 1, 2, ,Q, trong đó p i là đầu vào mẫu thứ i và t i là đầu ra mẫu thứ i (đích) Định nghĩa hàm mục tiêu cho mạng này.
Để tìm các trọng số tối ưu của mạng nơ-ron, phương pháp gradient ngẫu nhiên được áp dụng cho mẫu thứ q, với đầu ra của mạng được biểu diễn bởi a M và đầu vào tương ứng là pq Công thức tính toán được thể hiện qua m m ∂J q, giúp tối ưu hóa hiệu suất của mạng.
Trong đó, trọng số của nơ-ron thứ i thuộc lớp m liên kết với đầu ra của nơ-ron thứ j thuộc lớp m −1 được ký hiệu là w m (k) Giá trị hiện tại được biểu thị bằng k, trong khi giá trị mới là k +1 Tốc độ học được ký hiệu là α, với điều kiện α > 0.
23 download by : skknchat@gmail.com Đối với ngưỡng có: m
(2.3) bi = bi (k) − α ∂bm i trong đó b m ngưỡng nơ-ron thứ i thuộc lớp m i
Việc tính ∂J q rất phức tạp khi mạng có nhiều lớp Do đó dùng quy tắc đạo
∂w ∂n ∂w Trong đó a = f (n) và n = wp + b 0 Áp dụng quy tắc trên cho (2.2), có:
Nhưng n m là đầu vào net của nơ-ron thứ i thuộc lớp m, do đó nó là một i hàm tuyến tính của các trọng số và ngưỡng, có:
S m− 1 ni m = bi m + ∑ w i m ,v a v m−1 (2.6) v =1 trong đó av m−1 là đầu ra của nơ-ron thứ v thuộc lớp trước đó m −1 Vì vậy, được:
∂w i, j Định nghĩa độ nhạy của nơ-ron thứ i của lớp m là: m= ∂J q
24 download by : skknchat@gmail.com và bi m (k+1) = bi m ( k) − αsi m
Biểu diễn dưới dạng ma trận có:
∂n i là véc-tơ độ nhạy của lớp m. Lại có:
25 download by : skknchat@gmail.com
Sử dụng công thức (2.15) và quy tắc chuỗi có: s m = ∂J q
Từ công thức này, ta có thể tính độ nhạy của các lớp trong mạng nơ-ron theo thứ tự từ lớp đầu ra ngược về lớp đầu vào, cụ thể là s M → s M −1 → s 2 → s 1 Đây là nền tảng của thuật toán lan truyền ngược, bắt đầu từ việc tính độ nhạy của lớp đầu ra cho mẫu thứ q.
26 download by : skknchat@gmail.com si M = ∂J q
Do đó véc-tơ độ nhạy của lớp đầu ra là: s
= −2F Tổng kết lại có thuật toán lan truyền ngược:
• Quá trình khởi tạo mạng: Chọn giá trị ban đầu cho tất cả các trọng số và ngưỡng trong mạng.
• Quá trình lan truyền thuận a 0 = p (2.20) a m+1 = f m+1 (W m+1 a m + b m+1 )
• Quá trình lan truyền ngược độ nhạy. s
• Quá trình cập nhật các tham số của mạng.
Công thức tính từ (2.20) đến (2.26) được xem là huấn luyện ngẫu nhiên, vì các tham số của mạng được cập nhật sau mỗi lần sử dụng một bộ tín hiệu vào ra mẫu thứ q.
27 download by : skknchat@gmail.com
Quá trình huấn luyện theo mẻ diễn ra khi tất cả các mẫu được sử dụng đồng thời để cập nhật tham số của mạng một lần Công thức cập nhật các tham số cho mạng trong quá trình này được biểu diễn như sau: m (k+1) m α Q m m−1.
Q ∑ q=1 s q trong đó chỉ số q tương ứng với mẫu thứ q
Đối với mỗi mẫu q, cần tính toán đầu ra và độ nhạy của các lớp trong mạng, sau đó xác định giá trị gradient trung bình trước khi tiến hành cập nhật tham số của mạng Phương pháp này là một phần quan trọng trong quá trình tối ưu hóa hàm mục tiêu.
Để tối ưu hóa các tham số của mạng nơ-ron nhằm nâng cao khả năng phân loại và học tập, phương pháp tối ưu hóa hàm mục tiêu được áp dụng Phương pháp này tính toán bằng cách bình phương sai lệch giữa đầu ra của mạng nơ-ron và đầu ra mẫu, từ đó phụ thuộc vào các tham số của mạng.
Để tối ưu hóa hàm mục tiêu F(x) với véc-tơ biến số x = [x1 x2 xm]T, chúng ta cần tính tổng bình phương sai lệch giữa đầu ra của mạng và đầu ra mẫu, tạo thành một hàm phi tuyến không âm Mục tiêu là tìm giá trị x* sao cho F đạt giá trị nhỏ nhất Phương pháp lặp được sử dụng để tìm nghiệm x k+1 trong quá trình tối ưu hóa.
Với α k > 0 là tốc độ học ở lần hiện tại k. p k là hướng tìm.[3].
- Phương pháp hạ sâu nhất (Steepest descent)
28 download by : skknchat@gmail.com a) Phương pháp hạ sâu nhất (Steepest descent)
Theo phương pháp lặp, sau mỗi vòng lặp mong muốn:
Khai triển Taylor hàm F xung quanh x k và xấp xỉ bậc nhất, có:
∂x x= x k là véc-tơ gradient của hàm F theo vec-tơ x là: x k = x k+1 − x k
= α k pk Điều kiện (2.29) thỏa mãn khi: g T k ∆x k = α k g T k p k < 0 Suy ra
Giả sử độ lớn của véc-tơ hướng tìm p k nhỏ nhất khi hai véc-tơ này ngược chiều nhau: p k = −g k
Thay (2.35) vào (2.30) có: không đổi, khi đó g T k pk đạt giá trị
Phương pháp hạ sâu (steepest descent) được mô tả bằng công thức (2.35) x k +1 = x k −α k g k, trong đó hướng tìm được xác định ngược lại với véc-tơ gradient, giúp giảm tối đa giá trị hàm mục tiêu.
29 download by : skknchat@gmail.com
30 download by : skknchat@gmail.com b) Phương pháp Newton
Phương pháp này xuất phát từ thuật toán lặp Newton để tìm nghiệm của đa thức, sau đó được Raphson mở rộng nhằm tìm nghiệm cho hệ phương trình phi tuyến khả vi: f(p) = 0 với f thuộc R n và p thuộc R n.
Trước tiên gọi p * là nghiệm của (2.37) f1( p*) 0 f ( p*) = 0 ⇔ =
Phân tích (2.38) thành chuỗi Taylor tại điểm pk rồi bỏ qua tất cả các thành phần bậc cao trong chuỗi, sẽ được:
0 = f ( p*) ≈ f ( pk ) + Hk ( p* −pk ) (2.39) Trong đó:
H k là ma trận Jacobi của vector hàm f ( p) tại điểm p k
⇒ pk +1 = pk − H k Áp dụng thuật toán Newton-Raphson trên bài toán tối ưu không ràng buộc tìm được nghiệm p * cho hệ phương trình (2.37): p*= argminQ (p ) (2.41)
Khi Q( p) là khả vi hai lần sẽ có từ kết luận:
31 download by : skknchat@gmail.com
=> trong đó: gradQ (p*) = 0 ⇔ f (p*) = (0) với f ( p) = gradQ(p) pk+1 = pk − H k −1gradQ (p k) (2.42)
∂p n p = p k được gọi là ma trận Hesse của hàm vô hướng Q( p) tại điểm pk Do Q( p) được giả thiết là khả vi hai lần nên H k là ma trận đối xứng vì:
Kết luận: Từ đây dễ dàng kiểm chứng được tính đúng đắn của một số kết luận sau về phương pháp Newton-Raphson:
- Nếu H k xác định dương thì Q( pk+1) < Q( pk ) Thật vậy, từ (2.42), tức là từ: pk +1 − pk = −H k −1gradQ (p k) hay: gradQ (p k
) T H −1 gradQ (p ) < 0 k k thấy góc ϕ tạo bởi hai vector pk +1 − pk và gradQ (p k ) phải lớn hơn 90 o , nên cũng phải có Q( pk+1) < Q( pk )
- Phương pháp Newton-Raphson cũng được áp dụng cho cả bài toán tối ưu tìm được giá trị cực đại: p*= argmaxQ(p)
Tuy nhiên khi đó phải luôn là ma trận xác định âm ở mỗi bước lặp.
- Phương pháp Newton-Raphson (2.42) cũng là một dạng phương pháp line search với hướng tìm:
32 download by : skknchat@gmail.com hk = −H k −1gradQ (p k ) và khoảng cách bước tìm s k =1
Kết luận chương 2
Trong chương 2, chúng ta đã nghiên cứu về phương pháp dự báo và các kỹ thuật điều khiển dự báo sử dụng mạng nơ-ron Dựa trên những kiến thức này, có thể thiết kế một bộ điều khiển dự báo cho một đối tượng cụ thể Ở chương tiếp theo, chúng ta sẽ tập trung vào việc tìm hiểu và thiết kế bộ điều khiển dự báo cho cánh tay máy một bậc tự do.
45 download by : skknchat@gmail.com
THIẾT KẾ BỘ ĐIỀU KHIỂN DỰ BÁO CHO CÁNH TAY MÁY MỘT BẬC TỰ DO
Mô hình toán của cánh tay máy một bậc tự do
Robot công nghiệp là thiết bị tự động đa năng, với cơ cấu tay máy được thiết kế để giữ vật kẹp theo một hướng cố định và di chuyển linh hoạt trong khu vực làm việc Để đạt được điều này, cơ cấu tay máy cần có một số bậc tự do chuyển động nhất định.
Bậc tự do là khả năng chuyển động của một cơ cấu, bao gồm cả chuyển động quay và tịnh tiến Để di chuyển một vật thể trong không gian, cơ cấu chấp hành của robot cần có một số bậc tự do nhất định Thông thường, cơ cấu hệ của robot được coi là một cơ cấu hở Số bậc tự do của cánh tay robot có thể được tính toán bằng một công thức cụ thể.
5 w = 6n − ∑ipi i =1 với n là số khâu động, pi là số khớp loại i, i = 1,2,3 ,5 là số bậc tự do bị hạn chế.
Cánh tay robot, hay tay máy, là một cấu trúc cơ khí được hình thành từ các khâu liên kết thông qua các khớp động, cho phép thực hiện những chuyển động cơ bản của robot.
Chiều cài của cánh tay được ký hiệu là l, khối lượng là m, và góc quay của khớp cánh tay được biểu thị bằng ϕ Moment τ là lực tác động để làm quay khớp nối Tọa độ của cánh tay máy được xác định trong hệ tọa độ.
Mô hình toán của cánh tay máy một bậc tự do:
(3.2) θ+ aθ +bsinθ =τ với a, b là các hằng số chưa biết.
46 download by : skknchat@gmail.com
Hình 3.1 Cánh tay máy một bậc tự do 3.2 Nhận dạng dùng mạng nơ-ron
Trong phần này, chúng ta sử dụng mô hình toán học của cánh tay máy để tạo ra tín hiệu mẫu Mô hình này phát ra bộ tín hiệu vào ra mẫu với công thức θ + 2θ, trong đó τ đại diện cho mô men hoặc lực tác động.
Thực tế ta sẽ đo mô men τ tác động cánh tay máy θ [3].
+10sin(θ) =τ động lên khớp và θlà góc quay của khớp lên khớp quay của cánh tay và góc quay của
Mô hình toán trong bài viết này có dạng phương trình vi phân và hàm sin, liên quan đến động học và phi tuyến Do đó, để nhận dạng, cần sử dụng nhiều hàm bước nhảy với biên độ khác nhau thay vì chỉ một hàm đơn Tín hiệu đầu vào mẫu p sẽ được lựa chọn theo hình thức như trong hình 3.2a.
47 download by : skknchat@gmail.com
Hình a: Tín hiệu mẫu đầ u vào Hình b: Tín hiệu đầu vào mẫu cho nhận dạng Hình 3.2: Tín hiệu đầu vào mẫu
Hình 3.3 Tạo đầu ra mẫu từ mô hình trong Simulink
Các hàm bước nhảy có độ rộng ngẫu nhiên trong khoảng [0.1;1] và biên độ trong khoảng [-10;10] Tín hiệu đầu vào mẫu p sẽ được áp dụng lên đối tượng, và đầu ra của đối tượng sẽ được đo để thu được tín hiệu đầu ra mẫu tương ứng.
Tín hiệu đầu ra mẫu từ mô hình trong Simulink được hiển thị trong hình 3.3 Tín hiệu đầu vào được đưa vào khối From Workspace, trong khi tín hiệu đầu ra được lưu trữ trong khối To Workspace.
Với đầu vào mẫu p, đầu ra của đối tượng thu thập được tương ứng là t như hình 3.4.
48 download by : skknchat@gmail.com
Hình 3.4 Tín hiệu đầu ra mẫu p
Bộ tín hiệu sẽ được sử dụng để huấn luyện mạng nơ-ron, được tạo ra trong Matlab với cấu trúc bao gồm 2 lớp Lớp thứ nhất sử dụng hàm truyền tansig và lớp thứ hai áp dụng hàm truyền tuyến tính Khối DB của đầu vào thứ nhất có độ trễ 1:2, trong khi khối DB của đầu vào thứ hai cũng có độ trễ tương tự Lớp thứ nhất của mạng nơ-ron có 6 nơ-ron.
Tín hiệu vào ra được lấy mẫu với chu kì Ts = 0.01 giây, do đó số mẫu là 50001.
Bộ mẫu {pk ;tk} được sử dụng để huấn luyện mạng nơ-ron với phương pháp LM, trong đó các tham số cài đặt cho quá trình huấn luyện bao gồm số kỷ nguyên là 1000, giới hạn dưới của gradient là 10−7 và giới hạn dưới của hàm mục tiêu là ε = 10−7 Sau 10 kỷ nguyên, giá trị hàm mục tiêu giảm xuống dưới mức yêu cầu, cho thấy quá trình huấn luyện đã hoàn tất, trong khi gradient vẫn lớn hơn 0.0224 Kết quả đầu ra của mạng nơ-ron và sai số được thể hiện trong hình 3.7, trong khi đồ thị hàm mục tiêu theo số kỷ nguyên huấn luyện được trình bày trong hình 3.8 Sau khi hoàn tất huấn luyện, mạng nơ-ron NNp sẽ có cấu trúc và tham số xác định, và bước tiếp theo là áp dụng phương pháp điều khiển dự báo MPC để thiết kế bộ điều khiển dự báo.
49 download by : skknchat@gmail.com
Hình 3.5 Cấu trúc mạng nơ-ron của đối tượng nnp
Hình 3.6 Sơ đồ cấu trúc mạng nơ-ron
50 download by : skknchat@gmail.com
Hình 3.7 Đáp ứng đầu ra của mạng nơ-ron và sai số
Hình 3.8 Đồ thị hàm mục tiêu
- Giá trị hàm mục tiêu: Giá trị hàm mục tiêu giảm nhanh và tiến tới về không.
- Đáp ứng đầu ra: Đáp ứng đầu ra dao động trong đoạn [-2;2], đáp ứng được tín hiệu điều khiển mong muốn.
51 download by : skknchat@gmail.com
- Giá trị sai số: Giá trị sai số rất nhỏ nằm trong khoảng [-0.05;0.05]
3.3 Tuyến tính hóa mạng nơ-ron Đầu ra của mô hình mạng nơ-ron: a 2 (t ) = LW 1,2 a 1 + b 2 với b là bias, a là véc-tơ đầu ra, LW i, j là ma trận trọng số liên kết giữa véc-tơ đầu ra lớp j với đầu vào lớp i. Đầu ra của lớp nơ-ron thứ nhất là: a 1 = f 1 (n 1 ) trong đó : f 1 ( n 1 ) = e n − e −n = tagsig(n) i i e n + e −n
Hàm phi tuyến đầu vào phụ thuộc vào các biến v1, v2, v3, và v4 được biểu diễn bằng a2(t) = g(v1, v2, v3, v4) Tại thời điểm t bất kỳ, hàm phi tuyến này vẫn giữ nguyên dạng a2(t) = g(v1, v2, v3, v4) Giá trị hiện tại tại thời điểm t được coi là v1 = v2.
3 v 4 Áp dụng khai triển Taylor ta có:
52 download by : skknchat@gmail.com ˆ ≈ g(v0) + 4 ∂g
∂v i=1 i với g (v 0 ) là đầu ra của mạng đầu vào tại thời điểm v = v0
Vì việc tính a1 rất phức tạp khi mạng ở đây có 2 lớp Do đó ta dùng quy tắc đạo hàm hợp. a = ∂yˆ = ∂y ∂ n 1 = ∂ y ∂ a 1
53 download by : skknchat@gmail.com
Tín hiệu đầu ra thực tế: y = yˆ − g(u 0 )
3.4 Thiết kế bộ điều khiển dự báo dùng mạng nơ-ron Đáp ứng xấp xỉ đầu ra của hệ thống là: yˆ(t) = a1v1 + a2 v2 +a3v3 + a4v4 + e(t ) (3.4) Với y( t) là đáp ứng đầu ra tại thời điểm t , a1, a2 ,a 3,a 4 là các hệ số, e(t) = g(v0 ) − a1v1,0
3,0 −a4 v4,0 Áp dụng định luật điều khiển ở (2.69) cho bài toán ta được mô hình dự báo:
Trong thời điểm dự báo ta có giá trị đặt là , lệch của u tại thời điểm
54 download by : skknchat@gmail.com với u là: u(t) u
Từ phương trình hàm J (u ) ở (3.5) ta có phương trình ở bài toán như sau:
J(u) = 2 u Au + Bu + C →min trong đó A là ma trận có kích thước 3x3 , là ma trận đối xứng A T = A, B là ma trận 3x1 và C là hằng số. Đạo hàm hàm J theo u ta được:
Từ (3.5) ta có đáp ứng đầu ra tại thời điểm t +1, t + 2, t + 3 lần lượt là: yˆ(t + 1) = a1 y(t) + a2 y(t −1) + a3u(t) + a4u (t −1) +e(t ) (3.10) yˆ(t + 2) = a1 y(t + 1) + a2 y(t) + a3u(t +1) + a4u (t ) +e(t ) (3.11) yˆ(t + 3) = a1 y(t + 2) + a2 y(t +1) + a u(t + 2) + a4 u(t +1) +e(t ) (3.12) Biến đổi công thức (3.6) ta được:
55 download by : skknchat@gmail.com
56 download by : skknchat@gmail.com
Kết hợp (3.9) và (3.15) ta được: b 2 + b 2 + 2ρ 2b b − 2ρ
Qua quá trình tính toán ta tìm được : u ∗ (t)
(3.17) Ở chu kì tiếp theo, ta đưa u ∗ (t) ra điều khiển đối tượng và thực hiện lại các bước như trên để tìm u ∗ (t +1)
Dùng mô hình (3.3) để mô phỏng tay máy và công thức (3.17) để tính toán tín hiệu điều khiển tối ưu của bộ MPC.
Chọn ρ = 0.05 và chu kì lấy mẫu là 5000.
Kết quả mô phỏng thực hiện trên hình (3.9) và (3.10).
57 download by : skknchat@gmail.com
Hình 3.9 Tín hiệu điều khiển tối ưu Trong hình 3.9, u là tín hiệu điều khiển tối ưu.
Hình 3.10 Đáp ứng đầu ra và giá trị đặt
Trong hình 3.10, y là đầu ra của đối tượng và r là giá trị đặt.
Nhận xét: Bộ điều khiển MPC làm cho đầu ra cơ bản là bám sát với tín hiệu mẫu.
Phương pháp LM, dựa trên thuật toán lan truyền ngược, được áp dụng để huấn luyện mạng nơ-ron cho đối tượng Sau quá trình huấn luyện, bộ tham số tối ưu của mạng nơ-ron sẽ được xác định Đặc biệt, mối quan hệ giữa đầu vào và đầu ra của mạng là phi tuyến.
Việc sử dụng mô hình mạng nơ-ron để thiết kế bộ điều khiển dự báo gặp nhiều khó khăn do tính phi tuyến của nó Để khắc phục, mạng nơ-ron đã được tuyến tính hóa quanh điểm làm việc hiện tại, và hàm mục tiêu được xây dựng dưới dạng bậc hai Một công thức tổng quát tìm nghiệm tối ưu đã được phát triển Để kiểm chứng tính khả thi, chương trình mô phỏng và tính toán tín hiệu điều khiển tối ưu đã được thực hiện, với kết quả cho thấy tính chính xác của thuật toán và khả năng áp dụng trong thực tế.
59 download by : skknchat@gmail.com
Luận văn “Ứng dụng mạng nơ-ron trong nhận dạng và điều khiển” đã ra những kết luận và kiến nghị như sau:
+ Đã nghiên cứu các phương pháp điều khiển dựa trên cơ sở mạng nơ-ron.
+ Đã tìm hiểu và nghiên cứu phương pháp điều khiển dự báo MPC dựa trên mạng nơ-ron.
+ Đã tiến hành mô phỏng và kiểm chứng cho cánh tay máy trong Matlab.
+ Đã viết chương trình, nhận dạng dùng mạng nơ-ron, tuyến tính hóa mạng nơ-ron và tìm tín hiệu điều khiển tối ưu cho MPC.
+ Tiếp tục nghiên cứu bài toán MPC sử dụng mạng nơ-ron có đầu vào ràng buộc và sử dụng mô hình phi tuyến.
+ Luận văn còn một số hạn chế: mới dừng lại ở mô phỏng cho hệ thống một vào một ra.
60 download by : skknchat@gmail.com
Tuyến tính hóa mạng nơ-ron
Đầu ra của mô hình mạng nơ-ron được xác định bởi công thức a 2(t) = LW 1,2 a 1 + b 2, trong đó b là bias, a là véc-tơ đầu ra, và LW i,j là ma trận trọng số kết nối giữa véc-tơ đầu ra của lớp j với đầu vào của lớp i Đầu ra của lớp nơ-ron thứ nhất được tính theo a 1 = f 1(n 1), với f 1(n 1) = e^n - e^(-n) / (e^n + e^(-n)), tương ứng với hàm kích hoạt tagsig(n).
Hàm phi tuyến a2(t) phụ thuộc vào các biến v1, v2, v3 và v4, được biểu diễn dưới dạng a2(t) = g(v1, v2, v3, v4) Tại thời điểm t bất kỳ, giá trị của hàm này vẫn giữ nguyên cấu trúc như trên Hiện tại, giá trị tại thời điểm t được coi là v1 = v2.
3 v 4 Áp dụng khai triển Taylor ta có:
52 download by : skknchat@gmail.com ˆ ≈ g(v0) + 4 ∂g
∂v i=1 i với g (v 0 ) là đầu ra của mạng đầu vào tại thời điểm v = v0
Vì việc tính a1 rất phức tạp khi mạng ở đây có 2 lớp Do đó ta dùng quy tắc đạo hàm hợp. a = ∂yˆ = ∂y ∂ n 1 = ∂ y ∂ a 1
53 download by : skknchat@gmail.com
Tín hiệu đầu ra thực tế: y = yˆ − g(u 0 )
Thiết kế bộ điều khiển dự báo dùng mạng nơ-ron
Đáp ứng xấp xỉ đầu ra của hệ thống là: yˆ(t) = a1v1 + a2 v2 +a3v3 + a4v4 + e(t ) (3.4) Với y( t) là đáp ứng đầu ra tại thời điểm t , a1, a2 ,a 3,a 4 là các hệ số, e(t) = g(v0 ) − a1v1,0
3,0 −a4 v4,0 Áp dụng định luật điều khiển ở (2.69) cho bài toán ta được mô hình dự báo:
Trong thời điểm dự báo ta có giá trị đặt là , lệch của u tại thời điểm
54 download by : skknchat@gmail.com với u là: u(t) u
Từ phương trình hàm J (u ) ở (3.5) ta có phương trình ở bài toán như sau:
J(u) = 2 u Au + Bu + C →min trong đó A là ma trận có kích thước 3x3 , là ma trận đối xứng A T = A, B là ma trận 3x1 và C là hằng số. Đạo hàm hàm J theo u ta được:
Từ (3.5) ta có đáp ứng đầu ra tại thời điểm t +1, t + 2, t + 3 lần lượt là: yˆ(t + 1) = a1 y(t) + a2 y(t −1) + a3u(t) + a4u (t −1) +e(t ) (3.10) yˆ(t + 2) = a1 y(t + 1) + a2 y(t) + a3u(t +1) + a4u (t ) +e(t ) (3.11) yˆ(t + 3) = a1 y(t + 2) + a2 y(t +1) + a u(t + 2) + a4 u(t +1) +e(t ) (3.12) Biến đổi công thức (3.6) ta được:
55 download by : skknchat@gmail.com
56 download by : skknchat@gmail.com
Kết hợp (3.9) và (3.15) ta được: b 2 + b 2 + 2ρ 2b b − 2ρ
Qua quá trình tính toán ta tìm được : u ∗ (t)
(3.17) Ở chu kì tiếp theo, ta đưa u ∗ (t) ra điều khiển đối tượng và thực hiện lại các bước như trên để tìm u ∗ (t +1)
Kết quả mô phỏng
Dùng mô hình (3.3) để mô phỏng tay máy và công thức (3.17) để tính toán tín hiệu điều khiển tối ưu của bộ MPC.
Chọn ρ = 0.05 và chu kì lấy mẫu là 5000.
Kết quả mô phỏng thực hiện trên hình (3.9) và (3.10).
57 download by : skknchat@gmail.com
Hình 3.9 Tín hiệu điều khiển tối ưu Trong hình 3.9, u là tín hiệu điều khiển tối ưu.
Hình 3.10 Đáp ứng đầu ra và giá trị đặt
Trong hình 3.10, y là đầu ra của đối tượng và r là giá trị đặt.
Nhận xét: Bộ điều khiển MPC làm cho đầu ra cơ bản là bám sát với tín hiệu mẫu.
Kết luận chương 3
Trong phần này, phương pháp LM sử dụng thuật toán lan truyền ngược để huấn luyện mạng nơ-ron cho đối tượng Sau quá trình huấn luyện, bộ tham số tối ưu của mạng nơ-ron được xác định, với quan hệ vào ra của mạng mang tính phi tuyến.
Việc sử dụng mô hình mạng nơ-ron để thiết kế bộ điều khiển dự báo gặp nhiều khó khăn, do đó cần tuyến tính hóa mạng xung quanh điểm làm việc hiện tại Hàm mục tiêu được xác định dưới dạng bậc hai, và một công thức tổng quát để tìm nghiệm tối ưu đã được phát triển Để kiểm tra tính hiệu quả, chương trình mô phỏng và tính toán tín hiệu điều khiển tối ưu đã được thực hiện, cho thấy kết quả thu được xác nhận tính đúng đắn của thuật toán và khả năng ứng dụng trong thực tế.
59 download by : skknchat@gmail.com
Luận văn “Ứng dụng mạng nơ-ron trong nhận dạng và điều khiển” đã ra những kết luận và kiến nghị như sau:
+ Đã nghiên cứu các phương pháp điều khiển dựa trên cơ sở mạng nơ-ron.
+ Đã tìm hiểu và nghiên cứu phương pháp điều khiển dự báo MPC dựa trên mạng nơ-ron.
+ Đã tiến hành mô phỏng và kiểm chứng cho cánh tay máy trong Matlab.
+ Đã viết chương trình, nhận dạng dùng mạng nơ-ron, tuyến tính hóa mạng nơ-ron và tìm tín hiệu điều khiển tối ưu cho MPC.
+ Tiếp tục nghiên cứu bài toán MPC sử dụng mạng nơ-ron có đầu vào ràng buộc và sử dụng mô hình phi tuyến.
+ Luận văn còn một số hạn chế: mới dừng lại ở mô phỏng cho hệ thống một vào một ra.
60 download by : skknchat@gmail.com