7. Kết cấu của luận án
3.2.2 Mô hình tổng quát của bộ điều khiển NNC huấn luyện trực tuyến
Cấu trúc của bộ điều khiển NNC giới thiệu trong chương này được thể hiện trên hình 3.4. Sử dụng hàm mục tiêu dưới đây như trong tài liệu [3], [8], [9]:
E =1 ( Xd −X )T P( Xd −X ) +1uT u , (3.33)
k k k k
2 k k 2 k
thái thực tế; ukc là véc-tơ lệnh điều khiển và uk là véc-tơ điều khiển thực tế tác động lên hệ thống; P là ma trận đối xứng dương phản ánh các trọng số của
các biến của đối tượng được điều khiển; Λ là ma trận đối xứng dương của véc-tơ điều khiển.
Thuật toán Ek Tác động bên Brandt-Lin ngoài Cơ cấu Đối + NNC t - ác động tượng ek z-m
Hình 3.4 Cấu trúc bộ điều khiển NNC. Véc-tơ tín hiệu vào gồm sai số ekvà các tín hiệu trễ của ek. Hàm mục tiêu E kđược xử lý bằng thuật toán Brandt-Lin
nhằm cập nhật các trọng số sao cho giá trị của Ekđược cực tiểu [3].
k = k + 1
Đặt n và ;
Khởi tạo Ek = 0
Chu trình
mới Khởi tạo trọng số mạng
ite = 1
Tính tín hiệu ra của nơ- Vòng lặp ron lớp ẩn và lớp ra mới Hiệu chỉnh trọng số (Thuật toán BP) ite = ite + 1 ĐÚNG Quá trình lặp cập ite n nhật trọng số SAI Tính giá trị hàm mục Tính trọng số và tiêu Ek+1 tín hiệu điều khiển
cho chu trình thứ k
Hình 3.5 Sơ đồ giải thuật phương pháp huấn luyện lan truyền ngược “tăng cường” với n và bước học cố định.
Quá trình huấn luyện mạng nơ-ron được thực hiện trong mỗi chu trình điều khiển chỉ thị bởi đối số k với n là số lần huấn luyện trong một chu trình. Thuật toán thích nghi (3.32) được áp dụng để điều chỉnh trọng số của các kết nối trong mạng nơ-ron sao cho hàm mục tiêu Ek đạt được cực tiểu. Thông số đầu vào của bộ điều khiển nơ-ron bao gồm sai số ek = X kd − X k và các tín hiệu trễ của sai số. Nhiệm vụ của bộ điều khiển nơ-ron là tạo ra các tín hiệu điều khiển phù hợp trong chu trình điều khiển tiếp theo sau khi đã “học” được đặc tính của trạng thái mong muốn cũng như trạng thái thực tế của đối tượng được điều khiển thông qua sai số ek.