(2 20) trong đú,i là hàm sai số của lớp ẩn, nú cần thiết cho việc điều chỉnh cỏc trọng số từ lớp vào tới lớp ẩn i được biểu diễn như sau:
i e y k y k u k
u kOi k (2 21)
trong đú, đạo hàm bậc nhất của g x được cho bởi:
ykukOiknetikijk
g x g x1 g x
(2 22) Sử dụng phộp tớnh tương tự và việc cập nhật trọng số trong lớp ẩn được tớnh dựa trờn thuật toỏn giảm gradient và hàm sai số lớp ẩn là j Thuật toỏn học được biểu diễn như sau:
jp k 1 jp k jp k
jp k jp k 1 jO p k
3
i1
trong đú, đạo hàm bậc nhất của f x được cho bởi:
(2 23) (2 24) (2 25) f x 2 2 (2 26)
2 1 4 Huấn luyện ngược tăng cường
Thuật toỏn của điều khiển PID dựa trờn BPNN này sử dụng phương phỏp huấn luyện tăng cường [31] và được cụ thể húa trong [29, 30] (Hỡnh 2 3) Cỏc giỏ trị số lần huấn luyện trong một chu trỡnh n và hệ số học η ở đõy là cố định Tại thời điểm bắt đầu của chu trỡnh điều khiển chỉ thị bởi tham số k, trọng số của mạng nơ-ron được chọn là giỏ trị ngẫu nhiờn rất nhỏ Tớn hiệu ra của cỏc nơ-ron lớp ẩn và lớp ra được tớnh toỏn dựa trờn cỏc trọng số ban đầu này Tiếp theo, trọng số của mạng nơ-ron được cập nhật bằng thuật toỏn lan truyền ngược sao cho giỏ trị của Ek đạt cực tiểu Quỏ trỡnh này được lặp đi lặp lại n lần trước khi bắt đầu một chu trỡnh điều khiển mới (k=k+1) Tớn hiệu ra của mạng nơ-ron tại vũng huấn luyện thứ n chớnh là tớn hiệu điều khiển được xuất ra tại chu trỡnh điều khiển thứ k
2 1 5 Sơ đồ thuật toỏn huấn luyện (Hỡnh 2 3)Đặt hệ số học và hệ số xung lượng α Đặt hệ số học và hệ số xung lượng α
Khởi tạo Ek=0
Khởi tạo trọng số ban đầu của mạng Chu trỡnh
mới ite=1
Thu thập dữ liệu r(k) và y(k) và tớnh Ek
Tớnh đầu vào và đầu ra của mỗi nơ-ron và lấy cỏc tham số K p , Ki và Kd của PID
Vũng lặp
k=k+1
Thu thập dữ liệu ra của BĐK PID
Hiệu chỉnh trọng số (Thuật toỏn lan truyền ngược)
ite=ite+1 Quỏ trỡnh lặp cập nhật trọng số SAI ite<n ĐÚNG Tớnh giỏ trị hàm mục tiờu Ek+1 Tớnh trọng số và tớn hiệu điều khiển cho chu trỡnh
thứ k
2 2 Bộ điều khiển PID nơ-ron dựa trờn mạng lan truyền ngược cú bộ nhận dạng nơ-ron cho hệ thống điều khiển hướng đi tàu thủy
2 2 1 Sơ đồ nguyờn lý
BĐK PID nơ-ron được đề xuất cú cấu trỳc như hỡnh 2 4, được bổ sung thờm một mạng nơ-ron thứ hai (NN2) cú dựng để dự đoỏn tốc độ quay trở của tàu (ψ_dotk ) Đõy là một mạng nơ-ron cú ba lớp truyền thẳng và được huấn luyện theo thuật toỏn lan truyền ngược tăng cường (Hỡnh 2 5) Đầu vào của mạng là tốc độ quay trở của tàu và tớn hiệu gúc bẻ lỏi tại cỏc thời điểm k-1, k- 2, k-3 Hướng đi dự đoỏn của tàu cú được nhờ việc nhận dạng tốc độ quay trở của tàu, sau đú cỏc tớn hiệu này được chuyển đến đầu vào của mạng nơ-ron thứ nhất (NN1) Nhiễu, giú, z-m NN1 Kp Kd Ki dũng… Hướng đặt Ψr Thuật toỏn chỉnh hướng đặt Ψd + Ψ ek PID k Tàu Ψ NN2 z-m
Hỡnh 2 4 Sơ đồ nguyờn lý BĐK PID nơ-ron NN1 với bộ nhận dạng nơ-ron NN2