Nếu mạng nơ-ron cú đủ số lượng nơ-ron, nú cú thể xấp xỉ bất kỳ hàm liờn tục nào với chỉ một lớp ẩn [36], [54] Vỡ vậy, mạng nơ-ron chỉ cú một lớp ẩn được thiết kế
Mạng nơ-ron lan truyền ngược cú 3 lớp, cấu trỳc của BĐK được minh họa trờn hỡnh 2 2 Số lượng cỏc nơ-ron lớp vào, lớp ẩn và lớp ra tương ứng là M, Q, 3
Hỡnh 2 2 Cấu trỳc mạng nơ-ron lan truyền ngược
a) Tớnh toỏn truyền thẳng của BPNN
Đầu ra của mỗi nơ-ron trong lớp vào là:
O p X p p 1, 2,3, , M (2 3)
trong đú, O p là đầu ra của nơ-ron thứ p trong lớp vào Đầu vào và đầu ra của lớp ẩn của mạng là:
M
O (2 4)
O j k f net j k j 1,2,3, ,Q (2 5) trong đú, net j là đầu vào của nơ-ron thứ j trong lớp ẩn; jp là trọng số của lớp ẩn; f x là hàm kớch hoạt của nơ-ron lớp ẩn, nú là hàm sigma với đối
xứng dương và õm
f x tanh x e x e x e e x (2 6) Đầu vào và đầu ra của lớp ra là:
Q O (2 7) Oik gnetik K Pk O1k K Dk O3k i 1,2,3 (2 8) (2 9) trong đú,ij là trọng số của nơ-ron lớp ra; cỏc đầu ra của nơ-ron lớp ra là K P , K I và; g x là hàm kớch hoạt của nơ-ron lớp ra, nú là hàm sigma
khụng õm
1 x
2 (2 10)
Mạng nơ-ron BP điều hưởng cỏc tham số PID một cỏch tự động và làm giảm bớt thời gian thiết kế hệ thống điều khiển Tuy nhiờn, sai số mụ hỡnh
1 tanh x g x ee x e x K Ik O2k netik j1ij j net jk p1 jp p
toỏn học tàu thủy thường tồn tại và làm giảm độ chớnh xỏc điều khiển hệ thống Vỡ vậy, thuật toỏn huấn luyện online được ỏp dụng để điều chỉnh trọng số nơ-ron nhằm làm giảm sai số hệ thống e y trong thiết kế BĐK BPNN
b) Lan truyền ngược sai số và điều chỉnh trọng số
Hàm chỉ tiờu chất lượng cú dạng như sau:
Ek rink youtk 2
(2 11)trong đú, rin là đầu ra mong muốn; yout là đầu ra thực tế trong đú, rin là đầu ra mong muốn; yout là đầu ra thực tế
Quỏ trỡnh huấn luyện mụ hỡnh mạng nơ-ron phải được thực hiện trước khi đưa vào sử dụng Quỏ trỡnh huấn luyện này được lặp lại cho đến khi sai số bỡnh phương trung bỡnh của dữ liệu huấn luyện đạt tối thiểu mong muốn Trong nghiờn cứu này, quỏ trỡnh huấn luyện dựa trờn thuật toỏn lan truyền ngược í tưởng cơ bản của lan truyền ngược là nhằm điều chỉnh cỏc trọng số nơ-ron sử dụng phương phỏp giảm độ dốc cho hàm sai số trong một chu trỡnh điều khiển Nhỡn chung, việc điều chỉnh trọng số từ lớp ẩn tới lớp ra được biểu diễn như sau:
ijk E k
ij
(2 12) Tuy nhiờn, để trỏnh cực tiểu cục bộ và tăng tốc độ hội tụ, ta thờm vào một xung lượng (tăng quỏn tớnh) vào thuật toỏn được đề xuất Điều này cú nghĩa là sự thay đổi trọng số trong chu trỡnh này khụng chỉ phụ thuộc vào sai số hiện tại mà cũn phụ thuộc vào sự thay đổi trước đú Vỡ vậy, việc điều chỉnh mỗi trọng số từ lớp ẩn tới lớp ra được điều chỉnh dựa trờn hàm sai số đầu ra của hệ thống như sau:
ijk
E k
ij ijk 1 (2 13)
trong đú, là hệ số tốc độ học, là hệ số xung lượng Từ đú: Ek ijk E k y k ukOik net i k (2 14) net i k ijk Oik (2 15)
và dựa trờn cỏc phương trỡnh (2 9), (2 14), cỏc phương trỡnh sau đõy được tớnh: u k O1 k u k O2 k u k O3 k e k e k 1 e k e k 2e k 1 e k 2 (2 16) (2 17) (2 18) Sau đú, thuật toỏn học của việc cập nhật trọng số trong lớp ra được biểu diễn như sau:
ij k 1ij kij k
ij kij k 1 iO j k
(2 19)(2 20) (2 20) trong đú,i là hàm sai số của lớp ẩn, nú cần thiết cho việc điều chỉnh cỏc trọng số từ lớp vào tới lớp ẩn i được biểu diễn như sau:
i e y k y k u k
u kOi k (2 21)
trong đú, đạo hàm bậc nhất của g x được cho bởi:
ykukOiknetikijk
g x g x1 g x
(2 22) Sử dụng phộp tớnh tương tự và việc cập nhật trọng số trong lớp ẩn được tớnh dựa trờn thuật toỏn giảm gradient và hàm sai số lớp ẩn là j Thuật toỏn học được biểu diễn như sau:
jp k 1 jp k jp k
jp k jp k 1 jO p k
3
i1
trong đú, đạo hàm bậc nhất của f x được cho bởi:
(2 23) (2 24) (2 25) f x 2 2 (2 26)
2 1 4 Huấn luyện ngược tăng cường
Thuật toỏn của điều khiển PID dựa trờn BPNN này sử dụng phương phỏp huấn luyện tăng cường [31] và được cụ thể húa trong [29, 30] (Hỡnh 2 3) Cỏc giỏ trị số lần huấn luyện trong một chu trỡnh n và hệ số học η ở đõy là cố định Tại thời điểm bắt đầu của chu trỡnh điều khiển chỉ thị bởi tham số k, trọng số của mạng nơ-ron được chọn là giỏ trị ngẫu nhiờn rất nhỏ Tớn hiệu ra của cỏc nơ-ron lớp ẩn và lớp ra được tớnh toỏn dựa trờn cỏc trọng số ban đầu này Tiếp theo, trọng số của mạng nơ-ron được cập nhật bằng thuật toỏn lan truyền ngược sao cho giỏ trị của Ek đạt cực tiểu Quỏ trỡnh này được lặp đi lặp lại n lần trước khi bắt đầu một chu trỡnh điều khiển mới (k=k+1) Tớn hiệu ra của mạng nơ-ron tại vũng huấn luyện thứ n chớnh là tớn hiệu điều khiển được xuất ra tại chu trỡnh điều khiển thứ k
2 1 5 Sơ đồ thuật toỏn huấn luyện (Hỡnh 2 3)Đặt hệ số học và hệ số xung lượng α Đặt hệ số học và hệ số xung lượng α
Khởi tạo Ek=0
Khởi tạo trọng số ban đầu của mạng Chu trỡnh
mới ite=1
Thu thập dữ liệu r(k) và y(k) và tớnh Ek
Tớnh đầu vào và đầu ra của mỗi nơ-ron và lấy cỏc tham số K p , Ki và Kd của PID
Vũng lặp
k=k+1
Thu thập dữ liệu ra của BĐK PID
Hiệu chỉnh trọng số (Thuật toỏn lan truyền ngược)
ite=ite+1 Quỏ trỡnh lặp cập nhật trọng số SAI ite<n ĐÚNG Tớnh giỏ trị hàm mục tiờu Ek+1 Tớnh trọng số và tớn hiệu điều khiển cho chu trỡnh
thứ k
2 2 Bộ điều khiển PID nơ-ron dựa trờn mạng lan truyền ngược cú bộ nhận dạng nơ-ron cho hệ thống điều khiển hướng đi tàu thủy
2 2 1 Sơ đồ nguyờn lý
BĐK PID nơ-ron được đề xuất cú cấu trỳc như hỡnh 2 4, được bổ sung thờm một mạng nơ-ron thứ hai (NN2) cú dựng để dự đoỏn tốc độ quay trở của tàu (ψ_dotk ) Đõy là một mạng nơ-ron cú ba lớp truyền thẳng và được huấn luyện theo thuật toỏn lan truyền ngược tăng cường (Hỡnh 2 5) Đầu vào của mạng là tốc độ quay trở của tàu và tớn hiệu gúc bẻ lỏi tại cỏc thời điểm k-1, k- 2, k-3 Hướng đi dự đoỏn của tàu cú được nhờ việc nhận dạng tốc độ quay trở của tàu, sau đú cỏc tớn hiệu này được chuyển đến đầu vào của mạng nơ-ron thứ nhất (NN1) Nhiễu, giú, z-m NN1 Kp Kd Ki dũng… Hướng đặt Ψr Thuật toỏn chỉnh hướng đặt Ψd + Ψ ek PID k Tàu Ψ NN2 z-m
Hỡnh 2 4 Sơ đồ nguyờn lý BĐK PID nơ-ron NN1 với bộ nhận dạng nơ-ron NN2
2 2 2 Mạng nhận dạng nơ-ron
Một hệ thống động học cú thể được mụ tả bằng hai dạng: Mụ hỡnh đầu vào - đầu ra và mụ hỡnh khụng gian trạng thỏi Đề tài này ứng dụng mạng nơ- ron truyền thẳng để học mà nhận dạng mụ hỡnh tàu thủy ứng dụng cho điều khiển theo phương ỏn đầu vào - đầu ra [36]
Mụ hỡnh đầu vào - đầu ra mụ tả hệ thống động học dựa trờn dữ liệu vào và ra của hệ thống đú Trờn nguyờn lý này, mụ hỡnh đầu vào - đầu ra giả thiết rằng tớn hiệu ra mới trong miền thời gian rời rạc của hệ thống cú thể được dự đoỏn từ cỏc dữ liệu vào ra ở khoảng thời gian trước đú của hệ thống, tức là cỏc thụng tin của hệ thống thu được từ trước đú
Nếu một hệ thống giả sử là được xỏc định theo cỏc biến thời gian, vớ dụ SISO (một đầu vào, một đầu ra), mụ hỡnh đầu vào - đầu ra được mụ tả như sau:
y p k f y p k 1, y p k 2, , y pk n
u k 1,u k 2, ,u k m (2 27) Trong đú,u k, y p k là cặp tớn hiệu đầu vào - đầu ra của hệ thống tại thời điểm k Cỏc số nguyờn n, m tương ứng là số cỏc tớn hiệu ra (bậc của hệ thống) và số cỏc tớn hiệu vào của hệ thống Trong thực tế m thường nhỏ hơn hoặc bằng n f là hàm phi tuyến tĩnh, nú giỳp tớnh toỏn tớn hiệu ra mới của hệ thống dựa trờn tớn hiệu vào ra trước đú của hệ thống Nếu hệ thống là tuyến tớnh thỡ f là một hàm tuyến tớnh và phương trỡnh (2 27) được viết lại như sau:
y p k a1 y p k 1 a2 y p k 2 , , an y p k n
b1u k 1 b2u k 2, ,bmuk m
trong đú ai (i=1,2,…, n) và bi (i=1,2,…, m) là cỏc hằng số
u k z-1 y p k z-1 z-1 z-1 f( ) z-1 y p k
Hỡnh 2 6 Mụ hỡnh đầu vào - đầu ra
Nhận dạng hệ thống đầu vào - đầu ra bằng mạng nơ-ron truyền thẳng (khụng cú bộ nhớ động) đặt ra nhiệm vụ tỡm hàm số mụ tả hay ước lượng được quan hệ vào ra của tớn hiệu của hệ thống động học Phương trỡnh (2 27) cú thể miờu tả bằng hỡnh 2 6 Hệ thống động học được mụ tả bằng hàm f và số nguyờn m và n Nếu cho trước giỏ trị m và n, chỉ cần đi tỡm hàm f Hàm f
khụng thay đổi theo thời gian đối với những hệ thống khụng biến đổi theo thời gian Chớnh vỡ mạng nơ-ron nhõn tạo truyền thẳng cú khả năng mụ tả cỏc hàm số tĩnh như vậy nờn nú được ứng dụng để ước lượng hàm số f (chớnh là mụ hỡnh tàu) trong đề tài Tuy nhiờn đề tài nõng cao khả năng nhận dạng của mụ hỡnh tàu nơ-ron này bằng chiến lược online, tức là tớn hiệu vào ra được
cập nhật liờn tục giỳp mụ hỡnh nơ-ron cú thể nhận dạng con tàu kiờn tục theo thời gian Đõy cũng là điểm mới đỏng chỳ ý của đề tài nghiờn cứu
Hỡnh 2 7 Cấu trỳc nhận dạng song song
Hệ thống nhận dạng bằng mạng nơ-ron núi trờn cú thể cú hai cấu trỳc: cấu trỳc song song (parallel) (hỡnh 2 7) và cấu trỳc chuỗi song song (series- parallel) (hỡnh 2 8) Đề tài này ứng dụng cấu trỳc song song để nhận dạng mụ hỡnh tàu thủy liờn tục theo thời gian Trong cấu trỳc này, mạng nơ-ron và hệ thống điều khiển nhận cựng tớn hiệu vào từ bờn ngoài; cỏc tớn hiệu ra của hệ
thống khụng dựng để đưa vào mạng nơ-ron Hệ thống điều khiển và mạng nơ- ron nhận dạng là hai quỏ trỡnh riờng biệt cựng chia sẻ một bộ tớn hiệu vào từ bờn ngoài Cỏc tớn hiệu ra của mạng nơ-ron và hệ thống điều khiển khụng ảnh hưởng đến nhau Cỏc kết quả mụ phỏng trong [36] đó chứng minh tớnh hiệu quả và khả thi của phương phỏp này
Trong đề tài, sử dụng mạng nơ-ron nhận dạng được minh họa là NN2 và biểu diễn trờn hỡnh 2 7
Hỡnh 2 8 Cấu trỳc nhận dạng chuỗi song song
2 3 Kết luận chương 2
Trong chương 2, tỏc giả đó tập trung nghiờn cứu xõy dựng bộ điều khiển PID dựa trờn mạng nơ-ron lan truyền ngược khụng cú và cú bộ nhận dạng nơ-ron Trong BĐK PID nơ-ron này, tỏc giả đó được thờm thuật toỏn
huấn luyện tăng cường để tăng tốc độ thớch nghi của hệ thống, điều chỉnh nhanh và chớnh xỏc cỏc tham số của BĐK PID
Nghiờn cứu và xõy dựng bộ nhận dạng mụ hỡnh nơ-ron theo phương phỏp tớn hiệu vào - ra được giới thiệu và ứng dụng Bộ nhận dạng này sử dụng mạng nơ-ron nhiều lớp truyền thẳng nhưng được tỏc giả huấn luyện mạng theo phương phỏp trực tuyến, tăng cường nờn tốc độ thớch nghi tốt, cú khả năng nhận dạng mụ hỡnh tàu phi tuyến biến đổi theo thời gian Với việc kết hợp mụ hỡnh nhận dạng nơ-ron này, phương phỏp điều khiển được tiến hành kiểu điều khiển dự đoỏn theo thời gian thực, nõng cao tớnh thớch nghi và chất lượng điều khiển
CHƯƠNG 3 KẾT QUẢ Mễ PHỎNG 3 1 Mụ hỡnh toỏn học cho mụ phỏng
3 1 1 Mụ hỡnh toỏn học tàu hàng Mariner
Nhằm kiểm chứng việc thiết kế hệ thống điều khiển cho tàu thủy, tỏc giả sử dụng mụ hỡnh toỏn học tàu hàng Mariner để mụ phỏng luật điều khiển trước khi cú thể làm thử nghiệm mụ hỡnh hoặc thử nghiệm toàn tỷ lệ trờn tàu thực [22, 23, 64] Khi làm mụ phỏng và để mụ tả mụ hỡnh toỏn học tàu hàng Mariner, ta sử dụng một số tham số chuyển động như sau:
u u0u p p0p 0
v v0v r r0r 0 (3 1) Trong cỏc tham số chuyển động (3 1),u là một số gia nhỏ của vận tốc trượt dọc định danh (hằng số) u0 cũn u mụ tả vận tốc trượt dọc toàn bộ Vận tốc toàn bộ của tàu được xỏc định theo cụng thức sau:
U u 2 v 2 u0 u v 2 (3 2) Phũng thớ nghiệm thủy khớ động học ở Lyngby, Đan Mạch đó tiến hành thử nghiệm kỹ thuật chuyển động mặt phẳng (PMM - Planar Motion
Mechanism) và ước lượng chuyển động và lỏi toàn tỷ lệ cho tàu hàng lớp Mariner Cỏc kớch thước của tàu hàng lớp Mariner theo Fossen [23] là:
- Chiều dài toàn bộ (Length Overall, Loa ): 171,80 (m); - Chiều dài giữa hai đường vuụng gúc ( Lpp ): 160,93 (m); - Chiều rộng lớn nhất ( B ): 23,17 (m);
- Mớn nước thiết kế ( T ): 8,23 (m);
- Lượng gión nước thiết kế ( ): 18,541 (m3); - Vận tốc thiết kế ( u0 ): 15 hải lý/ giờ
Cỏc phương trỡnh chuyển động trượt ngang, trượt dọc và quay trở cho tàu Mariner này được biểu diễn như sau:
m ' X u' 0 0 0 m ' X v' ' 0u 'X ' ' ' (3 3)
' ' N ' được xỏc đinh như sau (theo Hệ Prime I với Lpp và U là cỏc biến tiờu chuẩn húa):
' ' 2 ' 3 ' 2 ' 2 X' '2 X u'u ' '2 X v'v ' ' X uv'u 'v ' ' ' ' ' 3 ' 2 ' ' ' ' ' ' ' 3 2 ' ' ' ' ' '
Cỏc hệ số khụng thứ nguyờn trong mụ hỡnh tàu Mariner này là: m' 798 105 , I z' 39 2105 , xG'0 023
(3 4)
(3 5)
(3 6)
(3 7)
3 1 2 Mụ hỡnh toỏn học súng, giú và dũng chảy
Mụ hỡnh do nhiễu mụi trường tỏc động như súng, giú và dũng chảy được dựng cho mụ phỏng, kiểm tra và đỏnh giỏ hệ thống điều khiển phản hồi Nhiễu mụi trường cú tớnh phi tuyến cao và được thờm vào trong cỏc phương trỡnh động học của tàu thủy để thực hiện mụ phỏng
Từ phương trỡnh động học tàu thủy (1 15) và theo nguyờn lý xếp chồng, cỏc vộc tơ nhiễu mụi trường do súng và giú w được định nghĩa như sau:
m ' xG Nv
m ' x N rv 'Y '
I z r' N'r 'N
trong đú, cỏc lực và mụ men phi tuyếnX ,Y và
X ' X uu ' X uuu ' X uuuu ' X vvv ' X rrr ' X rvr 'v ' Y ' Yvv ' Yrr ' Yvvvv ' Yvvrv 'r ' Yvuv 'u ' Yrur 'u ' Y ' Y '3 Yuv ' ' Yuuu '2 ' Yvv ' '2 Yvvv '2 'Y 0' Y 0uu ' Y 0uuu '2 N ' Nvv ' N rr ' N vvvv ' N vvrv 'r ' N vuv 'u ' N rrur 'u ' N ' N '3 Nuv ' ' Nuuu '2 ' N vv ' '2 Nvvv '2 ' N 0' N 0uu ' N 0uuu '2
w wwind wwave
(3 8) trong đú, wwind 6 và wwave 6 là cỏc lực được tổng quỏt húa do súng và giú Cỏc mụ hỡnh dựng cho mụ phỏng cỏc lực này được trỡnh bày ở mục 3 1 2 1 và 3 1 2 2
Cỏc ảnh hưởng do dũng chảy thường được mụ phỏng được định nghĩa