2 Thiết kế bộ điều khiển nơ-ron cho các hệ thống con

Một phần của tài liệu Nghiên cứu điều khiển thích nghi cho robot lặn tự hành (Trang 62)

Với:

�� , �v, �� , ��, �� , ��: là thành phần tuyến tính của hệ số cản thủy động

��|�|, �v|v|,, ��|�|, ��|�| , ��|�|, ��|�|: thành phần bậc hai của hệ số cản thủy động

Lực phục hồi:

Gọi∇ là thể tích của chất lỏng bị chiếm bởi AUV, g là gia tốc trọng trường, ρ là khối lượng riêng chất lỏng Trọng lượng riêng W và lực đẩy Acsimet Archimet B là:

� = �� , � = ��∇ (3 21)

Theo [5], công thức lực phục hồi được tính như sau:

g() = [ ��� + ��� ��� × ��� + ��� × ��� ] = − [� ���(��� + ���) ] (3 22) Trong đó: ��� 0 0 � � � (3 23)

Suy ra được công thức:

�� × ������ + ��� × ������

(� − �)s −(� � − )�� s −(� − �)c�c� g() = −(��� − ���)cc + (��� − ���)c�s� (��� − ���)s + (��� − ���)c�c [ −(��� − ���)c�s� − (��� − ���)s� ]

Với (�� , �� , �� ) là tọa độ của tâm lực đẩy Acsimet Để đơn giản trong quá trình tính toán, chọn � = � nên:

̅̅̅ ̅̅ ̅̅ ̅̅ Suy ra: 0 0 0 ̅̅ ̅ (3 24) (3 25) (3 26) ̅̅̅ ̅̅ ̅̅̅ ̅̅ Trọng lực thêm vào:

Đối với trọng lực được thêm để AUV ở trạng thái cân bằng theo ý muốn, theo [31] sẽ có công thức như sau:

0 g0 = 0 −�������� −�������� −�������� [ 0 ] (3 27)

Mô hình điều động trong mặt phẳng độ sâu

Trong đề tài nghiên cứu này, để tập trung vào việc điều khiển riêng độ sâu của AUV, tác giả chỉ quan tâm đến mô hình điều động trong mặt phẳng độ sâu Do đó phương trình động lực mặt phẳng độ sâu sẽ được sử dụng như là hàm truyền mô tả hệ thống Đối với mô hình điều động trong mặt phẳng độ sâu, góc pitch () của AUV sẽ được điều khiển Do đó, có thể bỏ qua các biến trạng thái �, , , , �, � trong mặt phẳng nằm ngang, vậy nên phương trình động lực học của hệ thống được rút gọn thành (3 28) với các hệ số được mô tả trong bảng 4 1

̅̅�� = (̅ ̅��̅� , ̅��̅� , ̅��̅� )� = (�� − �� , �� − �� , �� − �� )�

g() = −�̅̅�̅��cc + �̅̅�̅��c�s� ̅̅��̅��s + ̅��̅�Wc�c

��� − ��Θ 0 0 0 1 0 0 � −Θ �� 0] [� ] + [ 0Θ 1 −1Θ 0 0 0 −�� ��� � ] [� ] = [ 0 ] 0 � 0 (3 28) trong đó: ��� là moment quán tính quanh trục Y; ��, ��, ��Θ là các hệ số thủy động lực học được mô tả trong bảng 4 1

3 2 Mạng nơ-ron thích nghi trong điều khiển

Trong [3] tác giả đề xuất phương pháp điều khiển thích nghi với mạng nơ-ron bằng lý thuyết thích nghi tương tác Theo nghiên cứu này, các nơ-ron trong mạng được xem như các hệ thống con gọi là các thiết bị trong một hệ thống phức tạp Phương pháp này tương tự như thuật toán lan truyền ngược nhưng không cần đến mạng lan truyền ngược để truyền ngược tín hiệu sai số Mạng nơ-ron điều khiển thích nghi của một số hệ thống dùng phương pháp này được mô phỏng trong [3] và ứng dụng trong [8], [9] để minh họa tính khả thi và hiệu quả của phương pháp Phần 3 2 1 sẽ mô tả tóm tắt thuật toán thích nghi tương tác áp dụng cho mạng nơ-ron để tạo thành bộ điều khiển nơ-ron thích nghi tương tác (Adaptive Neural Network by Adaptive Interaction - ANNAI)

3 2 1 Bộ điều khiển nơ-ron thích nghi tương tác

Tham khảo trong tài liệu [3] và sử dụng các ký hiệu dưới đây với i, j N

Oi I ii wij g(x) Oid

tín hiệu ra của nơ-ron thứ i; tín hiệu vào của nơ-ron thứ i; giá trị ngưỡng của nơ-ron thứ i;

trọng số của liên kết từ nơ-ron thứ i đến nơ-ron thứ j; hàm kích hoạt của một nơ-ron;

giá trị đầu ra mong muốn của nơ-ron thứ i (đối với nơ-ron lớp ra);

bước học,

Mạng nơ-ron sẽ được mô tả như sau:

I i  wijO

jN

  jN

 (3 30)

Mục tiêu của mạng là cực tiểu hóa sai số sau đây

E 1

2 iN , (3 31)

trong đó ei Oid Oi nếu i là nơ-ron lớp ra

Thuật toán cập nhật trọng số cho mạng nơ-ron trong [3] được viết như sau

w ij g( I i ) O j

Oi wki w kig( I i )O j ei ,

kN

(3 32) trong đó w ij là số gia hay tốc độ thay đổi của trọng số, g(Ii ) là đạo hàm của

g(I i ) theo I i

Phương trình (3 32) thể hiện thuật toán Brandt-Lin để cập nhật trọng số của mạng nơ-ron Sau đó trong nghiên cứu [3] một bộ điều khiển nơ-ron dựa vào thuật toán Brandt-Lin được đề xuất và các thí nghiệm mô phỏng được trình bày đã minh họa hiệu quả của bộ điều khiển

ek p w jp j wij ek-1 i ek-p+1 Ii Oi Op Ij O j

Hình 3 3 Cấu trúc bộ điều khiển NNC

3 2 2 Mô hình tổng quát của bộ điều khiển NNC huấn luyện trực tuyến

Cấu trúc của bộ điều khiển NNC giới thiệu trong chương này được thể hiện trên hình 3 4 Sử dụng hàm mục tiêu dưới đây như trong tài liệu [3], [8], [9]:

E k ( X kd X k ) T P( X kd X k ) 12 T (3 33) Trong đó Xkd Xk lần lượt là các véc-tơ trạng thái mong muốn và trạng

Oi g (I i ) gwijO j i    ei2 u ku k ,

thái thực tế; ukc là véc-tơ lệnh điều khiển và uk là véc-tơ điều khiển thực tế tác động lên hệ thống; P là ma trận đối xứng dương phản ánh các trọng số của các biến của đối tượng được điều khiển; Λ là ma trận đối xứng dương của véc-tơ điều khiển

Thuật toán Brandt-Lin Ek Tác động bên ngoài + NNC táCcơ độ cấngu tượĐốngi - ek z-m

Hình 3 4 Cấu trúc bộ điều khiển NNC Véc-tơ tín hiệu vào gồm sai số ek các tín hiệu trễ của ek Hàm mục tiêu Ek được xử lý bằng thuật toán Brandt-

Lin nhằm cập nhật các trọng số sao cho giá trị của Ek được cực tiểu [3]

Đặt n và ; Khởi tạo Ek = 0

Chu trình

mới Khởi tạo trọng số mạng

ite = 1

Tính tín hiệu ra của nơ- ron lớp ẩn và lớp ra Hiệu chỉnh trọng số (Thuật toán BP) ite = ite + 1 Vòng lặp mới k=k +1 Quá trình lặp cập nhật trọng số ite n ĐÚNG SAI Tính giá trị hàm mục tiêu Ek+1 Tính trọng số và tín hiệu điều khiển cho chu trình thứ k

Hình 3 5 Sơ đồ giải thuật phương pháp huấn luyện lan truyền ngược “tăng cường” với n và bước học cố định

Quá trình huấn luyện mạng nơ-ron được thực hiện trong mỗi chu trình điều khiển chỉ thị bởi đối số k với n là số lần huấn luyện trong một chu trình Thuật toán thích nghi (3 32) được áp dụng để điều chỉnh trọng số của các kết nối trong mạng nơ-ron sao cho hàm mục tiêu Ek đạt được cực tiểu Thông số đầu vào của bộ điều khiển nơ-ron bao gồm sai số ek X kd X k và các tín hiệu trễ của sai số Nhiệm vụ của bộ điều khiển nơ-ron là tạo ra các tín hiệu điều khiển phù hợp trong chu trình điều khiển tiếp theo sau khi đã “học” được đặc tính của trạng thái mong muốn cũng như trạng thái thực tế của đối tượng được điều khiển thông qua sai số ek

3 3 Thiết kế hệ thống điều khiển nơ-ron cho AUV

3 3 1 Điều khiển riêng biệt các chuyển động của AUV

Harley và Marco trong nghiên cứu [26] đã giả thiết rằng một mô hình động học đầy đủ các bậc tự do có thể được chia ra 3 hệ thống con độc lập, gọi là điều khiển tốc độ theo chiều dọc, điều khiển hướng và điều khiển độ sâu [25-29] Các phương trình họ đưa ra đều thu được từ phương trình chính (3 2), trong đó các thành phần không liên quan của các hệ thống con khác đều được bỏ qua

Điều khiển tốc độ theo chiều dọc: Hệ thống con này chủ yếu điều

khiển tốc độ theo chiều dọc của AUV là giá trị u, có phương trình vi phân như sau [31]:

(m − XuΘ) = XuΘ u|u|u|u| + Xthruster (3 34)

Trong đó, Xthruster là lực tạo bởi chân vịt của AUV Lực này có thể tính được từ giá trị vận tốc điều khiển uc:

Xthruster = -Xu|u|uC|uC| (3 35)

Điều khiển hướng: Là hệ thống con điều khiển hướng làm nhiệm vụ

điều khiển chuyển động xoay trên mặt phẳng ngang của AUV với các giá trị v, r,ψ Phương trình vi phân của hệ thống con này được thể hiện như (3 36) [30], [31]:

m − YvΘ [mxG − NvΘ 0 mxG − Yr Izz − Nr 0 0 −YvΘ v 0] [ ] + [−Nr v 1 0ψΘ muref − Yr mxG − Nr −1 0 u 0] [ v ] = [Nuu rδ u2ref ] δr 0 0ψ (3 36) Trong đó, uref là vận tốc mong muốn,δr là góc bẻ lái gắn trên thân AUV

Điều khiển độ sâu: Là hệ thống con điều khiển chuyển động của AUV

theo chiều đứng với các giá trị w,, và z Phương trình vi phân hệ thống con này được mô tả như sau (2 6):

� − ��Θ ��� − ��Θ 0 0 �Θ −�� ����� − �� 0 0 � [ 0 0 ��� − ��Θ 0 0 0 1 0 0 �Θ ][ ] + 0 1 �Θ −�� 0 [ −1 ������� − �� −1 0 ��� 0 ���� 0 � [ ]= 0 0] � ����� ���� 2 ������������������� ���� 2� 0 0 ] (3 37) Trong đó,δs là góc của cánh chỉnh độ sâu gắn ở phần đuôi AUV

3 3 2 Thiết kế bộ điều khiển nơ-ron cho các hệ thống con

Trong phần này tác giả thiết kế 3 hệ thống điều khiển nơ-ron độc lập cho 3 hệ thống con nói trên Các biến vào và ra của mỗi BĐK nơ-ron phụ thuộc vào phương trình vi phân mô tả ở (3 34), (3 36) và (3 37)

a Hệ thống điều khiển hướng

Hình 3 6 Sơ đồ hệ thống điều khiển hướng AUV

Dựa theo tài liệu [3], ta có thể sử dụng hàm mục tiêu cho bộ điều khiển dưới dạng:

�Θ

��� − ��Θ

1

2 (3 38)

trong đó, Rk và rk lần lượt là góc bẻ lái và tốc độ đổi hướng phương tiện ngầm tại thời điểm k , các hằng số1 ,1 , và 1 tương ứng là hệ số tỷ lệ, hệ số phản hồi góc bẻ lái và hệ số vi phân hướng đi

Bộ điều khiển nơ-ron được chọn là một mạng nơ-ron nhiều lớp truyền thẳng có một lớp ẩn Mạng gồm bốn nơ-ron lớp vào, sáu nơ-ron lớp ẩn và một nơ-ron lớp ra tương tự như đã mô tả ở [3] Trong đó, wij là ký hiệu hàm trọng lượng của nơ-ron lớp ra, w jp là ký hiệu hàm trọng lượng nơ-ron lớp ẩn Các chỉ số p, i j tương ứng là số lượng nơ-ron lớp vào, lớp ra và lớp ẩn Các tín hiệu vào của bộ điều khiển chỉ gồm sai số hướng đi của phương tiện ngầm và các giá trị trễ của sai số này Ký hiệu kd là hướng đi mong muốn và k là

hướng đi thực tế của phương tiện ngầm, nhiệm vụ của bộ điều khiển là tính toán góc bẻ lái phù hợp để hàm mục tiêu (3 38) đạt cực tiểu bằng luật cập nhật trọng số sau:

w� 1 jp O1 p [1 j sig(I1 j ) 1 0] O1 p1 j sig(I1 j ) ,

w�1ij 1 sig(I1 j ) (1e1k1 Rk 1rk ) 1 O1 j (1e1k1 Rk 1rk )

(3 39) (3 40) Chỉ số 1 biểu thị BĐK nơ-ron thứ nhất dùng cho điều khiển hướng, trong đó e1k kd k , và O1 j sig(I1 j ) 1 1 exp(I1 j ) , (3 41) I1 j (w1 jpO1 p )1 j , p 1 j w1ij w� 1ij

b Hệ thống điều khiển độ sâu

Tương tự [9] ta chọn hàm mục tiêu cho BĐK độ sâu như sau:

1 2

(3 42)(3 43) (3 43)

(3 44) trong đó 2 ,2 , 2 , và 2 là hằng số; z kd zk là độ sâu mong muốn và độ sâu

E1k [1 ( kd k ) 21 Rk2 1rk2 ],

thực;  Sk là góc bẻ của bánh lái độ sâu; wk là tốc độ theo phương đứng; và k

là góc chúi của phương tiện ngầm (được thêm vào nhằm hạn chế góc chúi trong quá trình thay đổi độ sâu)

Hình 3 7 Sơ đồ hệ thống điều khiển độ sâu AUV

Luật cập nhật trọng số trong trường hợp này, áp dụng phương pháp biến đổi trong [3], được tính như sau:

w 2 jp O2 p [2 j sig(I 2 j ) 2 0] O2 p2 j sig(I 2 j ) , w� 2ij 2 sig(I 2 j ) (2e2k2 Sk 2wk 2k )

��� 2�� O2 j�� (2e2k����2 Sk���� 2wk���� 2 k )

(3 45)

(3 46) Chỉ số 2 biểu thị BĐK nơ-ron thứ hai dùng cho điều khiển độ sâu, trong đó �2� = ��� − ��

c Hệ thống điều khiển tốc độ

Để thực hiện nhiệm vụ điều khiển tốc độ, hàm mục tiêu của bộ điều khiển NNC được chỉnh với các thành phần như sau:

1

2 (3 47)

trong đó3 ,3 , 3 , và 3 là các hằng số; u kd , u k là giá trị mong muốn và giá trị thực tế của tốc độ phương tiện; �� là tốc độ vòng quay của máy; u� k là thành phần vi phân của tốc độ phương tiện; �� là tích phân của sai số tốc độ

Luật cập nhật trọng số trong trường hợp này, áp dụng phương pháp biến đổi trong [3], được tính như sau:

�Θ3�� = �3�[�3� ���(−�3� ) + �3 0] = ⋅ �3��3� ���(−�3� ), �Θ3�� = �3 ⋅���(�3� ) (⋅ �3�3� + �3�� + �3�Θ� + �3�� =    �3 ⋅�3� (⋅ �3�3� + �3�� + �3�Θ� + �3�� ) (3 48) (3 49) Chỉ số 3 biểu thị BĐK nơ-ron thứ ba dùng cho điều khiển tốc độ, trong đó e3k ukd uk , và

Z k (t) e3k (t)dt (3 50)

3 3 3 Điều khiển tổng hợp các chuyển động của AUV bằng phương pháp tách rời (decoupled control)

Hình 3 9 Sơ đồ hệ thống dẫn đường và điều khiển AUV

Trong luận án này, ngoài việc điều khiển riêng từng chuyển động của AUV (hướng, độ sâu và tốc độ) tác giả nghiên cứu điều khiển cả 3 yếu tố này trong hoạt động của AUV một cách đồng thời Sơ đồ hệ thống điều khiển AUV về hướng đi, độ sâu, tốc độ và điều khiển dẫn đường, thực hiện các nhiệm vụ làm việc dưới nước được thể hiện trên Hình 3 9

3 4 Hệ thống điều khiển dẫn đường AUV và thực hiện các nhiệm vụdưới nước dưới nước

3 4 1 Điều khiển AUV theo quỹ đạo đặt trước

Điều khiển AUV theo quỹ đạo đặt trước thường sử dụng trong trường hợp AUV khảo sát đáy biển, tìm kiếm cứu nạn, dò tìm hư hỏng trên đường ống ngầm… Việc điều khiển này giả định tốc độ AUV không thay đổi, quỹ đạo theo mặt phẳng ngang được định trước bằng các điểm chuyển hướng tạo thành tuyến (route) Độ sâu có thể thay đổi theo lệnh hoặc cố định Trong đề tài này, tác giả sử dụng luật dẫn đường LOS (Line-of-Sight) để điều khiển AUV theo tuyến

Giả sử AUV có tọa độ x, y trong hệ trục tọa độ {n} di chuyển trong

mặt phẳng nằm ngang và bám theo quỹ đạo mong muốn là một đoạn thẳng

T T

,y ,y

như trong hình 3 10, vận tốc và hướng đi AUV sẽ được xác định như sau:

2 2

(3 51)

t a tan 2 yt, xt , (3 52) Để xác định sai số bám quỹ đạo của con tàu e(t), ta tiến hành chuyển tọa độ x, y của con tàu trong hệ trục tọa độ {n} sang hệ trục tọa độ tham

T

quay quanh trục zn của hệ trục tọa độ {n} một góc k được xác định như sau:

ak a tan 2 yk1 yk , xk1 xk T

(3 53) (3 54) được tạo thành từ hai điểm chuyển hướng pnk x k k và pnk1 x k1 k1

Ut xt yt

chiếu với gốc đặt tại waypoint pnk x k , yk và hệ trục tọa độ tham chiếu này

trong đó:

T

s(t) : là khoảng cách along-track e(t): là sai số bám quỹ đạo

Theo tài liệu [31] thì giá trị ma trận R p ( k )T được tính như sau:

Tcos ak

 sin ak

 sin ak

cos ak (3 55)

Ta có thể xác định được sai số bám quỹ đạo của con tàu như sau:

et xt xk sin ak yt yk cos ak (3 56) Nhiệm vụ chính của hệ thống dẫn đường (Guidance) là tính toán các trạng thái mong muốn giúp cho AUV bám theo quỹ đạo được định trước, điều này cũng tương đương với việc hệ thống dẫn đường phải làm cho sai số bám quỹ đạo e(t) tiến về 0 ( lim e(t) 0 ) Để thực hiện được điều này thì hệ thống

dẫn đường LOS sử dụng nguyên lý Lookahead-based Steering để tính toán hướng đi mong muốn d và từ đó tính ra góc mũi tàu mong muốn d cung cấp cho hệ thống máy lái tự động Hệ thống máy lái tự động sẽ sử dụng d

như là tín hiệu điều khiển đầu vào nhằm điều khiển con tàu bám theo quỹ đạo mong muốn và làm cho sai số bám quỹ đạo của con tàu giảm dần về 0

Hình 3 10 Luật điều hướng LOS

t



a Rp k

Phương pháp điều khiển tàu bằng nguyên lý Lookahead-based Steering sẽ làm cho sai số bám quỹ đạo e(t) tiến về 0 bằng cách hướng vector vận tốc của AUV đến điểm chuyển hướng kế tiếp trên quỹ đạo mà con tàu cần phải đi đến hay cũng chính là điểm chuyển hướng pnk1 trên đoạn thẳng quỹ đạo mà con tàu đang bám theo như hình 3 10

Một phần của tài liệu Nghiên cứu điều khiển thích nghi cho robot lặn tự hành (Trang 62)

Tải bản đầy đủ (DOCX)

(157 trang)
w