CHƯƠNG I: TỔNG QUAN VỀ NHẬN DẠNG CÁC HỆ SỐ KHÍ ĐỘNG CỦA MÁY BAY
2.3. Mô hình động học dùng cho nhận dạng các đạo hàm hệ số khí động của thiết bị bay khi ứng dụng mạng nơron nhân tạo
2.3.2. Mạng nơron đột biến
Trong những năm gần đây, lĩnh vực nghiên cứu về ANN có nhiều nghiên cứu rất sâu về các quá trình sinh – hóa học diễn ra trong não bộ cũng như trong từng nơron thần kinh động vật sống, tương ứng, cũng đã xuất hiện các nghiên cứu trong việc xây dựng cấu trúc, các thuật toán xử lý liên quan đến các mô hình, luật học..., ứng dụng đối với một thế hệ ANN mới, được gọi là mạng nơron đột biến (SNN) [16], [44]. Đối với ANN thế hệ thứ nhất và ANN thế hệ thứ hai dựa trên mô hình nơron của McCulloch-Pitts, trong đó sự lan truyền, xử lý thông tin dựa trên trọng lượng liên kết giữa các nơron và sự kích hoạt phản ứng đầu ra của nơron có thể được xem như tốc độ kích hoạt được chuẩn hóa trong một chu kỳ thời gian nào đó, tức là thực hiện mã hóa tỷ lệ (Rate Coding). Với ANN thế hệ thứ nhất, hàm kích hoạt nơron được sử dụng là hàm
dạng mức; với ANN thế hệ thứ hai, hàm kích hoạt được dùng là các dạng hàm liên tục (dạng hàm sigmoid) [46].
Đối với ANN thế hệ thứ ba (SNN), việc xử lý thông tin dựa trên liên kết trọng lượng giữa các nơron và thời điểm xuất hiện đột biến (Skipping) dưới dạng xung khi đầu ra nơron đạt tới một mức ngưỡng nào đó, tức là thực hiện mã hóa thời gian xung (Pulse Encoding).
So với ANN, SNN có những ưu điểm nổi bật sau:
- Do thông tin được truyền trong mạng dưới dạng mã xung do đó bền vững với các tác động nhiễu loạn;
- Cho phép ứng dụng các quy tắc học gần giống như các quy tắc học của nơron sinh học, ví dụ như quy tắc Hebbian và quy tắc Spike Time Dependant Plasticity (STDP) [26], [44]. Các quy tắc này cho phép tăng cường hệ số trọng lượng giữa 2 nơron nếu như 2 nơron này có tương quan và suy giảm hệ số này nếu như ngược lại;
- Do sự mã hóa thông tin theo thời gian, SNN có khả năng sử dụng động học của mạng trong quá trình học, ví dụ như chuỗi các đột biến cho phép giải mã đầu ra của mạng từ các mẫu đồng bộ và điều này dẫn đến yêu cầu một số lượng nhỏ các nơron trong các tính toán [23].
2.3.2.1 Tổng quan về mô hình nơron đột biến
SNN có thể được mô hình hóa bằng nhiều mô hình khác nhau. Những mô hình này gần giống nhau trong các hành vi nơron sinh học có thể tạo ra.
Hai đặc trưng quan trọng đối với mô hình nơron đột biến:
- Sự tương tự về mặt sinh học: Nơron đột biến có thể tạo các mẫu đột biến hoặc hành vi được thể hiện gần giống nơron sinh học như hình 2.4 [10];
- Hiệu quả tính toán: Yếu tố này được xác định bởi số lượng biến được sử dụng để biểu diễn mô hình nơron và số lượng các phép toán số thực cần thiết để thực hiện trong 1 ms của mô hình mô phỏng.
Hình 2. 4. Các hành vi nơron đột biến
Khi nghiên cứu SNN có thể sử dụng nhiều loại mô hình khác nhau [10], [51], [59], các mô hình SNN có thể kể đến như sau [10]:
- Mô hình Izhikevich;
- Mô hình tích lũy và kích hoạt IF (Integrate and Fire) và tích lũy và kích hoạt có tổn thất LIF (Leaky Integrate and Fire);
- Mô hình Wilson;
- Mô hình Wang-Buszaki;
- Mô hình Morris–Lecar;
- Mô hình Hindmarsh–Rose;
- Mô hình đáp ứng đột biến SRM (Spike Response Model).
Trong các mô hình nơron đột biến, trong kỹ thuật nhận dạng tham số các hệ thống điều khiển, sử dụng nhiều nhất là mô hình IF và mô hình SRM [59].
Mô hình IF và LIF
Mô hình LIF và IF có vai trò quan trọng trong việc tìm hiểu mối quan hệ giữa tác động đầu vào nơron và sự biến đổi đầu ra của chúng. Trong mô hình LIF, hoạt động của nơron được xây dựng theo nguyên tắc nạp – phóng điện:
màng nơron được nạp bởi dòng chạy trong nó, khi điện thế màng đạt ngưỡng ung thì sẽ kích hoạt ra điện thế (đột biến) và phóng điện.
Động học của nơron theo LIF mô tả theo công thức sau:
du (t)
C =
dt
trong đó: u ( t )- biến trạng thái mô hình (điện thế màng nơron); C - điện dung màng; R - điện trở đầu vào; i0 (t) - dòng điện đưa vào nơron; i j (t ) - dòng
điện đưa vào lớp màng từ khớp nối j ; wj - trọng số của khớp nối thứ j ; m - số khớp nối đến nơron, khi R→ ∞, công thức (2.39) trở thành mô tả mô hình IF.
Trong cả mô hình IF và LIF, điện thế màng nơron ban đầu ures . Dưới tác động của dòng điện i0(t) và i j (t ) đưa đến, điện thế màng được tăng lên. Khi u
(t ) đạt ngưỡng ung nơron phát đột biến và u (t ) trở về giá trị ures hình 2.5.
Hình 2. 5. Đồ thị thời gian của điện thế màng u(t) của nơron LIF
Trong mô hình đơn giản, dòng i ( t)có thể mô tả bằng hàm mũ:
i (t ) = ∫S j (s - t )exp(-
trong đó: τ s - hằng số thời gian khớp và Sj(t ) - chuỗi đột biến trước khớp.
Mô hình SRM
Mô hình đáp ứng đột biến (SRM) mô tả mối quan hệ giữa đột biến đầu vào và biến trạng thái trong của nơron. Để xác định mô hình SRM, xét SNN có cấu trúc như hình 2.6 [24], gồm 3 lớp: lớp đầu vào H (có S H nơron), lớp ẩn I (có S I nơron) và lớp đầu ra J (có S J nơron). Các nơron tạo các kích hoạt (đột biến) khi biến trạng thái trong "điện thế màng" u ( t ) đạt mức ngưỡng ung .
Lớp đầu vào H Lớp ẩn I Lớp đầu ra J
a) b)
Hình 2. 6. Mô hình SNN
trong hình 2.6: a) SNN truyền thẳng, b) kết nối nhiều khớp đầu ra.
Xét nơron thứ
T
S
= t , t
2
, t
1
trong đó: wij - trọng số liên kết; ti- thời điểm tác động đột biến đầu vào;
(t)- hàm mô tả phản ứng kích động có dạng:
ε ( t ) =
Mỗi nơron thứ i lớp ẩn I và nơron thứ jlớp ra J
nối ( m khớp) (hình 2.6- b), xem xét tác động của khớp thứ k có độ giữ chậm
d kđến nơron được xác định:
yk(t ) =ε (t −t − dk )
i
Mở rộng phương trình (2.41) đến m khớp xác định như phương trình (2.43). Biến trạng thái uj(t) được mô tả như tổng có trọng số các tác động:
S
I m
u j (t ) = ∑∑wijk yik (t ) (2.44)
i =1 k=1
trong đó: wijk - trọng số liên kết với đầu ra thứ k ; k - ký hiệu chỉ số khớp kết nối giữa nơron i với nơron j ( k=1÷m ).
2.3.2.2 Các phương pháp luyện mạng SNN theo mô hình SRM
Việc luyện SNN đã được xem xét trong nhiều nghiên cứu [16], [44].
Thuật toán luyện được nghiên cứu đầu tiên dựa trên thuật toán luyện ANN thế hệ 2 là thuật toán lan truyền ngược (BP), được gọi là SpikeProp (Spike Propagation) đã được trình bày chi tiết trong [51]. Thuật toán SpikeProp có ưu điểm cơ bản là khá đơn giản trong cấu trúc và dễ triển khai theo các tính toán toán học. Hạn chế của SpikeProp là gặp phải sai số lớn khi thực hiện lấy đạo hàm bậc nhất tại các thới điểm xuất hiện đột biến và sự hội tụ khá chậm.
Giải quyết hạn chế này, đã có nhiều nghiên cứu một số thuật toán sửa đổi được đề xuất như thuật toán lan truyền ngược sai số đột biến chuẩn hóa (NSEBP) [60], SpikeProp với động học [49], [51], SpikeProp tác động nhanh lan truyền đàn hồi (RProp) [24], phương pháp học có giám sát từ xa (ReSuMe) [44].
Mỗi một thuật toán này đều có các ưu điểm và hạn chế nhất định.
2.3.2.3 Thuật toán lan truyền ngược sai số đột biến
Trong thuật toán lan truyền ngược sai số đột biến (SpikeProp) [24], [51],
thời điểm phát đột biến đầu ra đối với nơron khi điện áp đầu ra (xác định theo công thức (2.44)) đạt mức ngưỡng (u(t ) = ung ), biểu diễn trên hình 2.7.
Hình 2.7. Đồ thị biểu diễn đột biến được phát khi u ( t ) = ung Việc lan truyền ngược sai số thời gian được thực hiện như sau:
- Đối với lớp đầu ra
- Xác định hàm sai số trung bình bình phương giữa chuỗi đột biến đầu ra mong muốn T
trong đó: ta - thời điểm đột biến đầu ra thực tế thứ j( j=1 ÷N
j
đột biến đầu ra mong muốn; NJ - số lượng đột biến đầu ra;
- Khi lan truyền ngược sai số, tính toán thay đổi trọng số liên kết
∆wk= −à
ij
với à - tốc độ học; wk - trọng số của liờn kết k từ nơron i
tout
- Thành phần gradient được tính theo công thức chuỗi:
trong đó:
(2.47)
yik (taj ) (2.48)
Với giả thiết uj(t) thay đổi tuyến tính bậc nhất so với t trong khoảng lân cận giá trị tại thời điểm đạt đến mức ngưỡng kích hoạt đột biến:
do đó:
∆wijk= −à yik (t aj )(t aj - t dj )
= ∂u j (t )
∂t j(u j)
1
NI m
wijk ( ∂yik (t aj ) / ∂taj )
i =1 k =1
∂t a
δi= i
∂u (ta ) ∂t
i i
Các thành phần trong (2.52) được tính như sau:
- Thành phần thứ nhất:
∂u j (t aj )
-Thành phần thứ hai:
∂tia
NI
=
Như vậy đối với lớp ẩn, quy tắc điều chỉnh trọng số như sau:
∆whik= −ηyhk(tia)δi= −η
Quy tắc điều chỉnh trọng số trong phương trình (2.53) với SNN nhiều lớp ẩn bằng cách tính theo ảnh hưởng lan truyền ngược sai số.
Thuật toán SpikeProp được thực hiện theo các bước sau [51]:
Bước 1: Xác định chuỗi đột biến đầu vào T
đột biến đầu ra đích T
mong muốn E0 mà bài toán cần đạt được;
Bước 2: Xác định cấu trúc SNN (số nơron trong lớp đầu vào SH , số nơron lớp ẩn S I và số nơron lớp đầu ra SJ , số khớp kết nối m);
Bước 3: Khởi tạo ma trận trọng số ban đầu; tính toán lan truyền thuận theo công thức (2.44) với các trọng số W0 đã chọn, so sánh giá trị ngưỡng, xác định thời điểm kích hoạt thực tế t aj ;
Bước 4: Xác định hàm sai số trung bình bình phương E giữa tập đột biến đầu ra mong muốn T
Bước 5: Đối với lớp đầu ra J , Tính δj cho tất cả các đầu ra theo (2.51);
điều chỉnh trọng số lớp ra theo (2.50);
Bước 7: Thuật toán SpikeProp sẽ lặp lại từ bước 2 đến bước 7 cho đến khi sai số trung bình bình phương E≤ E0 .
Bước 8: Xác định chuỗi đột biến đầu ra Ta và sai lệch chuẩn.