Mô hình trạng thái chuyển động tuyến tính kênh độ- 123docz.net

CHƯƠNG I: TỔNG QUAN VỀ NHẬN DẠNG CÁC HỆ SỐ KHÍ ĐỘNG CỦA MÁY BAY

2.2. Mô hình động học máy bay trong kênh độ cao

2.2.2. Mô hình trạng thái chuyển động tuyến tính kênh độ cao

Các phương trình chuyển động phi tuyến của TBB có thể được tuyến tính hóa bằng cách áp dụng lý thuyết nhiễu động nhỏ. Mỗi biến trong các phương trình bao gồm hai phần (thành phần ổn định, không đổi trong điều kiện tham chiếu ổn định và nhiễu động). Đối với các tham số, các giá trị ổn định ký hiệu bằng chỉ số 0 và nhiễu động ký hiệu Δ, các tham số kênh độ cao có thể được viết như sau:

V = V0 + ∆ V , α = α 0 + ∆ α , ω y = ω y + ∆ωy , ϑ=ϑ0+ ∆ϑ , δe

CL = CL0+ ∆CL

Trong trường hợp khi giá trị ổn định bằng 0, khi đó giá trị của biến sẽ bằng giá trị nhiễu động, do đó ký hiệu ∆ sẽ bị loại bỏ.

Áp dụng các xấp xỉ góc nhỏ: sinx ≈ x , cosx ≈1 và tanx ≈ x , các xấp xỉ khi tuyến tính hóa:

cos ( γ 0 + ∆ γ ) ≈

sin ( γ 0 + ∆γ ) ≈

tan (ϑ + ∆ϑ ) ≈



Với việc sử dụng lý thuyết nhiễu động nhỏ vào hệ phương trình trạng thái chuyển động kênh độ cao (2.25), các nhiễu động các HSKĐ ∆ C D , ∆CL

và ∆my được mở rộng đối với mô hình HSKĐ (1.10). Các thử nghiệm bay để nhận dạng các ĐHHSKĐ thực hiện với lực đẩy không đổi ( ∆ P = 0 ), có thể xác định mô hình trạng thái chuyển động tuyến tính kênh độ cao như sau:



V = -





- g cosη0 (∆ϑ − ∆α ) −





α = -





+ ωy



 qSb

ω y =

I y



ϑ =

 y



Đối với phương trình đầu ra động kênh độ cao tuyến tính, ngoài các trạng thái tuyến tính hóa ∆V, ∆α , ∆ϑ, ωy của mô hình cũng là các đầu ra, cần bổ xung thêm các gia tốc thẳng tuyến tính ∆ax,∆az .

Đối với gia tốc chuyển động tịnh tiến, phương trình tuyến tính hóa đối với phương trình (2.26) với lực đẩy không đổi ( ∆P= 0 ) được xác định:



 ∆a x =





∆a

z =

 nhiễu động ∆Cx

∆C z = ( C L0



Đơn giản hóa hơn nữa các phương trình chuyển động khi thực hiện xấp xỉ trong khoảng thời gian ngắn, giả định ∆ V=0 , bỏ qua phương trình đối với lực cản, đưa ra thêm các giả định:

- Góc nghiêng quỹ đạo η0= 0 (η 0=ϑ−α );

- Thành phần (P0 cosαo / mV0)∆α trong phương trình (2.29) tương đối nhỏ, có thể bỏ qua.

Mô hình trạng thái chuyển động tuyến tính thời gian ngắn kênh độ cao có dạng như sau:



α = ω

 y





ω

y = I

 y

Thay α từ phương trình (2.32a) vào phương trình (2.32-b) ta được:









ω y



trong đó:

trình ∆az , đối với α0 nhỏ, ta được:

∆a z ≈ -

(2.33)

(2.34)

0 ), phươngtừ phương

(2.35) Các phương trình (2.33), (2.35) có thể được viết dưới dạng các thành phần dẫn xuất đối với biến ổn định và biến điều khiển:

α =−L ∆α +(1−L )ω

 α

ωy = M α ∆α + M ω



Phương trình đầu ra đối với các biến trạng thái (2.36) và bổ sung đầu ra là gia tốc thẳng (2.35) được viết dưới dạng các thành phần dẫn xuất đối với biến ổn định và biến điều khiển, như sau:



∆α= ∆α

ωy



∆a



trong đó Lα ,Lωy,Lδe, Mα ,Mωy,

định và biến điều khiển, được xác định như sau:

 q S

 L =

 0

 q Sb

M

α =

 I

 y

2.3. Xác định mô hình động học của máy bay khi ứng dụng mạng nơron nhân tạo để nhận dạng các đạo hàm hệ số khí động

2.3.1. Mô hình động học của máy bay khi ứng dụng mạng nơron nhân tạo Trong khoảng thời gian vài chục năm trở lại đây, mạng nơron nhân tạo (ANN) đã phát triển rất mạnh mẽ, được ứng dụng rộng rãi trong rất nhiều lĩnh vực kỹ thuật cũng như kinh tế [18], [22], [30], [50]. Do sự linh hoạt trong xây dựng cấu trúc mạng, sự phát triển mạnh mẽ của các thuật toán luyện mạng và

Do đặc tính xấp xỉ tốt và khả năng tổng quát hóa, ANN được sử dụng trong các bài toán điều khiển và nhận dạng với các vai trò: Mô hình thay thế

cho các hệ thống động học phi tuyến và phức tạp (mô hình động học và mô hình động học đảo) của TBB [58], [62]; Mô hình bộ điều khiển, dùng cho điều khiển phi tuyến và điều khiển thích nghi TBB; Mô hình các bộ quan sát trạng thái, đánh giá các tham số trạng thái không quan sát được phục vụ cho nhận dạng và điều khiển.

Đối với nhiệm vụ nhận dạng các hệ số khí động TBB, theo cấu trúc thuật toán nhận dạng như trên hình 1.3, tương ứng mô hình động học chuyển động TBB trong kênh độ cao (2.25), nhận thấy rằng: mô hình động học (2.25) là phi tuyến đối với các trạng thái (tốc độ V , góc gật ϑ , tốc độ góc gật ω y , góc tấn công α ) và các HSKĐ; mô hình HSKĐ kênh độ cao tổng quát cũng là các hàm phi tuyến đối với các biến trạng thái và điều khiển. Để có thể nhận dạng các HSKĐ trong kênh độ cao theo các phương pháp truyền thống, trước hết, các hệ số khí động cần được tuyến tính hóa qua các ĐHHSKĐ như mô hình (1.10), sau đó, cần phải xây dựng mô hình động học chuyển động tuyến tính từ mô hình động học chuyển động phi tuyến (2.25) theo mô hình HSKĐ tuyến tính. Một số giải pháp khi thực hiện tuyến tính hóa và đơn giản hóa mô hình động học chuyển động phi tuyến được sử dụng trong các tài liệu [5], [32], [55].

Luận án đề xuất sử dụng ANN để xấp xỉ mô hình động học chuyển động phi tuyến kênh độ cao (2.25). Về lý thuyết xấp xỉ phi tuyến sử dụng ANN, có thể sử dụng một cấu trúc mạng bất kỳ với điều kiện hàm kích hoạt của nơron trong mạng là hàm liên tục khả vi [3]. Hai dạng ANN được sử dụng nhiều nhất trong việc xấp xỉ các hàm phi tuyến phức tạp là mạng nơron nhiều lớp lan truyền thẳng (MLP) và mạng nơron hàm cơ sở xuyên tâm RBF [30], [45], [50].

Sử dụng RBF có các ưu điểm hơn so với MLP:

- Thời gian luyện mạng nơron RBF nhanh hơn MLP, do mạng nơron RBF không có trọng lượng trong liên kết đầu vào và chỉ có 1 lớp ẩn, trong khi MLP có liên kết trọng lượng tại đầu vào và thường có nhiều hơn 1 lớp ẩn.

Luyện MLP sử dụng thuật toán BP theo mô hình “supervised learning” trong khi luyện mạng nơron RBF sử dụng thuật toán “lai”, bao gồm “supervised learning” đối với lớp đầu ra và “unsupervised learning” đối với lớp ẩn [62];

- Có thể dễ dàng phân tích giá trị hàm số tại các điểm xấp xỉ, từ đó xác định sai số tại các điểm xấp xỉ để đưa ra phương án luyện mạng thích hợp (thay đổi tâm hoặc độ rộng của hàm Gauss, thay đổi trọng lượng liên kết của nơron trong lớp ra, bổ sung nơron vào lớp ẩn);

- Tính tổng quát hóa của mạng RBF được tăng lên khi sử dụng một số thuật toán điều chỉnh trong quá trình luyện mạng, ví dụ như thuật toán

“Kernel Learning” trong [28].

Việc triển khai mạng nơron RBF dùng cho xấp xỉ mô hình (2.25) cũng như trong nhận dạng các tham số khí động sẽ được xem xét trong chương 3 của luận án. Ngoài ra, Luận án cũng đề xuất sử dụng ANN thế hệ mới là mạng nơron đột biến (SNN) để nhận dạng các tham số khí động kênh độ cao.

2.3.2. Mạng nơron đột biến

Trong những năm gần đây, lĩnh vực nghiên cứu về ANN có nhiều nghiên cứu rất sâu về các quá trình sinh – hóa học diễn ra trong não bộ cũng như trong từng nơron thần kinh động vật sống, tương ứng, cũng đã xuất hiện các nghiên cứu trong việc xây dựng cấu trúc, các thuật toán xử lý liên quan đến các mô hình, luật học..., ứng dụng đối với một thế hệ ANN mới, được gọi là mạng nơron đột biến (SNN) [16], [44]. Đối với ANN thế hệ thứ nhất và ANN thế hệ thứ hai dựa trên mô hình nơron của McCulloch-Pitts, trong đó sự lan truyền, xử lý thông tin dựa trên trọng lượng liên kết giữa các nơron và sự kích hoạt phản ứng đầu ra của nơron có thể được xem như tốc độ kích hoạt được chuẩn hóa trong một chu kỳ thời gian nào đó, tức là thực hiện mã hóa tỷ lệ (Rate Coding). Với ANN thế hệ thứ nhất, hàm kích hoạt nơron được sử dụng là hàm

dạng mức; với ANN thế hệ thứ hai, hàm kích hoạt được dùng là các dạng hàm liên tục (dạng hàm sigmoid) [46].

Đối với ANN thế hệ thứ ba (SNN), việc xử lý thông tin dựa trên liên kết trọng lượng giữa các nơron và thời điểm xuất hiện đột biến (Skipping) dưới dạng xung khi đầu ra nơron đạt tới một mức ngưỡng nào đó, tức là thực hiện mã hóa thời gian xung (Pulse Encoding).

So với ANN, SNN có những ưu điểm nổi bật sau:

- Do thông tin được truyền trong mạng dưới dạng mã xung do đó bền vững với các tác động nhiễu loạn;

- Cho phép ứng dụng các quy tắc học gần giống như các quy tắc học của nơron sinh học, ví dụ như quy tắc Hebbian và quy tắc Spike Time Dependant Plasticity (STDP) [26], [44]. Các quy tắc này cho phép tăng cường hệ số trọng lượng giữa 2 nơron nếu như 2 nơron này có tương quan và suy giảm hệ số này nếu như ngược lại;

- Do sự mã hóa thông tin theo thời gian, SNN có khả năng sử dụng động học của mạng trong quá trình học, ví dụ như chuỗi các đột biến cho phép giải mã đầu ra của mạng từ các mẫu đồng bộ và điều này dẫn đến yêu cầu một số lượng nhỏ các nơron trong các tính toán [23].

2.3.2.1 Tổng quan về mô hình nơron đột biến

SNN có thể được mô hình hóa bằng nhiều mô hình khác nhau. Những mô hình này gần giống nhau trong các hành vi nơron sinh học có thể tạo ra.

Hai đặc trưng quan trọng đối với mô hình nơron đột biến:

- Sự tương tự về mặt sinh học: Nơron đột biến có thể tạo các mẫu đột biến hoặc hành vi được thể hiện gần giống nơron sinh học như hình 2.4 [10];

- Hiệu quả tính toán: Yếu tố này được xác định bởi số lượng biến được sử dụng để biểu diễn mô hình nơron và số lượng các phép toán số thực cần thiết để thực hiện trong 1 ms của mô hình mô phỏng.

Hình 2. 4. Các hành vi nơron đột biến

Khi nghiên cứu SNN có thể sử dụng nhiều loại mô hình khác nhau [10], [51], [59], các mô hình SNN có thể kể đến như sau [10]:

- Mô hình Izhikevich;

- Mô hình tích lũy và kích hoạt IF (Integrate and Fire) và tích lũy và kích hoạt có tổn thất LIF (Leaky Integrate and Fire);

- Mô hình Wilson;

- Mô hình Wang-Buszaki;

- Mô hình Morris–Lecar;

- Mô hình Hindmarsh–Rose;

- Mô hình đáp ứng đột biến SRM (Spike Response Model).

Trong các mô hình nơron đột biến, trong kỹ thuật nhận dạng tham số các hệ thống điều khiển, sử dụng nhiều nhất là mô hình IF và mô hình SRM [59].

Mô hình IF và LIF

Mô hình LIF và IF có vai trò quan trọng trong việc tìm hiểu mối quan hệ giữa tác động đầu vào nơron và sự biến đổi đầu ra của chúng. Trong mô hình LIF, hoạt động của nơron được xây dựng theo nguyên tắc nạp – phóng điện:

màng nơron được nạp bởi dòng chạy trong nó, khi điện thế màng đạt ngưỡng ung thì sẽ kích hoạt ra điện thế (đột biến) và phóng điện.

Động học của nơron theo LIF mô tả theo công thức sau:

du (t)

C =

trong đó: u ( t )- biến trạng thái mô hình (điện thế màng nơron); C - điện dung màng; R - điện trở đầu vào; i0 (t) - dòng điện đưa vào nơron; i j (t ) - dòng

điện đưa vào lớp màng từ khớp nối j ; wj - trọng số của khớp nối thứ j ; m - số khớp nối đến nơron, khi R→ ∞, công thức (2.39) trở thành mô tả mô hình IF.

Trong cả mô hình IF và LIF, điện thế màng nơron ban đầu ures . Dưới tác động của dòng điện i0(t) và i j (t ) đưa đến, điện thế màng được tăng lên. Khi u

(t ) đạt ngưỡng ung nơron phát đột biến và u (t ) trở về giá trị ures hình 2.5.

Hình 2. 5. Đồ thị thời gian của điện thế màng u(t) của nơron LIF

Trong mô hình đơn giản, dòng i ( t)có thể mô tả bằng hàm mũ:

i (t ) = ∫S j (s - t )exp(-

trong đó: τ s - hằng số thời gian khớp và Sj(t ) - chuỗi đột biến trước khớp.

Mô hình SRM

Mô hình đáp ứng đột biến (SRM) mô tả mối quan hệ giữa đột biến đầu vào và biến trạng thái trong của nơron. Để xác định mô hình SRM, xét SNN có cấu trúc như hình 2.6 [24], gồm 3 lớp: lớp đầu vào H (có S H nơron), lớp ẩn I (có S I nơron) và lớp đầu ra J (có S J nơron). Các nơron tạo các kích hoạt (đột biến) khi biến trạng thái trong "điện thế màng" u ( t ) đạt mức ngưỡng ung .

Lớp đầu vào H Lớp ẩn I Lớp đầu ra J

a) b)

Hình 2. 6. Mô hình SNN

trong hình 2.6: a) SNN truyền thẳng, b) kết nối nhiều khớp đầu ra.

Xét nơron thứ

=  t , t

, t

 1

trong đó: wij - trọng số liên kết; ti- thời điểm tác động đột biến đầu vào;

 (t)- hàm mô tả phản ứng kích động có dạng:

ε ( t ) =

Mỗi nơron thứ i lớp ẩn I và nơron thứ jlớp ra J

nối ( m khớp) (hình 2.6- b), xem xét tác động của khớp thứ k có độ giữ chậm

d kđến nơron được xác định:

yk(t ) =ε (t −t − dk )

Mở rộng phương trình (2.41) đến m khớp xác định như phương trình (2.43). Biến trạng thái uj(t) được mô tả như tổng có trọng số các tác động:

I m

u j (t ) = ∑∑wijk yik (t ) (2.44)

i =1 k=1

trong đó: wijk - trọng số liên kết với đầu ra thứ k ; k - ký hiệu chỉ số khớp kết nối giữa nơron i với nơron j ( k=1÷m ).

2.3.2.2 Các phương pháp luyện mạng SNN theo mô hình SRM

Việc luyện SNN đã được xem xét trong nhiều nghiên cứu [16], [44].

Thuật toán luyện được nghiên cứu đầu tiên dựa trên thuật toán luyện ANN thế hệ 2 là thuật toán lan truyền ngược (BP), được gọi là SpikeProp (Spike Propagation) đã được trình bày chi tiết trong [51]. Thuật toán SpikeProp có ưu điểm cơ bản là khá đơn giản trong cấu trúc và dễ triển khai theo các tính toán toán học. Hạn chế của SpikeProp là gặp phải sai số lớn khi thực hiện lấy đạo hàm bậc nhất tại các thới điểm xuất hiện đột biến và sự hội tụ khá chậm.

Giải quyết hạn chế này, đã có nhiều nghiên cứu một số thuật toán sửa đổi được đề xuất như thuật toán lan truyền ngược sai số đột biến chuẩn hóa (NSEBP) [60], SpikeProp với động học [49], [51], SpikeProp tác động nhanh lan truyền đàn hồi (RProp) [24], phương pháp học có giám sát từ xa (ReSuMe) [44].

Mỗi một thuật toán này đều có các ưu điểm và hạn chế nhất định.

2.3.2.3 Thuật toán lan truyền ngược sai số đột biến

Trong thuật toán lan truyền ngược sai số đột biến (SpikeProp) [24], [51],

thời điểm phát đột biến đầu ra đối với nơron khi điện áp đầu ra (xác định theo công thức (2.44)) đạt mức ngưỡng (u(t ) = ung ), biểu diễn trên hình 2.7.

Hình 2.7. Đồ thị biểu diễn đột biến được phát khi u ( t ) = ung Việc lan truyền ngược sai số thời gian được thực hiện như sau:

- Đối với lớp đầu ra

- Xác định hàm sai số trung bình bình phương giữa chuỗi đột biến đầu ra mong muốn T

trong đó: ta - thời điểm đột biến đầu ra thực tế thứ j( j=1 ÷N

đột biến đầu ra mong muốn; NJ - số lượng đột biến đầu ra;

- Khi lan truyền ngược sai số, tính toán thay đổi trọng số liên kết

∆wk= −à

với à - tốc độ học; wk - trọng số của liờn kết k từ nơron i

tout

- Thành phần gradient được tính theo công thức chuỗi:

trong đó:

(2.47)

yik (taj ) (2.48)

Với giả thiết uj(t) thay đổi tuyến tính bậc nhất so với t trong khoảng lân cận giá trị tại thời điểm đạt đến mức ngưỡng kích hoạt đột biến:

do đó:

∆wijk= −à yik (t aj )(t aj - t dj )

= ∂u j (t )

∂t j(u j)

NI m

 wijk ( ∂yik (t aj ) / ∂taj )

i =1 k =1

∂t a

δi= i

∂u (ta ) ∂t

i i

Các thành phần trong (2.52) được tính như sau:

- Thành phần thứ nhất:

∂u j (t aj )

-Thành phần thứ hai:

∂tia

NI

Như vậy đối với lớp ẩn, quy tắc điều chỉnh trọng số như sau:

∆whik= −ηyhk(tia)δi= −η

Quy tắc điều chỉnh trọng số trong phương trình (2.53) với SNN nhiều lớp ẩn bằng cách tính theo ảnh hưởng lan truyền ngược sai số.

Thuật toán SpikeProp được thực hiện theo các bước sau [51]:

Bước 1: Xác định chuỗi đột biến đầu vào T

đột biến đầu ra đích T

mong muốn E0 mà bài toán cần đạt được;

Bước 2: Xác định cấu trúc SNN (số nơron trong lớp đầu vào SH , số nơron lớp ẩn S I và số nơron lớp đầu ra SJ , số khớp kết nối m);

Bước 3: Khởi tạo ma trận trọng số ban đầu; tính toán lan truyền thuận theo công thức (2.44) với các trọng số W0 đã chọn, so sánh giá trị ngưỡng, xác định thời điểm kích hoạt thực tế t aj ;

Bước 4: Xác định hàm sai số trung bình bình phương E giữa tập đột biến đầu ra mong muốn T

Bước 5: Đối với lớp đầu ra J , Tính δj cho tất cả các đầu ra theo (2.51);

điều chỉnh trọng số lớp ra theo (2.50);

Bước 7: Thuật toán SpikeProp sẽ lặp lại từ bước 2 đến bước 7 cho đến khi sai số trung bình bình phương E≤ E0 .

Bước 8: Xác định chuỗi đột biến đầu ra Ta và sai lệch chuẩn.

2.4. Kết luận chương 2

Chương 2 của luận án đã xây dựng các mô hình chuyển động trong không gian của một lớp máy bay cánh bằng. Từ việc phân tích các phương trình chuyển động cơ bản theo định luật Newton đã đưa về dạng biểu diễn qua các hệ số (đạo hàm hệ số) khí động đối với các thành phần ổn định và điều khiển phục vụ mục đích nhận dạng các hệ số (đạo hàm hệ số) khí động này.

Dựa trên các giả định hợp lý về chế độ bay và các điều kiện môi trường cho phép phân tích mô hình chuyển động máy bay trong không gian thành chuyển động trong các kênh độc lập, từ đó xác định được mô hình chuyển động phi tuyến trong kênh độ cao. Thực hiện tuyến tính hóa từng đoạn đối với mô hình động học phi tuyến để xây dựng các mô hình động học tuyến tính đối với các ĐHHSKĐ trong kênh độ cao. Các bài báo 2 và 3 đã thực hiện nhận dạng các ĐHHSKĐ kênh độ cao của máy bay theo các phương pháp truyền thống (phương pháp LR và OEM). Trong các bài báo này xây dựng được các mô hình động học tuyến tính trong kênh độ cao của máy bay phục vụ cho nhận dạng.

Để có thể sử dụng mô hình động học phi tuyến trong kênh độ cao, chương này đã phân tích việc sử dụng ANN và SNN xấp xỉ các mô hình động học phi tuyến, đưa ra mô hình và thuật toán luyện mạng SNN thông dụng nhất làm cơ sở trong chương 3 thực hiện nhận dạng các đạo hàm hệ số khí động.

Các bài báo 4 và 5 đã thực hiện ứng dụng ANN vào nhận dạng các tham số khí động của máy bay. Trong các bài báo này đã xây dựng được mô hình động học phi tuyến trong kênh độ cao và sử dụng cấu trúc ANN thay thế mô hình động học phi tuyến trong kênh độ cao của máy bay.

Mô hình trạng thái chuyển động tuyến tính kênh độ cao

Mô hình khí động của thiết bị bay

Tình hình nghiên cứu ngoài nước