Lọc Kalman và lọc Kalman mở rộng

Một phần của tài liệu Luận án tiến sĩ ứng dụng phương pháp lọc bayes và mô hình markov ẩn trong bài toán quan sát quỹ đạo đa mục tiêu (Trang 26)

1.3.1. Lọc Kalman

Lọc Kalman là ước lượng tuyến tính đệ quy, ước lượng trạng thái của x(t)

dựa trên cơ sở các quan sát có tính chu kỳ của chính trạng thái đó, thông số của x(t) phát triển tuần tự theo thời gian, các giá trị quan sát z(t) phụ thuộc tham số này. Kết quả của ước lượng chính là sai số trung bình bình phương nhỏ nhất ˆ x(i|j) = arg min ˆ x(i|j)∈RnE(x(i)−xˆ)(x(i)−xˆ)T|Zt = arg min ˆ x(i|j)∈RnE(x(i)−xˆ)(x(i)−xˆ)T|z(1), . . . ,z(t) , trong đó: z(j), j = 1, t, là các quan sát được thực hiện ở thời điểm thứ j,

Zt = {z(1), . . . ,z(t)} là dãy các quan sát đến thời điểm t. Đặt L(t) = E(x(i)−xˆ)(x(i)−xˆ)T |Zt = Z ∞ −∞ (x(t)−xˆ(t))T(x(t)−xˆ(t))P(x(t)|Zt)dx. (1.15)

Ta có: ˆ x(t) = Z ∞ −∞ x(t)P(x|Zt)dx= E{x(t)|Zt} (1.16) Lọc Kalman chính là kỳ vọng có điều kiện của x(t) dựa trên dãy các quan sát, đó là giá trị trung bình chứ không phải là một giá trị hợp lý nhất.

Ta xét mô hình trạng thái được ước lượng trong dạng không gian trạng thái chuẩn

˙

x(t) = F(t)x(t) + B(t)u(t) +G(t)v(t), (1.17) ở đây:

x(t) ∈ Rn là vectơ trạng thái quan tâm,

u(t) ∈ Rs là một điều khiển đầu vào đã biết,

v(t) ∈ Rq là nhiễu ngẫu nhiên trắng,

F(t) là ma trận (mô hình) trạng thái n×n,

B(t) là ma trận đầu vào n×s, và

G(t) là ma trận nhiễu n×q. 1.3.1.1.Quan sát với thời gian liên tục

Mô hình quan sát (đầu ra) trong dạng không gian trạng thái chuẩn:

z(t) = H(t)x(t) + D(t)w(t), (1.18) trong đó: z(t) ∈ Rm là vectơ quan sát, w(t) ∈ Rr là nhiễu trắng, H(t) là ma trận (mô hình) quan sát m×n, D(t) là ma trận nhiễu quan sát m×n.

Những phương trình này tính toán các quan sát theo thời gian liên tục, tuy nhiên lọc Kalman hầu như luôn thực hiện trong thời gian rời rạc.

1.3.1.2. Quan sát với thời gian rời rạc

Phương trình (1.18) có thể được viết trong thời gian rời rạc như sau:

z(tk) =H(tk)x(tk) + D(tk)w(tk),∀tk ∈ T, (1.19) trong đó,

z(tk) là vectơ quan sát với thời gian rời rạc,

x(tk) là trạng thái với thời gian rời rạc,

w(tk) là vectơ nhiễu với thời gian rời rạc,

H(tk) và D(tk) là mô hình quan sát và nhiễu được ước lượng tại thời gian rời rạc tức thời tk,

T= {t0, t1, . . . , tk, . . .}.

Dạng thời gian rời rạc của phương trình trạng thái đòi hỏi tích phân của phương trình (1.17) trên khoảng (tk, tk−1) là:

x(tk) = Φ(tk, tk−1)x(tk−1) + Z tk tk−1 Φ(tk, τ)B(τ)u(τ)dτ + Z tk tk−1 Φ(tk, τ)G(τ)dτ, (1.20) trong đó,Φ(., .)là ma trận chuyển trạng thái thỏa mãn phương trình vi phân ma trận

˙Φ(tk, tk−1) =F(tk)Φ(tk, tk−1), Φ(tk, tk−1) = 1. (1.21) Khi F(t) = F là ma trận không đổi, ma trận chuyển trạng thái được cho bởi:

Φ(tk, tk−1) = Φ(tk −tk−1) = expF(tk −tk−1) (1.22) Nếu u(t) = u(tk) và v(t) = v(tk) giữ nguyên gần như không đổi trên khoảng (tk−1, tk) thì các mô hình thời gian rời rạc có thể được xác định;

B(tk) := Z tk tk−1 Φ(tk, τ)B(τ)dτ (1.23) G(tk) = Z tk tk−1 Φ(tk, τ)G(τ)dτ.

Phương trình (1.20) có thể được viết lại trong một dạng thời gian rời rạc tương đương với phương trình (1.17):

x(tk) = F(tk)x(tk−1) +B(tk)u(tk) + G(tk)v(tk). (1.24) Sự chính xác của mô hình này có thể được hoàn thiện bằng cách lấy giá trị trung bình cho cả u(t) và v(t) trên mẫu.

Trong hầu hết các trường hợp, khoảng thời gian ∆Tk := tk−tk−1 giữa các mẫu liên tiếp của trạng thái giữ nguyên không đổi.

Phương trình (1.24) được viết là:

x(k) =F(k)x(k −1) +B(k)u(k) +G(k)v(k), (1.25) và phương trình (1.19):

z(k) = H(k)x(k) +D(k)w(k). (1.26) Giả thiết rằng dãy ngẫu nhiên v(k) và w(k) mô tả quá trình xử lý và nhiễu quan sát đều là Gauss, không tương quan và có kỳ vọng không

E{v(k)} = E{w(k)} = 0, ∀k, (1.27) với hiệp phương sai (covariance) đã biết

E{v(i)vT(j)} = δijQ(i), E{w(i)wT(j)} = δijR(i), (1.28) với δij =      1 nếu i = j 0 nếu i 6= j .

Giả thiết một cách tổng quát là các nhiễu quá trình xử lý và quan sát không tương quan

E{v(i)wT(j)} = 0, i, j. (1.29) Nếu các dãy v(k) và w(k) tương quan theo thời gian, việc sử dụng lọc Kalman là hợp lý. Nếu dãy nhiễu quan sát không có phân bố Gauss nhưng đối xứng với các mô-men hữu hạn thì lọc Kalman cũng là một ước lượng tốt. Tuy nhiên, nếu dãy có một phân bố lệch, không đối xứng thì kết quả được đưa ra bởi lọc Kalman sẽ sai lệch và đó là trường hợp tốt để sử dụng lọc Bayes phức tạp hơn.

1.3.1.3. Thuật toán lọc Kalman

Thuật toán lọc Kalman đưa ra các ước lượng cực tiểu sai số trung bình bình phương có điều kiện trong một dãy quan sát đã cho

ˆ

x(i|j) = arg min ˆ

x(i|j)∈RnE{(x(i)−xˆ)(x(i)−xˆ)T|z(1), . . . ,z(j)}, (1.30) với z(j) là quan sát tại thời điểm j.

Như đã nói ở trên (phương trình (1.16)), ước lượng thu được đơn giản là giá trị kỳ vọng của trạng thái tại thời điểm i bị ràng buộc bởi các quan sát tới thời điểm j. Do đó, ước lượng được định nghĩa là kỳ vọng có điều kiện

ˆ

x(i|j) := E{(x(i)|z(1), . . . ,z(j))}:= E{(x(i)|Zj)}, (1.31) trong đó, Zj = {z(1), . . . ,z(j)} là dãy các quan sát tới thời điểm j.

Phương sai ước lượng được định nghĩa là sai số trung bình bình phương trong ước lượng này

P(i|j) := E{(x(i)−xˆ)(x(i)−xˆ)T|Zj}. (1.32) - Ước lượng trạng thái tại thời điểm k, tất cả thông tin được cho tới tận

thời điểm k là xˆ(k|k).

- Ước lượng trạng thái tại thời điểm k mà thông tin chỉ được cho tới thời điểm k−1 được gọi là dự báo trước một bước (a one-step-ahead prediction) (hoặc nói ngắn gọn chỉ là một dự báo) và được viết là xˆ(k|k −1).

Phương sai P(k − 1|k − 1) trong ước lượng này là đã biết. Khi đó, các bước đệ quy của lọc Kalman gồm:

❼ Bước dự báo: ˆ x(k|k−1) = F(k)ˆx(k −1|k−1) +B(k)u(k), (1.33) P(k|k −1) = F(k)P(k −1|k−1)FT(k) + G(k)Q(k)GT(k). (1.34) ❼ Bước hiệu chỉnh: ˆ x(k|k) = ˆx(k|k−1) +W(k)(z(k)−H(k)ˆx(k|k−1)), (1.35) P(k|k) = (1−W(k)H(k))P(k|k−1)(1−W(k)H(k))T +W(k)R(k)WT(k). (1.36) trong đó, ma trận thu hoạch (the gain matrix) W(k) được cho bởi:

W(k) = P(k|k −1)H(k)[H(k)P(k|k−1)HT(k) +R(k)]−1. (1.37) 1.3.2. Lọc Kalman mở rộng

Lọc Kalman mở rộng (the extended Kalman filter: EKF) là lọc Kalman trong trường hợp mô hình trạng thái hoặc mô hình quan sát không tuyến tính.

Xét các mô hình trạng thái được mô tả trong không gian trạng thái ký hiệu bởi một phương trình vi phân vectơ không tuyến tính cấp một hoặc mô

hình trạng thái có dạng

˙

x(t) = f[x(t),u(t),v(t), t], (1.38) trong đó:

x(t) ∈ Rn là trạng thái quan tâm,

u(t) ∈ Rs là một điều khiển đầu vào đã biết,

f[., ., .] là ánh xạ đưa trạng thái và điều khiển đầu vào trạng thái “vận tốc”,

v(t) là một vectơ ngẫu nhiên mô tả nhiễu truyền động lực học và các tình trạng không rõ ràng trong mô hình trạng thái chính nó (v(t) thường được giả thiết cộng tính).

1.3.2.1.Quan sát với thời gian liên tục

Xét mô hình quan sát được mô tả trong không gian trạng thái ký hiệu bởi một hàm vectơ không tuyến tính có dạng

z(t) =h[x(t),u(t),w(t), t] (1.39) ở đây:

z(t) ∈ Rm là quan sát được thực hiện tại thời điểm t,

h[., ., .] là ánh xạ đưa trạng thái và điều khiển đầu vào vào các quan sát,

w(t) là một vectơ ngẫu nhiên mô tả cả nhiễu làm sai lệch và các tình trạng không rõ ràng trong mô hình đơn vị của chính nó (w(t) thường được giả thiết cộng tính).

1.3.2.2. Quan sát với thời gian rời rạc

Cũng giống như lọc Kalman, EKF hầu hết thực hiện trong thời gian rời rạc. Xét dạng rời rạc của phương trình (1.38), (1.39). Ta có mô hình quan

sát với thời gian rời rạc như sau:

z(tk) =h[x(tk),u(tk),w(tk), tk], ∀tk ∈ t (1.40) trong đó:

z(tk), x(tk), u(tk) lần lượt là các vectơ quan sát, trạng thái và nhiễu thời gian rời rạc được đánh giá tại thời gian rời rạc tức thời tk,

t = {t0, t1, . . . , tk, . . .} là tập thời gian rời rạc.

Dạng thời gian rời rạc của phương trình trạng thái là tích phân của phương trình (1.38) trên khoảng (tk, tk−1)

x(tk) =x(tk−1) +

Z tk tk−1

f[x(τ),u(τ),v(τ), τ]dτ. (1.41) Trong thực hành, tích phân được tính bình thường bằng các sử dụng phương pháp xấp xỉ Euler đơn (sai phân lùi).

x(tk) =x(tk−1) + ∆Tkf[x(tk−1),u(tk−1),v(tk−1), tk−1], (1.42) trong đó, ∆Tk = tk −tk−1.

Cũng như lọc Kalman, khi các khoảng mẫu không đổi, thời gian được lập mối liên hệ với k, ta viết các phương trình (1.42) và (1.40) được viết như sau:

x(k) =x(k −1) + ∆Tf[x(k −1),u(k −1),v(k−1), k −1], (1.43) và

z(k) =h[x(k),u(k),w(k), k]. (1.44) 1.3.2.3. Thuật toán lọc Kalman mở rộng với thời gian rời rạc

Xấp xỉ các trạng thái và các quan sát thời gian rời rạc, mô hình trạng thái được viết như sau

và mô hình quan sát

z(k) = h(x(k),w(k)), (1.46) với x(k) là trạng thái tại thời điểm k, z(k) là quan sát đến thời điểm k.

Giống như lọc Kalman, giả sử các nhiễu v(k) và w(k) đều là nhiễu trắng, có phân bố Gauss, không tương quan và có kỳ vọng không với phương sai đã biết được định nghĩa trong các phương trình (1.27) - (1.29). Mục đích sử dụng lọc Kalman mở rộng là cực tiểu sai số trung bình bình phương và tính toán một xấp xỉ cho kỳ vọng có điều kiện. Do đó, giả sử tồn tại một ước lượng trạng thái tại thời điểm k−1, ước lượng này xấp xỉ bằng kỳ vọng có điều kiện

ˆ

x(k−1|k−1) ≈E{x(k−1)|Zk−1}. (1.47) Nguyên lý của EKF bắt nguồn từ những nguyên lý của lọc Kalman tuyến tính với các quan sát được tuyến tính hóa như một chuỗi Taylor tương ứng với ước lượng và dự báo. Thuật toán gồm có hai bước:

❼ Bước dự báo: một dự báo xˆ(k|k−1) cho trạng thái tại thời điểm k và hiệp phương sai của nó P(k|k−1) được tính thông qua

ˆ

x(k|k −1) = f(ˆx(k −1|k−1),u(k)) (1.48)

P(k|k−1) = ∇fx(k)P(k−1|k −1)∇Tfx(k) +∇fv(k)Q(k)∇Tfv(k). (1.49) ❼ Bước hiệu chỉnh: Tại thời điểm k, một quan sát z(k) được thực hiện và ước lượng được điều chỉnh xˆ(k|k) của trạng thái x(k) cùng với hiệp phương sai ước lượng điều chỉnh P(k|k) được tính từ dự báo trạng thái và quan sát theo

ˆ

P(k|k) =P(k|k−1)−W(k)S(k)WT(k), (1.51) ở đây

W(k) = P(k|k −1)∇Thx(k)S−1(k), (1.52) và

S(k) = ∇hx(k)P(k|k−1)∇Thx(k) +∇hw(k)R(k)∇Thw(k), (1.53) với ma trận Jacobian ∇f(k) được tính tại x(k −1) = ˆx(k − 1|k −1)

và ∇h(k) được tính tại x(k) = ˆx(k|k−1). 1.4.Một số vấn đề về quá trình ngẫu nhiên

1.4.1. Quá trình Poisson1.4.1.1.Phân phối Poisson 1.4.1.1.Phân phối Poisson

Định nghĩa 1.4.1. Ta nói rằng biến ngẫu nhiên X có phân phối Poisson với tham số λ, λ >0 nếu:

P [X = k] = λ k k! e −λ , k = 0,1,2, . . . Tính chất 3.

❼ Nếu X và Y là hai biến ngẫu nhiên có phân phối Poisson độc lập với tham số λ1, λ2 tương ứng (λ1 > 0, λ2 > 0) thì X + Y có phân phối Poisson với tham số λ = λ1 +λ2.

❼ Giả sử N là biến ngẫu nhiên có phân phối Poisson với tham số λ, λ >0, và X là biến ngẫu nhiên sao cho:

P [X = k|N = n] = Cnkpk(1−p)n−k, k = 0,1,2, . . . , n Khi đó, X có phân phối Poisson với tham số λ.p

1.4.1.2.Quá trình Poisson

Định nghĩa 1.4.2. Giả sửA là biến cố nào đó, ký hiệuN(t), t≥ 0, là số lần biến cố A xuất hiện trong khoảng thời gian từ 0đến t(kể cả thời điểm t). Khi đó,{N(t), t ≥ 0}được gọi là quá trình đếm. Ký hiệuN (s, t] = N(t)−N(s),

0 ≤ s < t là số lần biến cố A xảy ra trong khoảng thời gian (s, t]. Khi đó, {N(s, t],0 ≤ s < t} được gọi là quá trình điểm ứng với quá trình đếm

{N(t), t ≥0}.

Để định nghĩa quá trình Poisson và chỉ ra mối quan hệ mật thiết của nó với quá trình đếm, chúng ta đưa ra các khái niệm và tính chất sau đây:

a. Tính chất có gia số độc lập: Quá trình ngẫu nhiên {Z(t), t ≥ 0} được gọi là có gia số độc lập nếu với mọi m = 2,3, . . . và với mọi 0 = t0 < t1 < · · · < tm, các gia số Z (t0, t1], Z(t1, t2],. . . , Z(tm−1, tm] là các biến ngẫu nhiên độc lập, trong đó:

Z (tk, tk+1] = Z(tk+1)−Z(tk), k = 0,1, . . . , m−1.

b. Tính chất có gia số dừng: Quá trình {Z(t), t ≥0} được gọi là có gia số dừng nếu với mọi s > 0,0 ≤ t1 < t2, các gia số Z(t1+s, t2+s], Z(t1, t2]

là các biến ngẫu nhiên có cùng phân phối xác suất.

c. Tính chất c: Ta nói quá trình {Z(t), t ≥ 0} có tính chất c nếu tồn tại một hằng số λ, λ >0, sao cho với h > 0 đủ nhỏ thì:

P [Z(h) = 1] = λ h+ o(h),

ở đây, o(h) là ký hiệu vô cùng bé bậc cao hơn của h (khi h → 0).

d. Tính chất d: Ta nói quá trình {Z(t), t ≥0}có tính chất d nếu với h > 0

đủ nhỏ thì:

Định nghĩa 1.4.3. (Định nghĩa quá trình Poisson)

Ta nói rằng {X(t), t ≥ 0} là quá trình Poisson với cường độ λ (hoặc tham số λ), λ >0, nếu:

i. X(t) nhận các giá trị 0,1,2, . . . ,∀t > 0. ii. {X(t), t ≥ 0} là quá trình có gia số độc lập.

iii. Mỗi gia số X(t+s)−X(s), s ≥ 0, t > 0, là biến ngẫu nhiên có phân phối Poisson với tham số λ t.

iv. X(0) = 0.

Các tính chất trực tiếp (cần cho luận án): Tính chất 4.

❼ Nếu {X(t), t ≥ 0} là quá trình Poisson thì X(t) là biến ngẫu nhiên có phân phối Poisson với tham số λ t.

❼ Quá trình Poisson là quá trình đếm có các tính chất a, b, c và d; Ngược lại, quá trình đếm có các tính chất a, b, c, d là quá trình Poisson. Ghi chú:

Do trong luận án chỉ sử dụng đến quá trình Poisson thuần nhất theo thời gian, nghĩa là cường độ của quá trình là hằng số không phụ thuộc vào thời gian, nên ở đây chúng tôi chỉ định nghĩa và trích lọc một vài tính chất cần thiết của quá trình Poisson thuần nhất cần cho luận án.

Trong trường hợp không thuần nhất, nghĩa là trường hợp cường độ phụ thuộc vào thời gian, tức là λ = λ(t), chúng ta có quá trình Poisson không thuần nhất (theo thời gian). Khi đó, gia số X(t)−X(s) là biến ngẫu nhiên có phân phối Poisson với tham số:

Z t s

1.4.1.3.Quá trình điểm Poisson tổng quát

Giả sử S là một tập khác rỗng trong không gian tổng quát nào đó (chẳng hạn trong không gian Rd); ký hiệu A là họ các tập con nào đó của S; ký hiệu µ(.) là độ đo xác định trên A; khi đó, (S,A, µ) là một không gian có độ đo tổng quát. Xét (S,A, µ) là không gian có độ đo nào đó.

Định nghĩa 1.4.4. Ta gọi quá trình điểm Poisson thuần nhất trong S là họ các biến ngẫu nhiên {N(A), A ∈ A} sao cho:

i. Với mỗi A ∈ A, µ(A) < ∞ thì N(A) là biến ngẫu nhiên Poisson với tham số λ·µ(A); λ = const nào đó.

ii. NếuA1,A2,. . . ,An là các tập con rời nhau thuộcAthìN(A1),N(A2),. . . ,

N(An) là các biến ngẫu nhiên độc lập và

N n [ k=1 Ak ! = n X k=1 N(Ak) h.c.c

KhiS là tập con trong không giand-chiều (Rd) với độ đo (Lebesgue) thông thường, thì {N(A), A ∈ A} được gọi là quá trình (Poisson) không gian d- chiều. Ký hiệu ]|A|[ là diện tích (d = 2), thể tích (d = 3),. . . , của A; chúng ta dùng một từ chung gọi ]|A|[ là cỡ của A.

Do mục tiêu nghiên cứu và cách tiếp cận nên có một số định nghĩa quá trình điểm Poisson không giống nhau (có thể xem [2],[23]), song các định nghĩa đó là tương đương. Với mục đích phục vụ cho luận án nên ở đây chúng tôi dùng định nghĩa như vừa phát biểu ở trên.

Ta có tính chất quan trọng sau đây: Định lý 1.4.5 (xem [2])

Giả sử {N(A), A ∈ A} là một quá trình điểm Poisson tổng quát nào đó,

]|A|[> 0 và A1, A2,. . . , Am là một phân hoạch của A. Khi đó,

= n! k1!k2! . . . km! m Y i=1 ]|Ai|[ ]|A|[ ki ,

trong đó, n≥ 1và các k1, k2,. . . ,km là các số nguyên dương sao cho m

X

i=1

ki =

n.

Từ định lý này, chúng ta thấy nếu A chứa n điểm thì n điểm này độc lập và phân phối đều trong A.

1.4.1.4.Quá trình Poisson phức hợp

Định nghĩa 1.4.6. Giả sử {X(t), t ≥ 0} là quá trình Poisson với cường độ λ, λ > 0; {Yk, k = 1,2, . . .} là dãy các biến ngẫu nhiên độc lập, cùng phân phối và dãy này độc lập với {X(t), t ≥ 0}. Khi đó, chúng ta gọi:

Z(t) = X(t) X k=1 Yk , t ≥ 0 là quá trình Poisson phức hợp.

Các khái niệm, các tính chất và các kết quả trích lọc giới thiệu trong tiểu mục (1.4.1) này có thể tham khảo ở các tài liệu [1],[2],[23],...

1.4.2. Quá trình Markov

1.4.2.1.Các định nghĩa và các khái niệm cơ bản

Tính Markov của quá trình ngẫu nhiên và các định nghĩa liên quan:

Giả sử{X(t), t ≥0}là một quá trình ngẫu nhiên. Ký hiệuF≤s = σ({X(l), l ≤ s})

làσ-đại số cảm sinh bởi họ các biến ngẫu nhiên{X(l), l ≤ s}; Fs = σ(X(s))

là σ-đại số cảm sinh bởi biến ngẫu nhiên X(s).

Markov nếu:

E{X(t)|F≤s} = E{X(t)|Fs}, ∀t > s≥ 0.

Định nghĩa 1.4.8. Ta nói quá trình ngẫu nhiên {X(t), t ≥ 0} có tính Markov nếu:

P [X(tn+1)|X(t0), X(t1), . . . , X(tn)] = P [X(tn+1)|X(tn)]

với bất kỳ 0≤ t0 < t1 < · · · < tn < tn+1.

Hai định nghĩa trên là tương đương. Việc phát biểu cả hai dạng định nghĩa ở đây nhằm mục đích để tiện sử dụng trong các nội dung sau này.

Ký hiệu E là không gian giá trị của quá trình ngẫu nhiên {X(t), t ≥ 0}

(E sẽ được gọi là không gian trạng thái của quá trình {X(t), t ≥0}). Chúng ta có các khái niệm sau đây:

Định nghĩa 1.4.9. Quá trình ngẫu nhiên {X(t), t ≥ 0} có tính Markov thì

{X(t), t ≥0} được gọi là quá trình Markov.

Nếu {X(t), t ≥ 0} là quá trình Markov thì E được gọi là không gian trạng thái của quá trình Markov {X(t), t ≥ 0}.

Nếu quá trình Markov {X(t), t ≥0} có không gian trạng thái E có lực lượng không quá đếm được thì {X(t), t ≥ 0} được gọi là xích Markov.

Nếu xích Markov {X(t), t ≥0} có không gian trạng thái có lực lượng hữu

Một phần của tài liệu Luận án tiến sĩ ứng dụng phương pháp lọc bayes và mô hình markov ẩn trong bài toán quan sát quỹ đạo đa mục tiêu (Trang 26)

Tải bản đầy đủ (PDF)

(106 trang)