Chiến lược "K(ε) tối ưu" và thuật tốn tìm chiến lược "K(ε)

Một phần của tài liệu Luận án Tiến sĩ Ứng dụng phương pháp lọc bayes và mô hình markov ẩn trong bài toán quan sát quỹ đạo đa mục tiêu (Trang 64)

-tối ưu"

Trong mục này luận án trình bày với T là một tiêu chuẩn cụ thể và rất phổ dụng trong thực tiễn, đó là tiêu chuẩn "K(ε) -tối ưu" (được định nghĩa

trong phần tiếp sau đây). Dựa trên ý tưởng của lọc Kalman khi xử lý tín hiệu để ước lượng quỹ đạo của mục tiêu (xem [20],[41],[42][71]), ở đây chúng ta đưa ra một quan điểm mới để xem xét sự tốt hay không của chiến lược theo Định nghĩa 2.3.6, cụ thể như sau: Như đã nêu ở Định nghĩa 2.3.5, một chiến lược xác định một họ các dây chuyền liên kết dữ liệu trong Y(0 : T); trong

đó, mỗi dây chuyền là dây chuyền dữ liệu ảnh của một quỹ đạo xác định của một mục tiêu xác định nào đó. Theo quan điểm của lọc Kalman, chúng ta thấy rằng nếu dùng các giá trị quan sát (dây chuyền dữ liệu ảnh) để ước lượng quỹ đạo thực của mục tiêu tương ứng theo lọc Kalman thì dây chuyền ảnh là tốt nếu như phương sai ước lượng P(t|t) là bé nhất và khơng vượt q một ngưỡng sai lệch cho trước nào đó. Một chiến lược {ft|t = t1, ..., tn} là tốt nếu như mọi dây chuyền của nó là tốt. Chính xác hơn, chúng ta có định nghĩa sau đây:

Định nghĩa 2.5.1. Chiến lược {ftK(ε)|t = t1, ..., tn} được gọi là chiến lược tối ưu ε-ngưỡng (và gọi tắt là K(ε) -tối ưu) nếu như mọi dây chuyền liên liên kết dữ liệu của nó thỏa mãn các điều kiện sau đây:

A1 – Khi sử dụng dữ liệu của dây chuyền để ước lượng quỹ đạo thực của mục tiêu tương ứng theo lọc Kalman thì phương sai ước lượng P(t|t) là cực tiểu với mọi t thuộc miền thời gian tồn tại của dây chuyền.

A2 – Giá trị phương sai ước lượng P(t|t) vừa nêu trong (A1 –) không vượt quá ε, ε > 0, với mọi t thuộc miền thời gian tồn tại của dây chuyền.

Ở đây, ε > 0, ε cho trước bé tùy ý, được gọi là ngưỡng chấp nhận của chiến lược.

Chiến lược được định nghĩa trong Định nghĩa 2.5.1 được gọi là "K(ε) -tối ưu". Áp dụng kết quả của mục 2.3.4 chúng tơi đưa ra thuật tốn tìm chiến lược "K(ε) -tối ưu" như sau:

Giả sử cho ε là một số cho trước bé tùy ý. Giá trị ε sẽ được gọi là ngưỡng sai lệch.

Theo Định nghĩa 2.3.4, 2.3.5, 2.3.6 và 2.5.1 chúng ta xây dựng chiến lược K(ε) -tối ưu. Điều đó có nghĩa là chúng ta đi xây dựng họ {ftK(ε) | t =

t1, t2, . . . , tn}thỏa mãn yêu cầu địi hỏi. Tư tưởng của thuật tốn là: phương pháp MHT kết hợp với lọc Kalman mở rộng. Chúng ta cần một số khái niệm và ký hiệu sau:

Trong bài toán MTT, các hàm Fk(·) trong mơ hình biến đổi trạng thái là chưa biết. Trong thực tế người ta có thể có một số thơng tin tiên nghiệm nào đó hay có thể có một số dự báo nào đó về dạng, loại hoặc tính chất của các hàm này. Những thơng tin tiên nghiệm và dự báo về các hệ động lực trong mơ hình biến đổi trạng thái (quá trình chuyển động) của mục tiêu Xk

t được biểu diễn bởi họ {Fk

θ | θ ∈ Θ} . Thực tế không cần phân định một quỹ đạo cụ thể này là quỹ đạo của mục tiêu thứ mấy, nên khơng mất tính tổng qt người ta coi Fk

θ không phụ thuộc vào k, nghĩa là, Fk

θ ≡ Fθ, θ ∈ Θ.

Ký hiệu F = {Fθ | θ ∈ Θ} và gọi là tập thông tin tiên nghiệm và dự báo về hệ động lực có thể có của các mục tiêu cần quan sát. Cần lưu ý rằng nếu khơng có thơng tin tiên nghiệm hay dự báo nào thì khi giải quyết bài tốn phải xét với mọi hàm là ánh xạ đo được: Fθ : Rnx → Rnx. Chúng ta nghiên cứu chỉ với giả thiết Card(Θ) < +∞. Thơng tin tiên nghiệm và dự báo

càng tốt thì Card(Θ) càng nhỏ và số lượng tính tốn trong thuật tốn càng giảm đi.

Khi sử dụng lọc Kalman trong tính tốn liên quan chặt chẽ với mơ hình biến đổi trạng thái F, mơ hình quan sát G và tập dữ liệu quan sát Zt. Song do mơ hình quan sát G là khơng thay đổi và đã biết nên chúng ta không cần chỉ rõ sự phụ thuộc vào G. Khi thực hiện bài toán lọc (2.1) - (2.3) với F = Fθ, bộ dữ liệu quan sát Zt

bước t và ký hiệu là:

PFθ

lij (t | t).

Để đơn giản trong trình bày cũng như để thuận tiện trong cài đặt, ta trình bày thuật tốn tìm chiến lược K(ε) -tối ưu theo các bước như sau:

Bước 1:

Xét thời điểm hiện tại t, 1 6t 6T.

(thực hiện tuần tự t = t1, t2, . . . , tn, nếu t = tk thì tk −1 = tk−1). Tạo tập dữ liệu quan sát ở thời điểm t (nếu t 6 T):

Y(t) ={Yj

t ,16 j 6 nt}.

(Nếu khơng có số liệu thực tế từ bài tốn MTT cụ thể thì tập Y(t) được tạo bằng mơ phỏng theo phân phối Poisson).

Chuyển sang bước 2. Bước 2:

Xét i, 1 6 i 6nt−1 ⇐⇒ xác định Yi t−1. Với mỗi l, 06 l 6 Card(f−1

t−1(Yi

t−1)), được xét tuần tự với:

l = 0,1, . . . , Card ft−1−1(Yi t−1), sử dụng lọc Kalman tính PFθ

lij (t| t) ứng với mọi j,1 6 j 6 nt, nghĩa là ứng với mọi: Zt l(j) = DLl(t−1)−, Yi t−1 ∪ {Yj t }, 16 j 6nt. Tính: δli = min 16j6nt{min θ∈Θ PFθ lij(t| t)}. So sánh:

– Nếu δli >ε(ngưỡng cho trước), ta kết luận dây chuyềnLl[(t−1)−, Yi t−1]

kết thúc tại đỉnh cuối Yi

t−1 (⇐⇒ ftK(ε)(Yi

t−1) = ∅) và chuyển sang bước 3.

– Nếu δli < ε, ký hiệu

(j∗, θ∗) = arg min

16j6nt{min

θ∈Θ PFθ

lij(t| t)}, khi đó dây chuyền Ll[(t−1)−, Yi

t−1] được nối tiếp từ đỉnh Yi

t−1 sang đỉnh Ytj∗ theo quỹ đạo chuyển trạng thái Fθ∗ và để rõ hơn ta ký hiệu thêm chỉ số Fθ∗(t). Nghĩa là với Yi

t−1 là đỉnh của dây chuyền Ll[(t−1)−, Yi

t−1] ta có ftK(ε)(Yi

t−1) =Yj∗ t

(cần lưu ý rằng ft : M[Y(t−1)] →Yt) và chuyển sang bước 3. Bước 3: Kiểm tra:

– Nếu l < Card(ft−1−1(Yi

t−1)) thì quay lại làm tiếp với l := l+ 1;

– Nếu l = Card(f−1

t−1(Yi

t−1)) thì kiểm tra:

+ Nếu i < nt−1 thì quay lại bước 2 với việc thay i := i+ 1,

+ Nếu i = nt−1 thì chuyển sang bước 4. Bước 4:

Xét t, kiểm tra:

– Nếu t < T = tn, quay lại bước 1 với việc thay t := t+ 1,

– Nếu t> T, kết thúc thuật toán.

Chú ý: Trong bước 2, chúng ta cần nhấn mạnh và nói rõ hơn vấn đề sau. Khi xét tới dây chuyền Ll[t−, Yi

t], ta giả sử dây chuyền này xuất phát từ

đỉnh đầu Ym

s tại thời điểm s, s ∈ [0, T] nào đó, khi đó ta hồn toàn xác định:

[s, t] = [ts, ts+1]∪(ts+1, ts+2]∪. . .∪(tk, t].

Do thuật toán là đệ quy tuần tự, nên khi xét đến thời điểm t thì tất cả các quỹ đạo chuyển trạng thái tối ưu trên từng khoảng giữa các bước là Fh

h < t, đã được xác định. Ta xây dựng “hàm dán” như sau: FLS(·) =Fh

θ∗(·) với · ∈ (h−1, h];tq 6 h−1;h 6 t−1

Hàm FLS(·) mơ tả hệ động lực của mục tiêu có ảnh quỹ đạo là dây chuyền Ll[(t−1)−, Yi

t−1]. Khi thực hiện bài toán lọc (2.1) - (2.3) trong bước 2, hệ

động lực F được thực hiện là: F(·) =      FLS(·) với · 6 t−1 Fθ(·) với t−1 6· 6 t

Vì lẽ FLS(·) đã được xác định nên trong ký hiệu ta chỉ ký hiệu phụ thuộc Fθ trong ký hiệu PFθ

lij (t | t).

Nhận xét và làm rõ thêm về thuật toán:

Các thuật toán bám mục tiêu, bám quỹ đạo trong bài tốn MTT đã được cơng bố trong và ngoài nước cho đến thời điểm hiện tại đều chưa giải quyết được vấn đề bị che khuất, kể cả các thuật tốn đã dùng các cơng cụ khá phức tạp như sử dụng ma trận xác định dương, sử dụng công cụ covarian,... Trong trường hợp mục tiêu bị che khuất các thuật tốn đó thường xảy ra bị mất mục tiêu, mất quỹ đạo bám,..., với những xử lý trong cập nhật phần tử đổi mới (trạng thái mới của mục tiêu).

Thuật tốn trình bày trong luận án đã được xây dựng trên một quan điểm nhìn nhận mới là: Bám từng quỹ đạo và sử dụng đầy đủ các thông tin lịch sử của nó để bám (thơng tin lịch sử quan sát: tập dữ liệu DLl[(t−1)−, Yi

t−1],

thông tin lịch sử dáng điệu chuyển trạng thái FLS(·)). Với quan điểm mới đó luận án đã đưa ra được thuật tốn khắc phục được tình trạng mất mục tiêu, mất quỹ đạo bám,..., trong mơi trường mục tiêu dày đặc và có thể bị che khuất.

Chi tiết Thuật tốn tìm "K(ε) - tối ưu" được thể hiện trong sơ đồ khối Hình 2.4 và trong thuật tốn 2.2 sau đây.

Bắt đầu Nhập ε, T t := 0; i := 0; l := −1; j := 0 t := t + 1, Nhập Y(t); nt := Card(Y(t)) i := i + 1 l := l + 1 j := j + 1 Tính PlijFq(t|t) δli = min 1≤j≤ntminPlijFq(t|t) δli > ε l < Card(ft−1−1(Yi t−1)) i < nt−1 t < T j < nt Kết thúc ft(Yi t−1) := ∅ ft(Yi t−1) := Ytj Đ S S S S S Đ Đ Đ Đ

Hình 2.4. Sơ đồ logic cài đặt thuật tốn tìm "K(ǫ) - tối ưu" (Trong hình ký hiệu: Đúng: Đ; Sai: S)

Thuật toán 2.2. Thuật tốn tìm chiến lược K(ǫ) -tối ưu

Input: T; ǫ; Y(t) = {Ytj | 1≤ j ≤ nt}

Output: Chiến lược K(ǫ)−tối ưu: nftK(ǫ)|t= t1, t2, . . . , tno

1. BEGIN 2. Get Input T; ǫ; 3. for t = 1 to T do 4. Get Input(Y(t)); nt = Card(Y(t)); 5. for i = 1 to nt−1 do

6. for l = 0 to Card(ft−1(Y−1 i

t−1)) do 7. for j = 1 to nt do 8. Tính PlijFq(t|t); δli = min 1≤j≤ntminPlijFq(t|t); 9. IF δli > ǫ THEN 10. Get Output ftK(ǫ)(Yi t−1) = ∅; 11. ELSE 12. Get Output ftK(ǫ)(Yi t−1) = Ytj; 13. END IF 14. end for 15. end fof 16. end for 17. end fof 18. END. 2.6.Kết luận Chương 2

Chương 2 của luận án tập trung nghiên cứu lớp bài tốn MTT tổng qt có thể có mục tiêu bị che khuất. Với lớp bài toán này, các nghiên cứu đã được

cơng bố trong và ngồi nước cho đến thời điểm hiện tại chưa khắc phục được tình trạng "mất mục tiêu", "mất quỹ đạo bám" khi tình trạng mục tiêu bị che khuất xảy ra. Chương 2 của luận án nghiên cứu vấn đề đó và đã thu được các kết quả chính sau đây:

1/ Đề xuất chiến lược liên kết dữ liệu mới là phương pháp liên kết dữ liệu dựa trên hệ ánh xạ được xây dựng đệ quy:

ft : M [Y(t−1)]→ Y(t), t= t1, t2, ..., tn.

Với cấu trúc khoa học hợp lý của tập nguồn M [Y(t−1)]cho phép khắc phục tình trạng mất mục tiêu, mất quỹ đạo bám khi có hiện tượng mục tiêu bị che khuất.

2/ Chứng minh sự tồn tại chiến lược liên kết dữ liệu tối ưu theo nghĩa làm cực đại xác suất hậu nghiệm tại mỗi bước lọc.

3/ Xây dựng chiến lược liên kết dữ liệu thỏa mãn tính chất cho trước T nào đó.

4/ Xây dựng chiến lược liên kết dữ liệu thỏa mãn tính chất “K(ε) -tối ưu” - là tính chất thường ứng dụng trong thực tế.

Các kết quả chính của chương này đã được cơng bố ở các bài báo khoa học [CT1]; [CT2].

CHƯƠNG 3. MƠ HÌNH MARKOV ẨN TRONG BÀI TỐN QUAN SÁT QUỸ ĐẠO ĐA MỤC TIÊU

Chương này luận án nghiên cứu lớp mơ hình MTT mà trong đó các mục tiêu được quan tâm là lớp mục tiêu nào đó trong số các mục tiêu có thể có của mơ hình MTT. Trường hợp lớp mục tiêu được quan tâm là lớp con thực sự của lớp tất cả các mục tiêu có thể có của mơ hình, thì các thuật tốn về MTT đã được cơng bố cho đến thời điểm hiện tại không thể áp dụng được và hiện chưa có phương pháp giải nào được cơng bố. Luận án đã đưa ra phương pháp tiếp cận đó là sử dụng mơ hình Markov ẩn để giải quyết.

3.1.Giới thiệu mở đầu

Trong thực tiễn có nhiều lớp mơ hình MTT. Ở chương này luận án dành để nghiên cứu một lớp MTT có nhiều ứng dụng và thường gặp trong thực tiễn. Điều đặc biệt ở đây là các phương pháp truyền thống và thông dụng đã được cơng bố để xử lý các mơ hình MTT khơng áp dụng được cho lớp mơ hình MTT này. Chúng ta nêu một số ví dụ trong thực tiễn:

Ví dụ 3.1. Trong chiến dịch "Điện Biên Phủ trên không" tại Hà Nội tháng 12 năm 1972, do lượng tên lửa SAM-2 hạn chế không đủ đáp ứng yêu cầu chiến đấu. Bộ Tổng tham mưu và và Quân chủng Phịng khơng - Khơng qn quyết định tập trung tên lửa SAM-2 và không quân để đánh B-52, các mục tiêu khác (các loại máy bay khác của Mỹ) chỉ đối phó bằng hỏa lực phịng khơng thơng thường. Hệ thống ra đa trong trường hợp này có một hệ thống chức năng phải xử lý mơ hình MTT mà trong đó đối tượng quan tâm chỉ là các mục tiêu máy bay B-52; Lớp mục tiêu cần quan tâm này là một lớp con trong lớp tất cả các mục tiêu có thể có đối với hệ thống ra đa phịng khơng. Ví dụ 3.2. Với hệ thống phịng thủ trong chiến tranh hạt nhân có một hệ

thống chức năng trong đó mơ hình MTT có nhiệm vụ phải quan tâm xác định các mục tiêu có thể mang đầu đạn hạt nhân (tên lửa mang đầu đạn hạt nhân, máy bay chiến lược mang bom hạt nhân, ...) trong số các mục tiêu có thể có trong khơng gian phịng thủ.

Như vậy chúng ta gặp một lớp mơ hình MTT mà trong đó đối tượng quan tâm theo dõi và xác định không phải là tất cả các mục tiêu mà chỉ là một lớp con trong số đó. Trong trường hợp lớp mục tiêu được quan tâm là lớp con thực sự của lớp tất cả các mục tiêu có thể có, thì các phương pháp, các thuật tốn xử lý với MTT đã được cơng bố khơng cịn phù hợp nữa. Luận án đã đề xuất phương pháp tiếp cận bằng cách sử dụng mơ hình Markov ẩn để giải quyết lớp mơ hình MTT này. Các kết quả theo hướng nghiên cứu đó được trình bày trong chương 3 này.

Cấu trúc của chương gồm có 6 mục. Mục 3.1 là mục "Giới thiệu mở đầu"; mục 3.2 là mục phát biểu và xây dựng mơ hình tốn học cho bài tốn MTT được nghiên cứu trong chương này; mục 3.3 là mục giới thiệu HMM; mục 3.4 là mục trình bày các kết quả nghiên cứu mở rộng các kết quả trong HMM cho mục tiêu nghiên cứu MTT của luận án; mục 3.5 là ứng dụng các kết quả nghiên cứu đó vào việc giải bài toán MTT và cuối cùng, mục 3.6 là một số bình luận, những vấn đề mở và kết luận chương.

3.2.Mơ hình tốn học bài tốn MTT 3.2.1. Mơ hình tốn học bài tốn MTT

Giả sử ta quan sát các đối tượng (hay cịn gọi là mục tiêu) di động nào đó trong một miền khơng gian và trong một khoảng thời gian nào đó. Ký hiệu

R là miền khơng gian mà ta cần quan tâm, ở đâyR ⊂ Rnx, với Rnx là không gian trạng thái của mục tiêu, nx là số chiều của véc tơ trạng thái của mục tiêu. R được gọi là miền quan sát.

[1, T] được gọi là khoảng thời gian của quá trình quan sát. Do các thời điểm quan sát: t1, t2, . . ., tn; 1 = t1 < t2 < . . . < tn = T, là rời rạc, nên khơng mất tính tổng qt, khi nói đến thời điểm thứi (ti), chúng ta có thể quy ước: T ∈ Z+, ti ∈ Z+ và đồng nhất ti = i, i = 1,2, . . . , T; trong đó, t1 = 1 là lần quan sát đầu tiên và tn = T là lần quan sát cuối cùng của quá trình quan sát.

Các mục tiêu xuất hiện, biến mất một cách ngẫu nhiên. Các mục tiêu xuất hiện ở vị trí ngẫu nhiên có phân bố đều trong R. Các mục tiêu xuất hiện

chuyển động và biến mất một cách độc lập với nhau. Các mục tiêu giả FA được xem như là một loại mục tiêu và cũng tuân theo các giả thiết (về mục

Một phần của tài liệu Luận án Tiến sĩ Ứng dụng phương pháp lọc bayes và mô hình markov ẩn trong bài toán quan sát quỹ đạo đa mục tiêu (Trang 64)

Tải bản đầy đủ (PDF)

(106 trang)