TIỂU LUẬN XỬ LÝ TÍN HIỆU NÂNG CAO ĐỀ TÀI: MÔ HÌNH MARKOV ẨN

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG KHOA QUỐC TẾ VÀ SAU ĐẠI HỌC -*** - TIỂU LUẬN XỬ LÝ TÍN HIỆU NÂNG CAO ĐỀ TÀI: MƠ HÌNH MARKOV ẨN Học c : Đ VIỆT Đ C NGUYỄN TRUNG KIÊN NGUYỄN THÀNH TRUNG : TS NGUYỄN NGỌC MINH L p : M12CQDT01-B HÀ NỘI, 10-2012 Mơ hình Markov ẩn Mục lục MỤC LỤC MỤC LỤC LỜI MỞ ĐẦU NỘI DUNG Giới thiệu mơ hình markov ẩn Trình bày vấn đề Thuật toán tiến – thuật toán lùi: Thuật toán Viterbi 11 KẾT LUẬN 15 Mơ hình Markov ẩn Lời mở đầu LỜI MỞ ĐẦU Mơ hình Markov ẩn (tiếng Anh Hidden Markov Model - HMM) mơ hình thống kê hệ thống mơ hình hóa cho q trình Markov với tham số khơng biết trước nhiệm vụ xác định tham số ẩn từ tham số quan sát được, dựa thừa nhận Các tham số mô hình rút sau sử dụng để thực phân tích kế tiếp, ví dụ cho ứng dụng nhận dạng mẫu Trong mô hình Markov điển hình, trạng thái quan sát trực tiếp người quan sát, xác suất chuyển tiếp trạng thái tham số Mơ hình Markov ẩn thêm vào đầu ra: trạng thái có xác suất phân bổ biểu đầu Vì vậy, nhìn vào dãy biểu sinh HMM không trực tiếp dãy trạng thái Đây mơ hình tốn thống kê có ứng dụng rộng rãi lĩnh vực nhận dạng giọng nói, lĩnh vực sinh học nhận dạng gene phân loại protein; xử lý tín hiệu, xử lý hình ảnh ứng dụng khác liên quan đến chuỗi chuyển tiếp kết hợp thành phần, kiện Trong lĩnh vực điện, mơ hình Markov sử dụng công cụ dự báo giá điện với liệu liên quan Chính áp dụng nhiều lĩnh vực đặc biệt xử lý tín hiệu số nên chúng em chọn đề tài “mô hình Markov ẩn” làm hướng nghiên cứu Mơ hình Markov ẩn Nội dung NỘI DUNG Giới thiệu mô hình markov ẩn Mơ hình Markov ẩn mơ hình thống kê hệ thống mơ hình hóa cho trình Markov với tham số trước nhiệm vụ xác định tham số ẩn từ tham số quan sát Các tham số mơ hình rút sau sử dụng để thực phân tích kế tiếp, ví dụ ứng dụng cho nhận dạng mẫu Trong mơ hình Markov điển hình, trạng thái quan sát từ người quan sát, xác suất chuyển tiếp trạng thái tham số Mơ hình Markov ẩn thêm vào đầu ra: trạng thái có xác suất phân bổ biểu Vì vậy, nhìn vào dãy biểu sinh HMM không trực tiếp dãy trạng thái Chú ý: Q trình Markov Trong lí thuyết xác suất, q trình Markov q trình mang tính ngẫu nhiên (stochastic process) với đặc tính sau: trạng thái ck thời điểm k giá trị tập hữu hạn {1,…,M} Với giả thiết trình diễn từ thời điểm đến thời điểm N trạng thái trạng thái cuối biết, chuỗi trạng thái biểu diễn vecto hữu hạn C={c0,…,cN} Nếu P(ck | c0,c1, ,c(k − 1)) biểu diễn xác suất (khả xảy ra) trạng thái c k thời điểm k qua trạng thái (k-1) Giả sử thời điểm ck phụ thuộc vào trạng thái trước ck-1 độc lập với trạng thái trước khác Q trình gọi q trình Markov bậc một(first order Markov process) Có nghĩa xác suất để xảy trạng thái ck thời điểm k, biết trước trạng thái thời điểm k-1 phụ thuộc vào trạng thái trước, ví dụ trạng thái ck-1 thời điểm k-1 Khi ta có cơng thức: P(ck | c0,c1, ,c(k − 1))= P(ck| c(k − 1)) Nói tóm lại hệ có thuộc tính Markov gọi q trình Markov (bậc1) Như vậy, với trình Markov bậc n: P(ck | c0,c1, ,c(k − 1))= P(ck| ck-n,ck-n-1,…,c(k − 1)) Nói chung với giả thuật Viterbi q trình xảy bên xem trình Markov:  Trạng thái hữu hạn nghĩa số m hữu hạn Mơ hình Markov ẩn Nội dung  Thời gian rời rạc, nghĩa việc chuyển từ trạng thái sang trạng thái khác đơn vị thời gian  Quan sát không tốn nhớ, nghĩa chuỗi quan sát có xác suất phụ thuộc vào trạng thái trước (nên khơng cần lưu nhớ nhiều) Trình bày vấn đề  Phương pháp tiếp cận lí thuyết thơng tin nhận dạng: Hình Nhận dạng tìm cách xác định khả xảy lớn chuỗi ngôn ngữ,W, cho trước âm A, Công thức:  P(W / A)  max P(W / A) W  Theo luật Bayes: P(W / A)  P( A / W ) P(W ) P( A)  Mơ hình HMM quan tâm đến P(W|A)  Kí hiệu: A  O W   P(A/W)  P(O/  )  Ví dụ1: Mơ hình Markov ẩn Nội dung Hình  Xét chén, chén trộn các “đá trạng thái”  Phân nhỏ chén thứ i thành phần tỉ lệ ai1, ai2, ai1+ ai2=1  Xét bình, bình chứa bóng đen, bóng trắng  Chia bình thứ i thành phần tỉ lệ biB, biW, với  biB+ biW=1  Vecto tham số cho mơ hình là:  = {a01,a02,a11,a12,a21,a22,b1(B),b1(W ),b2(B),b2(W )} Hình Chuỗi quan sát : O={B,W,B,W,W,B} Chuỗi trạng thái: Q={1,1,2,1,2,1} Mục đích: cho mơ hình λ chuỗi quan sát O, làm thể để chuỗi trạng thái Q xác định Các yếu tố mơ hình Markov ẩn rời rạc  N : số trạng thái mô hình Các trạng thái, s= {s1,s2,…,sN} Trạng thái thời điểm t, qt  s Mơ hình Markov ẩn Nội dung  M: số kí hiệu quan sát (quan sát rời rạc) Tập kí hiệu quan sát v={v1,v2,…,vM} Kí hiệu quan sát thời điểm t, ot  v  A= {aij}: tập phân phối xác suất chuyển trạng thái aij = P(qt+1 = sj |qt = si ), ≤ i,j ≤ N  B = {bj (k)}: phân bổ xác suất kí hiệu quan sát trạng thái j: bj (k)= P(vk at t|qt = sj ), ≤ j ≤ N, ≤ k ≤ M  π = {πi }: phân bổ xác suất trạng thái khởi đầu πi = P(q1= si ), ≤ i ≤ N Một mơ hình HMM viết dạng đặc trưng λ = {A, B,π}  ví dụ 2: π={a01,a02}  a11 a12   b1 ( B) b1 (W )  b ( B) b (W ) a a   A=  21 22  B=   Một số mơ hình thơng dụng: Hình 4a: Mơ hình –state 3-state Hình 4b: Mơ hình Left – Righ Mơ hình Markov ẩn Nội dung Hình 4c: Mơ hình Bakis Hình 4d: Mơ hình Tuyến tính  Tạo chuỗi quan sát HMM o Lựa chọn trạng thái khởi đầu, q1=si, dựa phân bổ trạng thái khởi đầu, π o Cho t chạy từ  T:  Chọn ot=vk theo phân bổ xác suất kí hiệu trạng thái si, bi(k)  Chuyển tiếp đến trạng thái qt+1=sj theo phân bổ xác suất chuyển tiếp trạng thái cho trạng thái si, aij o Tăng t lên 1, quay lại bước t≤T; ngược lại kết thúc Hình 5: Sự tiến hóa mơ hình Markov Mơ hình Markov ẩn Nội dung  Biểu diễn sơ đồ trạng thái sơ đồ mắt lưới(trellis) Hình 6:( Những nét đứt thể chuyển tiếp trạng thái 0, nơi mà vecto quan sát tạo ra.) vấn đề HMM Tính điểm (Scoring) : cho chuỗi quan sát O = {o1,o2, ,oT } mơ hình λ = {A, B,π}, làm tính tốn xác suất có điều kiện P(O | λ) (khả xảy chuỗi quan sát)?  Dùng thuật toán tiến lùi (the forward-backwark algorithm) So khớp (Matching): cho chuỗi quan sát O = {o1,o2, ,oT }, làm chúng lựa chọn chuỗi trạng thái Q = {q1,q2, ,qT } để tối ưu theo số hướng  thuật toán Viterbi Huấn luyện (Training): làm điều chỉnh tham số mơ hình λ = {A,B,π} để đạt P(O | λ) lớn nhất? Thủ tục Baum-Wetch Tính tốn P(O|λ) P(O|λ)=  P(O, Q |  ) allQ P(O, Q |λ)= P(O|Q ,λ)P(Q |λ) Xét chuỗi trạng thái cố định Q = q1q2 qT P(O|Q ,λ)= bq1(o1)bq2(o2) bqT (oT ) P(Q |λ)= πq1 aq1q2 aq2q3 aqT −1 qT Mơ hình Markov ẩn Nội dung Vì vậy: P(O|λ)=  q1 b q1 (o1 )a q1 q b q (o ) a qT -1 qT b qT (o T ) q1,q2 , ,qT Số phép tính cấn làm ≈ 2T.NT (có NT chuỗi vậy) Ví dụ: N=5, T=100  2.100.5100 ≈ 1072 phép tính Thuật tốn tiến – thuật toán lùi:  Toán tử tiến αt(t) xác suất chuỗi quan sát phần tiến đến thời điểm t trạng thái si thời điểm t với điều kiện mơ hình cho: αt (i)= P(o1o2 ot,qt = si |λ)  Dễ dàng thấy rằng:  α1(i)= πibi (o1), ≤ i ≤ N N  P(O|λ)=   T (i) i 1  Theo phương pháp quy nạp N αt+1 (j)=[   t (i) a ij ] bj (ot+1), 1≤ t≤ T-1, ≤ j ≤ N i 1 Số phép tính: N2T Ví dụ: N=5,T=100,  52.100 phép tính,( thay 1072)  Diễn tả thuật tốn tiến: Hình  Thuật tốn lùi: Mơ hình Markov ẩn Nội dung o Tương tự để xác định toán tử lùi, βt(i), khả xảy chuỗi quan sát cục từ thời điểm t+1 đến kết thúc, biết trước trạng thái si thời điểm t với điều kiện mơ hình cho βt(i)= P(ot+1ot+2 oT |qt = si,λ) o Có thể dễ dàng nhận βT(i)=1, ≤ i ≤ N N P(O|λ)=   i b i (o1 )ß1 (i) i 1 o Theo phương pháp quy nạp N βt(i)=  a ij b j (o t +1 )ß t +1 (j) (t=T−1,T−2, ,1; ≤ i≤N) j1  Diễn tả thủ tục lùi: Hình  Tìm chuỗi trạng thái tối ưu: + Một tiêu chuẩn để lựa chọn trạng thái tối ưu qt cực đại hóa số trạng thái + Tốn tử  t (i) xác suất hệ thống trạng thái si thời điểm t, với điều kiện cho chuỗi quan sát O mơ hình  cho:  (i)  P(qt  si | O,  ) N  t 1 t (i )  , + Chú ý biểu diễn dạng sau  t (i)   t (i)  t (i) P(O |  ) 10 t Mơ hình Markov ẩn Nội dung + Tuy nhiên với tiêu chuẩn tối ưu riêng phần xảy vấn đề chuỗi trạng thái tối ưu khơng tn theo ràng buộc chuyển tiếp trạng thái + Một tiêu chuẩn tối ưu khác cực đại hóa P(Q,O|  ) Điều tìm thấy thuật tốn Viterbi + Với  t (i) xác suất xảy cao đường dẫn tính với t lần quan sát đầu tiên:  t (i)  max P(q1 , q2 , , qt 1 , qt  s1 , o1o2 ot |  ) q1 , q2 , ,q t 1 + Theo phương pháp quy nạp:  t 1 (i)  [max  t (i)aij ]bi (ot 1 ) i + Để thu chuỗi trạng thái, ta cần theo dõi chuỗi trạng thái mà cho đường dẫn tốt thời điểm t đến trạng thái si Chúng ta thực điều mảng t (i) Thuật toán Viterbi + Khởi đầu: 1 (i)   i bi (oi )  (i)  + Đệ quy:  t ( j )  max[ t 1 (i)ai j ]b j (ot ),2  t  T 1i N  t ( j )  arg max[ t 1 (i)aij ],2  t  T 1i N + Kết thúc: P*  max[ T (i)] 1i  N * q T  arg max[ T (i)] 1i  N + Quay lui tìm đường dẫn( chuỗi trạng thái) tối ưu * q T *   t 1 (q ), t  T  1, t  2, ,1 t 1 + Số phép tính  N 2T 11 Mơ hình Markov ẩn Nội dung + Ví dụ thuật tốn Viterbi: Hình + Ví dụ thuật tốn Viterbi(tt) Hình 10 + Ví dụ so khớp sử dụng thuật tốn tiến-lùi: 12 Mơ hình Markov ẩn Nội dung Hình 11  Ước lượng lại với thuật toán Baum-Welch Ước lượng lại với thuật toán Baum-Welch sử dụng EM để xác định tham số ML Xét toán tử  t (i) xác suất hệ thống trạng thái i thời điểm t trạng thái j thời điểm t+1 với điều kiện có chuỗi quan sát O mơ hình Markov ẩn   t (i, j )  P(qt  si , qt 1  s j | O,  )  Khi t (i, j )   t (i)aij b j (ot 1 )  t 1 (i) P(O |  ) N  t (i)    t (i, j ) j 1  Kết hợp  t (i)  t (i, j ) được:  T 1  t 1  t (i ) = số chuyển tiếp từ trạng thái si T 1   (i, j ) = số chuyển tiếp từ trạng thái si tới sj t 1 t Thủ tục ước lượng lại Baum-Welch 13 Mơ hình Markov ẩn Nội dung Hình 12 Các biểu thức ước lượng lại với thuật toán Baum-Welch o    (i) T 1 o a ij    (i, j ) t 1 T 1 t  t 1 t (i ) T o b ij    ( j) t 1,ot vk T t   ( j) t 1 t Nếu  ( A, B,  ) mơ hình gốc  ( A, B,  ) mơ hình ước lượng lại, ta chứng minh: o Mơ hình gốc  xác định điểm tới hạn hàm có khả xảy ra, trường hợp  =  Hoặc: o Mơ hình  thích hợp  điều kiện P(O |  )  P(O |  ) Chúng ta tăng xác suất chuỗi quan sát O mà quan sát từ mơ hình sử dụng lặp lại  không gian  lặp lại việc ước lượng lại số điểm tới hạn đạt Mơ hình kết thu gọi mơ hình Markov ẩn có khả xảy lớn 14 Mơ hình Markov ẩn Kết luận KẾT LUẬN Mơ hình Markov ẩn mơ hình thống kê hệ thống mơ hình hóa cho q trình Markov với tham số khơng biết trước nhiệm vụ xác định tham số ẩn từ tham số quan sát Các tham số mơ hình rút sau sử dụng để thực phân tích kế tiếp, ví dụ ứng dụng cho nhận dạng mẫu Mơ hình Markov ẩn thêm vào đầu ra: trạng thái có xác suất phân bổ biểu đầu Vì vậy, nhìn vào dãy biểu sinh HMM không trực tiếp dãy trạng thái Do thời gian nghiên cứu có hạn kiến thức cịn hạn chế, đề tài khơng tránh khỏi sai sót, chúng em mong có cảm thơng góp ý thầy để phát triển đề tài tốt 15 ... vực đặc biệt xử lý tín hiệu số nên chúng em chọn đề tài “mơ hình Markov ẩn? ?? làm hướng nghiên cứu Mơ hình Markov ẩn Nội dung NỘI DUNG Giới thiệu mơ hình markov ẩn Mơ hình Markov ẩn mơ hình thống... 22  B=   Một số mơ hình thơng dụng: Hình 4a: Mơ hình –state 3-state Hình 4b: Mơ hình Left – Righ Mơ hình Markov ẩn Nội dung Hình 4c: Mơ hình Bakis Hình 4d: Mơ hình Tuyến tính  Tạo chuỗi quan... hình sử dụng lặp lại  không gian  lặp lại việc ước lượng lại số điểm tới hạn đạt Mơ hình kết thu gọi mơ hình Markov ẩn có khả xảy lớn 14 Mơ hình Markov ẩn Kết luận KẾT LUẬN Mơ hình Markov ẩn

Định dạng
Số trang	16
Dung lượng	665,2 KB