3.2.1Khái niệm

3.2MÔ HÌNH MARKOV ẨN

3.2.1Khái niệm

( ) 1 ( ) ( ) , | ( 1 1 S a a p d q Model O P d ii i ii i = − = = − ( 3.0)

ở đây pi(d) là hàm xác suất rời rạc để mô hình ở trạng thái i trong d ngày. Dựa vào pi(d) chúng ta có thể tính được số lần mong đợi để hệ thống ở nguyên trạng thái đó trong một với điều kiện nó chính là trạng thái khởi đầu của mô hình đó.

( 3.0)

do đó ngày mong đợi liên tiếp nhau để mô hình có trạng thái là trời nắng là: 1/ (1-0.2) = 5 ngày, trời mưa là: 1/(1-0.6) = 2.5 ngày và nhiều mây là: 1/(1-0.4) = 1.67 ngày.

3.2 MÔ HÌNH MARKOV ẨN

3.2.1 Khái niệm

Mô hình Markov mà chúng ta thảo luận ở phần trên là mô hình có thể quan sát được, mô hình này có rất nhiều hạn chế khi áp dụng nó vào giải quyết các vấn đề trong thực tế. Trong phần này chúng ta sẽ mở rộng nó để bao gồm cả trường hợp trong đó chuỗi quan sát là hàm xác suất của trạng thái, kết quả ta thu được mô hình là một quá trình ngẫu nhiên được nhúng hai lần với một quá trình ngẫu nhiên chính không thể quan sát được một cách trực tiếp mà chỉ có thể quan sát được thông qua một tập quá trình ngẫu nhiên khác – các quá trình ngẫu nhiên tạo ra các chuỗi quan sát.

Để hiểu rõ hơn về khái niệm mô hình Markov ẩn chúng ta hãy nghiên cứu thí nghiệm tung đồng xu.

Mô hình tung đồng xu:

Giả sử bạn đang ngồi trong một căn phòng có một bức tường chắn do đó bạn không thể nhìn thấy được điều gì đang xảy ra ở phía bên kia của bức tường, ở đó một người đang thực hiện một thí nghiệm tung đồng xu. Người này sẽ không nói cho ban biết là anh ta tung đồng xu nào mà chỉ nói cho bạn biết kết quả tung đồng xu là xấp hay ngửa. Do đó một chuỗi các thí nghiệm tung đồng xu “ẩn” đã được thực hiện, với chuỗi quan sát là một dãy các mặt xấp, ngửa của các đồng xu. Thông thường chuỗi quan sát này có dạng như sau:

với mô hình thí nghiệm này thì một vấn đề đặt ra là làm sao chúng ta có thể xây dựng nên một mô hình Markov ẩn (HMM) để giải thích cho các chuỗi quan sát được.

Hai vấn đề mà ta cần phải giải quyết để có thể xây dựng nên một HMM là: 1. Các trạng thái của mô hình tương ứng với cái gì.

2. Mô hình cần bao nhiêu trạng thái.

Đối với thí nghiệm trên chúng ta có thể có ba lựa chon sau:

• Giả định chỉ có một đồng xu được tung khi đó chúng ta có thể mô hình hoá thí nghiệm trên bằng mô hình có hai trạng thái với mỗi trạng thái của nó ứng với kết quả của lần tung đồng xu trước đó. Đây là mô hình Markov có thể quan sát được và chỉ có một vấn đề cần phải giả quyết là xác định giá trị tốt nhất cho từng tham số của mô hình (xác suất mặt xấp, ngửa). Mô hình được thể hiện trong hình 3.1.1.

• Mô hình thứ hai là một mô hình có hai trạng thái, trong đó mỗi trạng thái tương ứng với một mặt của đồng xu (Hình 3.1.2). Mỗi trạng thái của mô hình được đặc trưng bởi.

 Phân bố xác suất mặt sấp hay mặt ngửa.

 Xác xuất chuyển đổi giữa các trạng thái, được mô tả bởi ma trận chuyển trạng thái.

• Mô hình thứ ba ứng với trường hợp có ba đồng xu được sử dụng trong thí nghiệm. Việc lựa chọn đồng xu nào do một số sự kiện mang tính xác suất quyết định.(Hình 3.1.3).

Hình 3-10 Ba mô hình Markov ẩn cho thí nghiệm tung đồng xu

Với các mô hình trên thì câu hỏi đặt ra là mô hình nào giải thích tốt nhất cho chuỗi quan sát thu được. Với mô hình thứ nhất thì chỉ có một tham số ma ta chưa biết là P(H), với mô hình thứ hai có bốn tham số mà ta chưa biết là {a11, a22, P1,P2}, còn đối với mô hình thư ba thì có chín tham số mà ta chưa biết là (a11, a12, a21, a22,

a31, a32, P1, P2, P3). Có thể thấy rằng những mô hình có bậc tự do lớn hơn dường như sẽ mô hình hóa thí nghiệm trên tốt hơn, điều này chỉ đúng về mặt lý thuyết còn trên thực tế có một số giới hạn về kích thước của mô hình cần phải quan tâm đến.

3.2.2 Thành phần của mô hình Markov ẩn

Một mô hình Markov ẩn được mô tả bởi 3 thành phần cơ bản:

1. N-Số trạng thái của mô hình: Mặc dù số trạng thái của mô hình là ẩn nhưng trong các ứng dụng ở thực tế thì thường có một ý nghĩa vật lý nào

đó gắn với các trạng thái của mô hình. Ta đánh nhãn các trạng thái riêng rẽ là {1,2,3,4,..,N} và kí hiệu trạng thái ở thời điểm t là qt.

2. M- Số biểu tượng có thể quan sát được ứng với mỗi trạng thái: Các biểu tượng có thể quan sát được thường tương ứng với sự kiện vật lý đàu ra của một hệ thống đang được mô hình hoá. Trong thí nghiệm tung đồng xu thì số biểu tượng có thể quan sát được ứng với từng trạng thái chính là mặt sấp và mặt ngửa của đồng xu.

Ta kí hiệu các biểu tượng đó là V = {v1,v2,…,vM}.

3. Ma trận xác suất chuyển trạng thái A = {aij}:Với aij là xác suất để trạng thái ở thời điểm t là i và trạng thái ở thời điểm t+1 là j. Do đó ta có.

] | [q 1 j q i P aij = t+ = t = 1≤i,j≤ N ( 3.0) ∑ = = N j ij a 1 1 1≤i≤N ( 3.0) trong trường hợp tổng quát thì aij>0 với mọi i,j nằm trong khoản từ 1 đến N

tuy nhiên trong nhiều hệ thống aij lại có thể bằng không ứng với một số giá trị nào đó của i và j.

Ma trận phân bố xác suất các kí hiệu quan sát B = {bi(k)}.

Trong đó bj(k) là xác suất nhận được kí hiệu quan sát vk ở trạng thái j:

bj(k) = P[ot=vk | qt=j] 1≤k≤M ( 3.0) ∑ = = M k j k b 1 1 ) ( 1≤ j≤M ( 3.0) Ma trận phân bố xác suất trạng thái ban đầu π = {πi}

Trong đó πi là xác suất mô hình ở trạng thái i tại thời điểm ban đầu t=1:

π = P[q1=i] ( 3.0) ∑ = = N i 1 i 1 π ( 3.0)

như vậy để đặc tả đầy đủ một mô hình Markov ẩn thì chúng ta cần các tham số là số trạng thái N, số biểu tượng quan sát M và các ma trạn xác suất A,B,π. Người ta thường kí hiệu một mô hình như trên dưới dạng:

) , ,

( π

6.1.1Giao diện chính của chương trình ứng dụng