2. CÁC KHÁI NIỆM, LÝ THUYẾT CƠ SỞ LIÊN QUAN, PHƯƠNG PHÁP
2.5 Cơ sở lý thuyết của Xích Markov
Xích Markov là gì?
• Xích Markov là một loại quá trình ngẫu nhiên đơn giản, gồm một
dãy thí nghiệm giống nhau, trong đó kết quả của một thí nghiệm chỉ phụ thuộc vào kết quả của một thí nghiệm xảy ra liền trước nó.
• Mục đích chủ yếu của xích Markov là dự đoán kết quả tương lai dựa
vào vết tích của quá khứ và cơ sở hiện tại.
Ma trận xác suất chuyển
Gọi ma trận P=pij , i,j ∈ [1,n], trong đó pij=P({Xn+1=j/Xn=i}) là xác suất xảy ra Xn+1=j với điều kiện Xn=i, thì P là ma trận chuyển của xích Markov.
• pij = P{Xn+1=j/Xn=i}: là khả năng Xn+1 rơi vào trạng thái j nếu Xn
rơi vào trạng thái i.
• P là ma trận xác suất chuyển nếu tất cả các phần tử pij ≥ 0 và tổng tất cả các phần tử trên mỗi hàng bằng 1.
Vector xác suất
• V = (v1,v2,v2,..vn) là vector xác suất ⇔∀i ∈ [1,n], vi ≥0 & Σvi =1.
Phân phối xác suất ban đầu của Xich Markov
• Phân phối xác suất ban đầu của xích Markov là một vector xác suất
P(0) = {p(0)1, p(0)2 ,p(0)3 ,..p(0)r}.
• p(0)i cho biết xác suất rõi vào trạng thái i khi bắt đầu thực hiện nghiên cứu.
Xác xuất tại thời điểm n
• Cho P(0) là xác suất ban đầu.
• P là ma trận xác xuất chuyển.
• P(n) = P(0) . P với P P(n) = {p(n)1, p(n)2 ,p(n)3 ,..p(n)r}.
• Trong đó p(n)i = P{Xn=i} là xác suất quá trình rơi vào trạng thái i ở thời điểm n.
Phân loại xích Markov
Có 2 loại xích Markov:
• Xích Markov chính quy (Regular Markov Chain).
• Xích Markov được gọi là chính quy nếu tồn tại một lũy thừa k
của ma trận xác suất chuyển sao cho tất cả các phần tử của ma trận lũy thừa này đều dương (∃k, pij(k) >0 ∀i.j).
• Pn à T khi nൠ.
• T là ma trận có các dòng giống nhau.t t
t P=
• t=(t1,t2,t3,…tr) là vector xác suất cố định, với r là số trạng thái.
• Xác định t bằng cách giải hệ phương trình.
Xích Markov hấp thu (Absorbing Markov Chain)
- Trạng thái hấp thu (Absorbing State).
- Cho xích Markov với ma trận chuyển P=Pij, Pij là xác suất chuyển từ trạng thái i sang trạng thái j.
- Nếu Pij = 1 thì i được gọi là trạng thái hấp thu. - Xích Markov hấp thu (Absorbing Markov Chain). - Một xích Markov được gọi là hấp thu nếu và chỉ nếu:
• P chứa ít nhất một trạng thái hấp
thu.
• Có thể chuyển từ trạng thái không hấp thu sang trạng thái hấp thu sau một số bước (lần) nào đó.
3. ỨNG DỤNG CÁC KỸ THUẬT ĐỂ GIẢI QUYẾT BÀI TOÁN ĐẶT RA 3.1 ỨNG DỤNG MÔ HÌNH XÍCH MARKOV ĐỂ DỰ BÁO TÌNH TRẠNG GIAO THÔNG
3.1.1 BÀI TOÁN 1
• Giả sử trạng thái tại các giao lộ tại một thời điểm nào đó thuộc một trong các trạng thái sau:
- Bình thường (TT1). - Hơi đông (TT2).
- Kẹt xe (TT3).
• Tiến hành khảo sát dữ liệu tại giao lộ X, ta có được số liệu thống kê như sau:
tP=t
- Xác xuất rơi vào các trạng thái tại ngã tư X tại thời điểm t0 =5h + P(0)1=0.6, P(0)2=0.2, P(0)3=0.2 .
+ Ta có ma trận xác suất chuyển như sau:
• Giả sử chu kỳ khảo sát là 1 giờ.
• Muốn biết trạng thái tại giao lộ X sau 5 giờ so với t0 sẽ rơi vào trạng thái nào ta tính P(5) theo công thức sau:
• Dựa vào kết quả tính được từ P(5) ta sẽ biết được trạng thái tại giao lộ X sau 5 giờ so với t0.
• Giả sử tính được P(5)= (0.66, 0.24, 0.1), nghĩa là khả năng giao lộ X rơi vào trạng thái:
- Bình thường là 66% - Hơi đông là 24% - Kẹt xe là 10% 3.1.2 BÀI TOÁN 2 0.55 0.30 0.15 0.40 0.50 0.10 0.20 0.40 0.40 P= - P12: xác suất chuyển từ trạng thái bình thường à hơi đông. - P21: xác suất chuyển từ trạng thái hơi đông à bình thường.
0.55 0.30 0.15 0.40 0.50 0.10 0.20 0.40 0.40 P(5)= P(0) . P5 = (0.6, 0.2, 0.2). = (x, y, z) 5 P(5)= P(0) . P5 = (0.6, 0.2, 0.2).
• Tương tự như bài toán 1, dự báo trạng thái của giao lộ tại một thời điểm nào đó dựa vào thông tin về trạng thái của nó ở cùng thời điểm trước đó.
• Giả sử ta chia trục thời gian trong ngày thành các khoảng : 5h-6h, 6h- 7h, 7h-8h,…, chu kỳ xét cho các thời điểm là : Thứ 2, Thứ 3, Thứ 4,..
• Xét một xích Markov cụ thể cho một khoảng thời gian 5h-6h thứ 6
hàng tuần như sau: - Gọi P(0)
56-2 : là vector xác suất ban đầu.
- P56-2: là ma trận xác xuất chuyển với Pij cho biết xác suất ngã tư chuyển từ trạng thái i sang trạng thái j.
- P(1)
56-2 : là vector xác suất cho biết trạng thái của ngã tư tại thời
điểm 5h-6h thứ 2 của tuần tiếp theo sau P(0)
56-2 một tuần.
- Tương tự P(2)
56-2 : là vector xác suất cho biết trạng thái của ngã
tư tại thời điểm 5h-6h thứ 2 của tuần tiếp theo sau P(1)
56-2 một tuần. - Áp dụng lý thuyết xích Markov P(n) 56-2 = P(0) 56-2 .Pn 56-2 .
• Để có thể dự báo được tất cả các thời điểm trong ngày và tất cả các ngày trong tuần ta cần phải xây dựng các xích markov sau:
– P56-2, P56-3, P56-4, P56-5, P56-6, P56-7, P56-8 – P67-2, P67-3, P67-4, P67-5, P67-6, P67-7, P67-8 – P78-2, P78-3, P78-4, P78-5, P78-6, P78-7, P78-8 – P89-2, P89-3, P89-4, P89-5, P89-6, P89-7, P89-8 – …. – Pmn-2, Pmn-3, Pmn-4, Pmn-5, Pmn-6, Pmn-7, Pmn-8
Trong đó Pij-k : là xích markow dự báo trạng thái ngã tư tại thời điểm ij vào ngày thứ k trong tuần.
• Với phương pháp dự báo này thì trạng thái của một giao lộ nào đó chỉ phụ thuộc vào trạng thái của nó tại cùng thời điếm trước đó một tuần mà không phụ thuộc vào trạng thái của các giao lộ lân cận.
3.1.3 BÀI TOÁN 3
• Dự báo trạng thái của giao lộ tại một thời điểm nào đó dựa vào thông tin về lưu lượng xe từ các ngã tư lân cận hướng về nó và ngược lại.
• Giả sử ta xây dựng được bảng tra mối liên hệ giữa lưu lượng xe (L) và trạng thái của giao lộ như sau:
- L < 20 tương ứng với trạng thái bình thường. - L [20-50] tương ứng với trạng thái hơi đông. - L >50 tương ứng với trạng thái kẹt xe.
• Giả sử tại ngã tư X có 4 ngã tư lân cận lần lượt được đặt tên là X1, X2, X3, X4. Gọi P là ma trận xác suất chuyển, trong đó pij cho biết xác suất xe đang ở ngã tư Xi chuyển qua ngã tư Xj trong khoảng thời gian m phút.
• Bài toán áp dụng :
- Với lượng xe hiện tại tại các ngã tư X, X1, X2, X3, X4 thì sau n phút tại ngã tư X sẽ rơi vào trạng thái nào ?
- Giả sử ngã tư X đang ở trạng thái i, bao lâu thì X sẽ chuyển sang trạng thái j.
3.2 ỨNG DỤNG MÔ HÌNH GOM CỤM FCMP (FUZZY C-MIXEDPROTOTYPE) ĐỂ PHÂN LỚP GIAO THÔNG PROTOTYPE) ĐỂ PHÂN LỚP GIAO THÔNG
3.2.1 VẤN ĐỀ BÀI TOÁN
• Tại một địa điểm X trên đường giao thông, thực hiện khảo sát lưu lượng xe đi qua trong một khoảng thời gian t nào đó.
• Giả sử t=15 phút, ta tiến hành 24x4 = 96 lần khảo sát lưu lượng xe đi qua tại địa điểm X để biết được lưu lượng xe tại từng thời điểm khác nhau trong ngày.
• Tương tự, ta lại khảo sát lưu lượng xe trong cùng một thời điểm nhưng ở những ngày khác nhau trong tuần (thứ 2, thứ 3,..,ngày lễ ).
• Cuối cùng, ta sẽ có được số liệu thống kê và đồ thị biểu diễn giữa thời gian và lưu lượng xe xảy ra trong thời gian đó.
3.2.2 HUỚNG GIẢI QUYẾT BÀI TOÁN
Xây dựng hệ thống dự báo lưu lượng xe xảy ra tại một địa điểm X trong một khoảng thời gian nào đó, khi biết được trạng thái trong quá khứ của nó và các giao lộ lân cận.
4. KẾT LUẬN, HƯỚNG PHÁT TRIỂN
• Hiện nay, có rất nhiều hướng nghiên cứu về việc ứng dụng công nghệ
thông tin trong lĩnh vực dự báo và điều phối giao thông :
- Dự báo mức độ kẹt xe dựa vào xử lý ảnh giao thông và ứng dụng mạng Neural.
- Ứng dụng Logic mờ để điều phối giao thông.
- Phân lớp và dự báo giao thông ứng dụng kỹ thuật gom cụm mờ. - Dự báo giao thông dựa vào cơ sở lý thuyết Xích Markov.
• Mỗi phương pháp đều có những ưu và nhược điểm của nó tùy thuộc vào
mức độ hỗ trợ của việc ứng dụng.
- Dự báo dựa vào xử lý ảnh giao thông đòi hỏi phải lắp đặt hệ thống Camera tại các giao lộ để Capture ảnh và gởi về trung tâm xử lý. - Phân loại kẹt xe bằng gom cụm mờ đòi hỏi phải lắp đặt thiết bị đo
5. TÀI LIỆU THAM KHẢO
[1]. Chuyên đề công nghệ tri thức và ứng dụng, Khóa 3, GS.TSKH. Hoàng Kiếm, Trường ĐH CNTT, ĐHQG TP.HCM , 2006.
[2]. Bài giảng cao học môn học công nghệ tri thức và ứng dụng, GS.TSKH. Hoàng Kiếm, Trường ĐH KHTN, ĐHQG TP.HCM , 2004.
[3]. Chuyên đề khai phá dữ liệu và nhà kho dữ liệu, PGS.TS. Đỗ Phúc, Trường ĐH CNTT, ĐHQG TP.HCM, 2007.
[4]. Giáo trình khai thác dữ liệu, PGS.TS. Đỗ Phúc, Trường ĐH CNTT, ĐHQG TP.HCM, Nhà xuất bản ĐHQG TP.HCM, 2006.
[5]. Cơ sở lý thuyết Xích Markov.
[6]. Các mô hình Xác suất và ứng dụng, phần 1: Xích Markov và ứng dụng. Nguyễn Duy Tiến. Nxb Đại học Quốc gia Hà nội, 2001.
[7]. Ứng dụng logic mờ trong điều phối giao thông.
[8]. Slide giáo trình Gom cụm, GS.TS. Hồ Tú Bảo.
[9]. Christiane Stutz and Thomas A.Runkler, “Classificaton and Prediction”
[10]. Christiane Stutz and Thomas A.Runkler, “Classificaton and Prediction of road Traffic Control Using Application – Specific Fuzzy Clustering”, IEEE Trans Fuzzy Syst, vol 10, pp 297-308, June 2004.
[11]. Liyan Zhang, “Comparion of Fuzzy C-Means Algorithm and New Fuzzy Clustering and Fuzzy Merging Algorithm”, Computer Science Derpartment – University of Nevade, Reno, May 2005.