Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 27 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
27
Dung lượng
1,03 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ KHOA HỌC VÀ CÔNG NGHỆ VIỆN ỨNG DỤNG CÔNG NGHỆ VŨ TRUNG KIÊN NGHIÊN CỨU, PHÁT TRIỂN KỸ THUẬT ĐỊNH VỊ TRONG NHÀ S DNG TN HIU Wi-Fi tóm tắt luận án tiến sÜ kü tht HÀ NỘI - 2019 Cơng trình hồn thành tại: Viện Ứng dụng Cơng nghệ Người hướng dẫn khoa học: GS TS Lê Hùng Lân Phản biện 1: PGS.TS Thái Quang Vinh Phản biện 2: PGS.TS Hà Hải Nam Phản biện 3: PGS.TS Hoàng Văn Phúc Luận án bảo vệ trước Hội đồng chấm luận án Tiến sĩ cấp Viện họp Viện Ứng dụng Công nghệ vào hồi ngày tháng năm 20 Có thể tìm hiểu luận án tại: Thư viện Viện Ứng dụng Công nghệ Thư viện quốc gia DANH MỤC CÁC CƠNG TRÌNH ĐÃ CƠNG BỐ [CT1] Hoang Manh Kha, Duong Thi Hang, Vu Trung Kien, Trinh Anh Vu (2017), Enhancing WiFi based Indoor Positioning by Modeling measurement Data with GMM, IEEE International Conference on Advanced Technologies for Communications, IEEE, Quy Nhon, Vietnam, pp 325-328 [CT2] Vu, T.K., Hoang, M.K., and Le, H.L (2018), "WLAN Fingerprinting based Indoor Positioning in the Precence of Dropped Mixture Data", Journal of Military Science and Technology 57A(3), pp 25-34 https://drive.google.com/file/d/1jv2U3tmJq1vUEez6nt6Cq8DzJW EWZu6-/view [CT3] Vu, Trung Kien and Le, Hung Lan (2018), "Gaussian Mixture Modeling for Wi-Fi Fingerprinting based Indoor Positioning in the Presence of Censored Data", Vietnam Journal of Science, Technology and Engineering 61(1), pp 3-8, DOI: https://doi.org/10.31276/VJSTE.61(1).03-08 [CT4](ISI-Q2) Vu, Trung Kien, Hoang, Manh Kha, and Le, Hung Lan (2019), "An EM algorithm for GMM parameter estimation in the presence of censored and dropped data with potential application for indoor positioning", ICT Express, 5(2), pp 120-123, DOI: 10.1016/j.icte.2018.08.001 Bài báo chấp nhận: [CT5](ISI-Q3) Vu, Trung Kien, Hoang, Manh Kha, and Le, Hung Lan (2019), “Performance Enhancement of Wi-Fi Fingerprinting based IPS by Accurate Parameter Estimation of Censored and Dropped Data”, Radioengineering, ISSN: 1805-9600 Submission: 06/04/2019, Reviews Opened: 27/05/2019, Accepted: 03/09/2019 GIỚI THIỆU LUẬN ÁN 1.Tính cấp thiết đề tài Các hệ thống định vị dựa vệ tinh điển GPS (Global Positioning System) Mỹ định vị xác đối tượng mơi trường ngồi trời Tuy nhiên mơi trường nhà, tín hiệu từ vệ tinh khơng truyền thẳng tới thiết bị định vị nên độ xác hệ thống giảm nhiều Mặt khác, ngày xuất nhiều nhu cầu định vị nhà, ví dụ định vị cho người sử dụng điện thoại thông minh di chuyển nhà ga, sân bay, trung tâm thương mại; định vị cho hàng hóa kho; định vị cho tơ bãi đỗ xe Vì lý này, năm gần đây, hệ thống định vị nhà (IPS: Indoor Positioning System) quan tâm nghiên cứu, phát triển Trong số công nghệ định vị nhà nay, công nghệ định vị dựa tín hiệu Wi-Fi mạng nội khơng dây (WLAN: Wireless Local Area Network) sử dụng phổ biến hầu hết khu vực nhà có sẵn WLAN, hầu hết thiết bị di động điện thoại, máy tính trang bị thu phát tín hiệu Wi-Fi Xuất phát từ thực tế trên, tác giả chọn đề tài “Nghiên cứu, phát triển kỹ thuật định vị nhà sử dụng tín hiệu Wi-Fi”, sâu vào nghiên cứu kỹ thuật định vị dựa “dấu vân tay” RSSI (RSSIF-IPT: Received Signal Strength Indication Fingerprinting based Indoor Positioning Technique) Đối tượng phạm vi nghiên cứu Nghiên cứu kỹ thuật định vị cho đối tượng tĩnh không gian chiều môi trường nhà Kỹ thuật định vị tập trung nghiên cứu RSSIF-IPT, sử dụng tín hiệu Wi-Fi WLAN Các vấn đề nghiên cứu bao gồm: Đặc điểm Wi-Fi RSSI; mô hình xác suất mơ tả phân bố Wi-Fi RSSI; thuật tốn ước lượng tham số, tối ưu hóa tham số mơ hình sử dụng mơ tả phân bố Wi-Fi RSSI; thuật toán định vị trực tuyến Mục tiêu nghiên cứu đề tài - Mục tiêu chung: Nghiên cứu phát triển kỹ thuật định vị nhà dựa dấu vân tay RSSI sử dụng tín hiệu Wi-Fi WLAN nhằm giảm thiểu sai số định vị, tối ưu thời gian định vị - Các mục tiêu cụ thể: + Xây dựng thuật toán ước lượng tham số, số thành phần Gauss GMM phần liệu không quan sát được; + Xây dựng thuật toán định vị với mục tiêu giảm thiểu sai số định vị, tối ưu thời gian định vị; Phương pháp nghiên cứu Phương pháp thống kê (toán) để xác định xu hướng diễn biến tập liệu (Wi-Fi RSSI) thu thập từ đề xuất mơ hình tốn học mơ tả phân bố liệu; phương pháp giải tích để tính tốn tham số mơ hình vị trí đối tượng cần định vị; phương pháp Monte Carlo để đánh giá sai số tham số mơ hình; cuối cùng, phương pháp thực nghiệm liệu mô liệu thực tế để kiểm chứng hiệu đề xuất áp dụng cho IPS Các đóng góp luận án - Đề xuất 03 thuật toán ước lượng tham số mơ hình mơ tả phân bố Wi-Fi RSSI (mơ hình hỗn hợp Gauss - GMM) tương ứng với 03 trường hợp không quan sát phần liệu [CT2CT4] - Đề xuất thuật toán ước lượng số thành phần Gauss GMM mở rộng [CT5] - Đề xuất thuật toán định vị trường hợp không quan sát phần liệu (Wi-Fi RSSI) đối tượng định vị (OB: Object) thu thập giai đoạn định vị trực tuyến [CT5] Bố cục luận án Bố cục luận án gồm bốn chương, phần mở đầu, kết luận, danh mục cơng trình, báo khoa học công bố, tài liệu tham khảo phụ lục Chương 1: Tổng quan kỹ thuật định vị nhà sử dụng tín hiệu Wi-Fi Chương 2: Ước lượng tham số mơ hình mơ tả phân bố Wi-Fi RSSI Chương 3: Ước lượng số thành phần Gauss mơ hình mơ tả phân bố Wi-Fi RSSI Chương 4: Xây dựng thuật toán định vị kết thực nghiệm IPS CHƯƠNG TỔNG QUAN VỀ KỸ THUẬT ĐỊNH VỊ TRONG NHÀ SỬ DỤNG TÍN HIỆU Wi-Fi 1.1 Các kỹ thuật định vị nhà sử dụng tín hiệu Wi-Fi Các kỹ thuật định vị sử dụng tín hiệu Wi-Fi WLAN chia thành hai nhóm chính: - Nhóm kỹ thuật định vị dựa thuộc tính khơng gian thời gian tín hiệu thu (TSARS: Time and Space Attributes of Received Signal) TSARS thời gian tới (ToA: Time of Arrival), chênh lệch thời gian tới (TDoA: Time Difference of Arrival) góc tới (AoA: Angle of Arrival) - Nhóm kỹ thuật định vị sử dụng số cường độ tín hiệu nhận (RSSI: Received Signal Strength Indication) Nhóm bao gồm: Kỹ thuật định vị tiệm cận; kỹ thuật định vị sử dụng mơ hình suy hao đường truyền RSSIF-IPT RSSIF-IPT gồm hai giai đoạn: giai đoạn huấn luyện ngoại tuyến định vị trực tuyến Ở giai đoạn huấn luyện, RSSI thu thập điểm tham chiếu (RP: Reference Point) có vị trí xác định để xây dựng sở liệu Ở giai đoạn định vị trực tuyến, RSSI OB thu thập so sánh với sở liệu, từ ước lượng vị trí OB thơng qua vị trí số RP Trong số kỹ thuật định vị, RSSIF-IPT có nhiều ưu điểm RSSIF-IPT sử dụng phương pháp tất định (D-RSSIF-IPT: Deterministic RSSIF-IPT) phương pháp xác suất (P-RSSIF-IPT: Probabilistic RSSIF-IPT) So với D-RSSIF-IPT, P-RSSIF-IPT có sai số định vị thấp sở liệu phương pháp thể biến đổi RSSI P-RSSIF-IPT sử dụng mơ hình khơng tham số (ví dụ biểu đồ tần suất) mơ hình có tham số (ví dụ phân phối Gauss, GMM) để mô tả phân bố Wi-Fi RSSI P-RSSIF-IPT dùng mơ hình có tham số cho kết định vị tốt hơn, sở liệu cần lưu tham số so với P-RSSIF-IPT dùng mơ hình khơng có tham số 1.2 Đặt vấn đề nghiên cứu Phân bố Wi-Fi RSSI tuân theo phân phối Gauss bao gồm nhiều thành phần Gauss thu thập điều kiện môi trường xung quanh thay đổi (cửa đóng/mở, người lại) Vì so với phân phối Gauss, GMM mô tả phân bố Wi-Fi RSSI xác Tuy nhiên thực tế số mẫu liệu khơng quan sát hai nguyên nhân sau: - Thiết bị thu thập Wi-Fi RSSI không đo giá trị nhỏ ngưỡng thu, trả giá trị với ngưỡng thu (thông thường – 100dBm với điện thoại thông minh) Hiện tượng gọi tắt “censoring” - Đơi tín hiệu Wi-Fi đột ngột bị AP ngừng hoạt động, thiết bị thu thập Wi-Fi RSSI trả giá trị với ngưỡng thu Hiện tượng gọi tắt “dropping” Từ kết khảo sát Wi-Fi RSSI từ kết nghiên cứu công trình cơng bố, tập liệu (Wi-Fi RSSI) thu thập RP, từ AP có đặc điểm tương ứng với số tám trường hợp sau: (1) Dữ liệu có phân bố tuân theo phân phối Gauss, quan sát toàn tập liệu; (2) Dữ liệu có phân bố tuân theo phân phối Gauss, phần liệu không quan sát bị censoring; (3) Dữ liệu có phân bố tuân theo phân phối Gauss, phần liệu không quan sát bị dropping; (4) Dữ liệu có phân bố tuân theo phân phối Gauss, phân liệu không quan sát censoring dropping; (5) Dữ liệu có phân bố gồm đa thành phần Gauss, quan sát tồn tập liệu; (6) Dữ liệu có phân bố gồm đa thành phần Gauss, phần liệu khơng quan sát censoring (hình 1.10a); (7) Dữ liệu có phân bố gồm đa thành phần Gauss, phần liệu không quan sát dropping (hình 1.10b); (8) Dữ liệu có phân bố gồm đa thành phần Gauss, phần liệu không quan sát censoring dropping (hình 1.10c) a b c Hình 1.10 Biểu đồ tần suất Wi-Fi RSSI thể vấn đề censoring, dropping đa thành phần Gauss Các tác giả báo khác giải tập liệu có đặc điểm trường hợp (1)-(5) Tuy nhiên chưa có nghiên cứu giải tập liệu có đặc điểm trường hợp (6)-(8) Vì lý này, luận án tập trung nghiên cứu, đề xuất giải pháp phát triển RSSIF-IPT để giải đồng thời vấn đề censoring, dropping đa thành phần Gauss (các trường hợp (6)-(8)) đảm bảo liệu có đặc điểm trường hợp (1)-(5) 1.3 Kết luận chương Trong chương này, luận án trình bày kỹ thuật định vị nhà sử dụng tín hiệu Wi-Fi Chương tổng hợp phân tích cơng trình nghiên cứu RSSIF-IPT Trên sở nghiên cứu vấn đề chưa giải RSSIF-IPT, luận án đề định hướng nghiên cứu CHƯƠNG ƯỚC LƯỢNG THAM SỐ CỦA MƠ HÌNH MƠ TẢ PHÂN BỐ Wi-Fi RSSI 2.1 Đặt vấn đề Trong thực tế, tập liệu bao gồm phép đo số cường độ tín hiệu nhận tín hiệu Wi-Fi (Wi-Fi RSSI) thu thập điểm tham chiếu (RP) từ điểm truy cập (AP) có phân bố tuân theo GMM với từ đến J thành phần Gauss (J số hữu hạn) Gọi yn giá trị RSSI thu thập lần thứ n từ AP RP ( yn , n N ), N số lần thu thập Do lần thu thập độc lập với nên yn độc lập với Nếu coi yn biến ngẫu nhiên có phân bố tuân theo GMM hàm mật mật độ xác suất (PDF: Probability Density Function) là: J p yn ; Θ w j ( yn ; j ), (2.1) j 1 với Θ tham số GMM, w j j trọng số tham số thành phần Gauss thứ j Gọi c ngưỡng thu thiết bị thu thập Wi-Fi RSSI, thay thu thập tập liệu đầy đủ y y1 ,y2 , ,yN , thiết bị thu thập Wi-Fi RSSI thu thập tập liệu không đầy đủ x x1 ,x2 , ,xN với: yn yn c xn c yn c ,n 1 N (2.4) Đây tượng tượng phần liệu không quan sát censoring Gọi d d1 ,d2 , ,d N tập biến nhị phân biểu thị mẫu liệu ( yn ) không quan sát dropping (dn 1) quan sát (dn 0) Khi đó, thay thu thập tập liệu đầy đủ (y) , số trường hợp, thiết bị thu thập Wi-Fi RSSI thu thập tập liệu không đầy đủ (x) với: y d n =0 xn n , n 1 N c d =1 n (2.5) Các mẫu liệu có giá trị c trường hợp mẫu liệu không quan sát dropping Censoring dropping hồn tồn xảy đồng thời, đó: y yn c d n =0 xn n , n 1 N c y c hoaë c d =1 n n (2.6) Mục tiêu đặt chương ước lượng tham số (Θ) mơ hình mơ tả phân bố tập liệu y (GMM) thu thập tập liệu x 2.2 Giới thiệu thuật toán EM Thuật toán EM sử dụng giải tốn tìm hợp lý cực đại (ML: Maximum Likelihood) cực đại xác suất hậu nghiệm (MaP: Maximum a Posteriori) mơ hình thống kê có biến ẩn (unobservable variables) cách thực liên tiếp vòng lặp, vòng lặp gồm bước: - Bước E (E-step): Tính giá trị kỳ vọng (expected value) hàm hợp lý (LF: Likelihood Function) - Bước M (M-step): Ước lượng tham số mơ hình để cực đại hóa giá trị kỳ vọng hàm hợp lý tính bước E 2.3 Ước lượng tham số GMM phần liệu khơng quan sát censoring Thuật tốn EM ước lượng tham số GMM phần liệu không quan sát censoring (EM-C-GMM) [CT3]: Gọi Δnj ( n N, j 1 J ) tập biến nhị phân tiềm ẩn (latent variables), Δnj yn thuộc thành phần Gauss thứ j ; Δ nj với 10 2.4 Ước lượng tham số GMM phần liệu không quan sát dropping Thuật toán EM ước lượng tham số GMM phần liệu không quan sát dropping (EM-D-GMM) [CT2]: Bước E: (k ) Q Θ;Θ N J d w n1 j 1 N J (k ) j ln n w ln j 1 dn xn ; (jk ) ln w j ln 1 ln xn ; j n1 j 1 (2.30) Trong công thức (2.30), P(dn 1) xác suất xảy tượng dropping Bước M: dn xn ; (jk ) xn n1 N (jk 1) dn xn ; (jk ) n1 N N j ( k 1) N 1 dn xn ; (jk ) n 1 N w(jk 1) 1 dn xn ; (jk ) xn (jk ) n1 (2.31) N (2.32) N 1 dn xn ; (jk ) dn w(jk ) n 1 n 1 (2.33) N ( k 1) dn n1 N (2.34) 2.5 Ước lượng tham số GMM phần liệu không quan sát censoring dropping Thuật toán EM ước lượng tham số GMM phần liệu không quan sát censoring dropping (EM-CD-GMM) [CT4]: 11 Bước E: Q Θ;Θ(k ) N J 1 xn ; (jk ) ln w j ln 1 ln xn ; j n 1 j 1 N J vnβ n 1 j 1 N (jk ) α Θ J (k ) , (k ) c ln w ln y ; n j j yn ; (j k ) I0 (j k ) dy n vn w(jk ) 1 α Θ( k ) , ( k ) ln n 1 j 1 (2.52) Trong công thức (2.52): (n 1 N ) biến nhị phân thể mẫu liệu quan sát không quan sát ( yn c dn 0, xn yn ; yn c dn 1, xn c); J 1 w (k ) α Θ ( k ) , ( k ) j 1 J 1 w (k ) j 1 I (j k ) (k ) j I (j k ) ( k ) (k ) j Bước M: v v x β α Θ , I 1 v x ; β α Θ , v 1 v x ; x 1 v x ; β α Θ , v I 2 I β α Θ , v I I + 1 v x ; β α Θ , v N ( k 1) j xn ; (jk ) n n1 (jk ) n I1 (j k ) (k ) N n n1 (k ) j n N j (k ) ( k 1) n n 1 N n n 1 (k ) j n (k ) (k ) (k ) j N n 1 n (k ) j n (k ) j (k ) j n (k ) (k ) j N n1 (k ) j n (k ) n (2.53) n N (k ) n 1 (k ) j (k ) j (k ) j (k ) j n1 2 (k ) j (k ) N n (k ) j (k ) j (k ) j (k ) (k ) n 1 N n 1 N n n (2.54) 12 N w(jk 1) 1 n1 1 α Θ ( k ) , ( k ) v n 1 n xn ; (jk ) α Θ (k ) , (k ) N N ( k 1) N v n1 n (2.55) N β (jk ) N 1 α Θ( k ) , ( k ) v n1 n (2.56) N Từ cơng thức (2.53) - (2.56) nhận thấy: - Nếu (dữ liệu thu thập đầy đủ), (2.52)- (2.55) rút gọn cơng thức thuật tốn EM ước lượng tham số GMM (EMGMM, trường hợp 5); - Nếu J 1, (2.52)- (2.56) rút gọn công thức thuật toán EM ước lượng tham số phân phối Gauss phần liệu không quan sát censoring dropping (EM-CD-G, trường hợp (1)(4)); Từ lập luận kết luận: EM-CD-GMM [CT4] việc giải đồng thời vấn đề, bao gồm đa thành phần Gauss phân bố Wi-Fi RSSI, censoring dropping (các trường hợp (5)-(8), mục 1.2) hồn tồn với liệu có phân bố tuân theo phân phối Gauss (các trường hợp (1)-(4), mục 1.2) 2.6 Đánh giá sai số tham số GMM ước lượng thuật toán EM Trong mục này, thuật toán EM-CD-GMM kiểm nghiệm so sánh với thuật toán EM khác công bố tập liệu mô phỏng, thông qua khoảng cách Kullback Leibler (KLD: Kullback Leibler Divergence) Sau 1000 lần thực nghiệm, giá trị trung bình KLD (KLD ) thuật tốn thể bảng 2.1 độ lệch chuẩn ( KLD ) thể bảng 2.2 (khi c= – 90dBm) Bảng 2.1 KLD thuật toán EM sau 1000 lần thực nghiệm 13 c (dBm) Thuật toán –90 EM-GMM EM-CD-G EM-CD-GMM 3.1491 0.0798 0.0098 0.075 3.2325 0.0864 0.0111 0.15 3.3142 0.1096 0.0229 0.225 3.5054 0.1329 0.0334 0.3 6.1253 0.1998 0.0364 Bảng 2.2 KLD thuật toán EM sau 1000 lần thực nghiệm c (dBm) Thuật toán –90 EM-GMM EM-CD-G EM-CD-GMM 0.0351 0.1199 0.0227 0.075 0.3535 0.1364 0.0601 0.15 1.7911 0.1535 0.0857 0.225 2.202 0.1963 0.1005 0.3 2.4937 0.296 0.1302 Từ kết thực nghiệm bảng 2.1 bảng 2.2 nhận thấy: - Với c 96 , liệu quan sát gần đầy đủ Khi khơng có sai lệch lớn tham số ước lượng EMGMM tham số ước lượng EM-CD-GMM EM-CD-G có sai số lớn coi phân bố liệu tuân theo phân phối Gauss - Với trường hợp khác, KLD KLD EM-CD-GMM ln nhỏ Bởi EM-CD-GMM thuật tốn ước lượng xác mơ hình mơ tả phân bố Wi-Fi RSSI tập liệu thu thập có phân bố gồm đa thành phần Gauss, phần không quan sát censoring dropping 2.7 Kết luận chương Trong chương 2, tác giả đề xuất ba thuật toán ước lượng tham số GMM trường hợp: Một phần liệu không quan sát censoring; phần liệu không quan sát dropping; phần liệu không quan sát censoring dropping Các kết thực nghiệm chứng minh hiệu thuật toán EM-CD-GMM so với EM-GMM EM-CD-G 14 CHƯƠNG ƯỚC LƯỢNG SỐ THÀNH PHẦN GAUSS TRONG MÔ HÌNH MƠ TẢ PHÂN BỐ Wi-Fi RSSI 3.1 Đặt vấn đề Trên thực tế, Wi-Fi RSSI thu thập RP khác từ AP khác có phân bố khác nhau, gồm nhiều thành phần Gauss Nếu sử dụng GMM với J thành phần Gauss, số tham số GMM NPs=3J-1 Điều có nghĩa số lượng tham số cần lưu sở liệu số phép toán thuật toán định vị tỉ lệ thuận với số thành phần Gauss sử dụng mô tả phân bố Wi-Fi RSSI Vì cần có giải pháp ước lượng số thành phần Gauss GMM mô tả phân bố Wi-Fi RSSI nhằm tối ưu sở liệu làm giảm mức độ phức tạp phép tính thuật tốn định vị IPS 3.2 Các phương pháp ước lượng số thành phần Gauss GMM 3.2.1 Ước lượng số thành phần Gauss GMM phương pháp hàm phạt (PF: Penalty Function) x tập liệu quan sát được, có phân bố tuân theo GMM; N ˆ tham số GMM với J thành số mẫu liệu tập x ; Θ J phần Gauss mô tả phân bố x ; N Ps số tham số GMM; Gọi ˆ | x) hàm hợp lý PF AIC, AIC3 BIC định nghĩa lần (Θ J lượt công thức (3.3)-(3.5) PFAIC (Θˆ J ) 2ln[(Θˆ J | x)] 2NPs (3.3) PFAIC3 (Θˆ J ) 2ln[(Θˆ J | x)] 3NPs (3.4) PFBIC (Θˆ J ) 2ln [(Θˆ J | x)] N Ps ln N (3.5) 3.2.2 Ước lượng số thành phần Gauss GMM phương pháp hàm đặc trưng (CF: Characteristic Function) Phương pháp CF sử dụng hội tụ tổng có trọng số phần thực logarit hàm đặc trưng (SWRLCF: Sum of Weighted Real 15 parts of all Log-Characteristic Functions) để xác định số thành phần Gauss sau: J SWRLCF( J ) wˆ jˆ j (3.6) j 1 3.3 Ước lượng số thành phần Gauss GMM phần liệu không quan sát censoring dropping [CT5] Thành phần ln [(Θˆ J | x)] PFBIC (3.5) tính sau: ˆ ,ˆ | x ln Θ J 1 ln ˆ n 1 N ln ˆ n 1 N wˆ j xn ;ˆj J j 1 wˆ j I0 ˆ j ˆ j 1 J (3.7) Gọi PFBICCD (Θˆ J ,ˆ ) PF tương ứng với trường hợp phần liệu không quan sát censoring dropping, ta có: N J n1 j 1 ˆ ,ˆ 2 1 ln 1 ˆ wˆ j xn ;ˆj PFBICCD Θ J ln ˆ n1 N wˆ j I0 ˆj ˆ 3J ln N j 1 J (3.12) Thuật toán ước lượng số thành phần Gauss tham số GMM phần liệu không quan sát censoring dropping (EM-CD-GMM-PFBIC-CD) đề xuất sau (hình 3.4): Các tham số đầu vào:Tập liệu (x) với phần không quan sát censoring dropping; ngưỡng hội tụ thuật toán EM-CDGMM ( EM ) ; số thành phần Gauss tối đa ( Jmax ) sử dụng để tính hàm PFBIC-CD Các tham số đầu ra: Các tham số ước lượng được, bao gồm số thành ˆ ,ˆ ) mô tả phân bố phần Gauss ( Jˆ ) tham số GMM (Θ ˆ J tập x 16 Bắt đầu J 1 k 1; khởi tạo j = j , j , w j , j =1 J EM-CD-GMM k k 1 Bước E: Tính xn ; (jk ) , I j( k ) , β (jk ) , α ( k ) , ( k ) , I1 j( k ) vaø I j( k ) theo EM-CD-GMM; tính ln Θ (Jk ) , ( k ) | x theo (3.11) vòng lặp thứ (k ) Bước M: Tính (jk 1) = (j k 1) , j ( k 1) , w(j k 1) , j =1 J ( k 1) theo EM-CD-GMM; tính ln Θ (Jk 1) , ( k 1) | x theo (3.11) vòng lặp thứ (k +1) ln ( k 1) ΘJ , ( k 1) | x ln Θ(Jk ) , (k ) Sai | x EM Đúng Lưu tạm thời tham số GMM với J thành phần Gauss, ước lượng EM-CD-GMM: ( k 1) ( k 1) ˆ ˆ ˆ ˆ ˆ ( k 1) ( k 1) ( k 1) Θ J , , J ,với j j = j , j , w j , j =1 J vaø ˆ ,ˆ theo (3.12) Tính PFBIC CD Θ J J=Jmax Sai J J 1 Đúng Chọn PFBIC CD nhỏ số J max caùc PFBIC CD : ˆ ,ˆ PF ˆ ,ˆ , , PF ˆ ˆ PFBIC CD Θ Θ BIC CD Θ J J max , Jˆ BIC CD J 1 Lưu số thành phần Gauss ước lượng (Jˆ ) tham số GMM ˆ = ˆ ,ˆ ,wˆ , , ˆ ,ˆ ,wˆ ;ˆ với Jˆ thành phần Gauss: Θ 1 Jˆ Jˆ Jˆ Jˆ Kết thúc Hình 3.4 Thuật tốn EM-CD-GMM-PFBIC-CD 17 3.4 Đánh giá thuật toán ước lượng số thành phần Gauss GMM Trong mục này, thuật toán ước lượng số thành phần Gauss GMM đánh giá thông qua lần thực nghiệm khác tập liệu mơ Các thuật tốn thực nghiệm bao gồm: - Thuật toán ước lượng số thành phần Gauss sử dụng EM-GMM PFAIC (EM-GMM-PFAIC), tham số đầu vào khởi tạo gồm EM 106 , Jmax ; - Thuật toán ước lượng số thành phần Gauss sử dụng EM-GMM PFBIC (EM-GMM-PFBIC), tham số đầu vào khởi tạo gồm EM 106 , Jmax ; - Thuật toán ước lượng số thành phần Gauss sử dụng EM-GMM SWRLCF (EM-GMM-SWRLCF), tham số đầu vào khởi tạo gồm EM 106 , CF 0.02; - Thuật toán EM-CD-GMM-PFBIC-CD tác giả đề xuất, tham số đầu vào khởi tạo gồm EM 106 , Jmax Sau 1000 lần thực nghiệm, kết thể bảng 3.2, với P(J =Jˆ) , P(| J Jˆ |1) P(J Jˆ | 2) xác suất số thành phần Gauss ước lượng ( Jˆ ) số thành phần Gauss thực ( J ) , xác suất Jˆ lệch so với J thành phần Gauss xác suất Jˆ lệch so với J từ thành phần Gauss trở lên Từ kết bảng 3.2 thấy, trường hợp, EMCD-GMM-PFBIC-CD có kết tốt so với thuật tốn khác Cụ thể, tính trung bình xác suất ước lượng số thành phần Gauss GMM EM-CD-GMM-PFBIC-CD cao so với xác suất ước lượng số thành phần Gauss GMM EM-GMM-PFAIC, EM-GMM-PFBIC EM-GMM-SWRLCF 76%, 69% 67% 18 Bảng 3.2 Thống kê xác suất ước lượng đúng, lệch lệch từ thành phần Gauss trở lên thuật toán (khi c= 92 dBm) c Thuật toán Xác suất (dBm) 0.1 0.2 0.01 0.01 0.01 P(J=Jˆ) EM-GMM-PFAIC 0.31 0.27 0.22 P(| J Jˆ |1) 0.68 0.72 0.78 P(J Jˆ | 2) 0.01 0.01 0.01 P(J=Jˆ) EM-GMM-PFBIC 0.39 0.37 0.3 P(| J Jˆ |1) 0.6 0.62 0.69 P(J Jˆ | 2) 92 0.52 0.02 0.01 P(J=Jˆ) EM-GMM-SWRLCF 0.39 0.78 0.77 P(| J Jˆ |1) 0.09 0.2 0.22 P(J Jˆ | 2) 0.82 0.8 0.79 P(J=Jˆ) EM-CD-GMM-PFBIC-CD 0.16 0.18 0.2 P(| J Jˆ |1) 0.02 0.02 0.01 P(J Jˆ | 2) 3.5 Kết luận chương Khi phần liệu không quan sát dropping censoring hai, phương pháp ước lượng số thành phần Gauss GMM công bố trước có sai số lớn chưa đề cập tới mẫu liệu không quan sát Trong chương 3, PF BIC tính mẫu liệu quan sát xn c mẫu liệu không quan sát xn c Đây điểm phương pháp ước lượng số thành phần Gauss GMM mô tả phân bố Wi-Fi RSSI đề xuất so với phương pháp giới thiệu công bố 19 CHƯƠNG XÂY DỰNG THUẬT TOÁN ĐỊNH VỊ VÀ CÁC KẾT QUẢ THỰC NGHIỆM IPS 4.1 Đặt vấn đề P-RSSIF-IPT bao gồm giai đoạn huấn luyện ngoại tuyến giai đoạn định vị trực tuyến Trong giai đoạn huấn luyện ngoại tuyến, gọi NRP số điểm tham chiếu (RP) khu vực cần định vị; gọi NAP số điểm truy cập Wi-Fi (AP); gọi x q ,i q N RP , i N AP tập liệu thu thập RP thứ q từ AP thứ i , đó, giai đoạn huấn luyện ngoại tuyến IPS sử dụng P-RSSIF-IPT cần xây dựng sở liệu: R Θˆ q,i ; q NRP , i N AP , (4.1) ˆ tham số mơ hình mơ tả phân bố x Bộ tham số với Θ q,i q ,i ước lượng thuật toán EM-CD-GMM-PFBIC-CD Trong giai đoạn định vị trực tuyến, gọi x on ( x1on xNonAP ) tập liệu OB thu thập được, toán định vị tương đương với toán phân lớp cho x on , với lớp RP Vị trí OB tương ứng với vị trí lớp (RP) “phù hợp” với x on Cực đại xác xuất hậu nghiệm (MaP) phương pháp sử dụng phổ biên để ước lượng vị trí OB P-RSSIF-IPT sử dụng mơ hình có tham số Tuy nhiên, môi trường nhà, Wi-Fi RSSI thường chịu ảnh hưởng tượng censoring, dropping Bởi chương này, thuật toán định vị dựa phương pháp MaP đề xuất để giải vấn đề phần liệu thu thập giai đoạn định vị trực tuyến không quan sát censoring dropping 4.2 Thuật toán định vị dựa phương pháp MaP [CT5] Gọi q vị trí RP thứ q khu vực cần định vị, OB thu thập trực tuyến vị trí mẫu liệu x on [x1on , x2on , , xNonAP ] , xác suất hậu nghiệm (posterior) xác định sau: 20 N AP p xion | q P q i 1 p q | xon N RP N AP p xion q' 1 i 1 | q' P q' (4.2) Trong công thức (4.2), P( q ) xác suất biên, coi RP độc N RP N AP lập với nhau: P q ; p xion | q' P q' số chuẩn hóa N RP q' 1 i 1 (normalising constant); p xion | q hợp lý (likelihood) tính sau: Jˆq ,i N AP ˆ q ,i wˆ q ,i, j xion ;ˆq ,i , j i 1 j 1 on x >c N N i ˆ J q ',i AP RP ˆ q ',i wˆ q ',i , j xion ;ˆq ',i , j j 1 q '1 i 1 N AP Jˆq ,i ˆ w ˆ I ˆ q ,i ˆ q ,i i 1 j 1 q ,i , j q ,i , j x on c i N RP N AP Jˆq ,i w ˆ q ,i , j I0 ˆq ,i , j ˆ q ,i ˆ q ,i q '1 i 1 j 1 p q | xon (4.9) Sử dụng phương pháp K láng giềng gần (KNN: K-nearest neighbors), chọn KNN RP có xác suất hậu nghiệm từ lớn đến lớn thứ KNN , vị trí OB là: q p q | x on q K ˆ xon qK p q | xon NN (4.10) NN 4.3 Các kết thực nghiệm IPS 4.3.1 Sai số định vị Sai số định vị tiêu chí quan trọng IPS Để đánh giá so sánh sai số IPS áp dụng đề xuất chương 2, mục 4.2 21 với sai số IPS áp dụng cơng trình khác công bố, tác giả tiến hành thực nghiệm IPS liệu mô liệu thực 4.3.1.1 Thực nghiệm IPS liệu mô Để thực nghiệm IPS liệu mô phỏng, mặt có diện tích 45m x 45m với 10 AP 100 RP tạo Matlab Dữ liệu giai đoạn huấn luyện ngoại tuyến thu thập theo trình tự sau: (1) Thu thập liệu RP từ AP theo mơ hình suy hao đường truyền: r yn[dBm]=RSSI 0[dBm] 10 log10 (4.11) r0 (2) Làm tròn yn (3) Tạo mẫu liệu không quan sát censoring, dropping với 0.15 , c 100dBm Số lượng mẫu liệu thu thập RP từ AP 400 mẫu Dữ liệu thu thập 50% RP có phân bố tuân theo phân phối Gauss; liệu thu thập 17% RP khác có phân bố tuân theo GMM với thành phần Gauss; liệu thu thập 17% RP khác có phân bố tuân theo GMM với thành phần Gauss; liệu thu thập 16% RP lại có phân bố tn theo GMM với thành phần Gauss Trong giai đoạn định vị trực tuyến, 1000 liệu thu thập 100 vị trí 100 RP Tại vị trí, 10 liệu thu thập theo trình tự tương tự trình tự thu thập liệu giai đoạn huấn luyện ngoại tuyến Bảng 4.2 thống kê giá trị trung bình (DE ) phương sai ( DE ) sai số định vị IPS áp dụng phương khác nhau, bao gồm: - Phương pháp biểu đồ tần suất (histogram) - EM-GMM-AIC-MaP Trong phương pháp này, giai đoạn huấn luyện, GMM sử dụng để mô tả phân bố liệu thuật toán EM-GMM kết hợp tiêu chuẩn AIC sử dụng ước lượng tham số GMM Ở giai đoạn định vị trực tuyến, thuật toán định vị dựa phương pháp MaP sử dụng 22 - EM-CD-G-MaP Trong phương pháp này, giai đoạn huấn luyện, phân phối Gauss sử dụng mô tả phân bố liệu thuật toán EM-CD-G áp dụng để ước lượng tham số mơ hình Ở giai đoạn định vị trực tuyến, thuật toán định vị dựa phương pháp MaP sử dụng - EM-CD-GMM-BIC-MaP phương pháp tác giả đề xuất Ở giai đoạn huấn luyện, GMM sử dụng mô tả phân bố liệu thuật toán EM-CD-GMM-PFBIC-CD sử dụng để ước lượng tham số GMM Các tham số đầu vào EM-CD-GMM-PFBIC-CD chọn bao gồm: EM 106 , Jmax Ở giai đoạn định vị trực tuyến, thuật toán định vị dựa phương pháp MaP (mục 4.2) sử dụng Trong thuật toán định vị dựa phương pháp MaP, số láng giềng gần chọn: KNN Giá trị trung bình phương sai sai số định vị sau 1000 lần thực nghiệm thể bảng 4.1 4.3.1.2 Thực nghiệm IPS liệu thực Để đánh giá, so sánh IPS áp dụng phương pháp khác liệu thực, tác giả tiến hành thực nghiệm mặt tầng tòa nhà có diện tích 360m2 Trong giai đoạn huấn luyện, thiết bị Samsung Galaxy S7-SM-G930F với phần mềm thu thập Wi-Fi RSSI sử dụng thu thập liệu 25 RP Khoảng cách trung bình RP 2.7m Tại RP, 400 mẫu liệu thu thập từ AP Thời gian lần thu thập 3000ms Sau tổng hợp 25 RP có tổng số 72 AP khả dụng, AP có trung bình RSSI lớn chọn để xây dựng sở liệu giai đoạn huấn luyện ngoại tuyến Trong giai đoạn định vị trực tuyến, 100 liệu thu thập 25 vị trí RP Tại vị trí thu thập liệu Thiết bị thu thập khoảng thời gian hai lần thu thập liệu tương tự giai đoạn huấn luyện ngoại tuyến Bảng 4.2 thể giá trị trung bình phương sai sai số định vị thực nghiệm IPS với liệu thực sau 100 lần thực nghiệm 23 Bảng 4.1, 4.2 Giá trị trung bình phương sai sai số định vị Dữ liệu mô Dữ liệu thực Phương pháp 2 DE[m] DE DE[m] [m] DE [m] Histogram 2.8 5.1 2.0 4.7 EM-GMM-AIC-MaP 2.2 4.9 1.3 4.6 EM-CD-G-MaP 1.6 4.4 0.8 3.5 EM-CD-GMM-BIC-MaP 1.0 3.0 0.5 2.3 4.3.2 Mức độ phức tạp thuật toán định vị Để đánh giá mức độ phức tạp thuật toán định vị, tác giả tiến hành thực nghiệm liệu thực thu thập mục 4.3.1.2 Ở thực nghiệm (Experiment 1) tham số số thành phần Gauss GMM ước lượng thuật toán EM-CD-GMM-PFBIC-CD Ở thực nghiệm (Experiment 2, 4), tham số CDGMM ước lượng thuật toán EM-CD-GMM, nhiên số thành phần Gauss gán cố định 2, Với giai đoạn định vị trực tuyến, bốn thực nghiệm sử dụng thuật toán định xây dựng mục 4.2 Bốn thuật toán định vị bốn thực nghiệm tiến hành máy tính Sau 100 lần chạy thuật toán định vị giá trị trung bình, phương sai sai số định vị trung bình thời gian máy tính thực bốn thuật toán định vị tương ứng bốn thực nghiệm tETP thể bảng 4.3 Bảng 4.3 Trung bình thời gian thực hiện, giá trị trung bình phương sai sai số định vị tương ứng với bốn thực nghiệm J Jˆ J 2 J 3 J 4 257.577 1.0686 2.9862 4.4 Kết luận chương 340.931 1.1401 3.0388 369.604 1.0372 2.9685 400.335 1.0058 2.9527 Experiment tETP [ms] DE[m] DE [m] Trong chương 4, luận án đề xuất thuật toán định vị sử dụng giai đoạn định vị trực tuyến IPS Ngoài ra, tác giả tiến hành thực 24 nghiệm IPS mặt tòa nhà có diện tích 360m2 Kết thực nghiệm liệu thực cho thấy, điều kiện thực nghiệm, IPS áp dụng kết nghiên cứu [CT4], [CT5] có sai số định vị thấp 0.6m so với IPS áp dụng kết cơng trình cơng bố trước Mặt khác áp dụng thuật tốn EM-CDGMM-PFBIC-CD [CT5], trung bình thời gian định vị giảm tối thiểu 25% so với áp dụng EM-CD-GMM [CT4] KẾT LUẬN A Các kết luận án - Đề xuất sử dụng GMM mô tả phân bố Wi-Fi RSSI giai đoạn huấn luyện ngoại tuyến IPS sử dụng P-RSSIF-IPT Kết thực nghiệm IPS liệu mô phỏng: Khi sử dụng GMM, trung bình sai số định vị giảm 0.652m so với sử dụng phân phối Gauss [CT1] - Xây dựng ba thuật toán ước lượng tham số GMM tương ứng với trường hợp phần liệu không quan sát censoring, phần liệu không quan sát dropping phần liệu không quan sát censoring dropping [CT2-CT4] - Xây dựng thuật toán ước lượng số thành phần Gauss GMM phần liệu không quan sát censoring dropping [CT5] - Xây dựng thuật toán định vị thực nghiệm khu vực nhà có diện tích 360m2[CT5], kết quả: Trung bình sai số định vị giảm 0.6m so với cơng trình khác cơng bố; trung bình thời gian định vị giảm 25% B Hướng phát triển luận án - Xây dựng giải pháp ước lượng ngưỡng thu thiết bị thu thập Wi-Fi RSSI trước áp dụng thuật toán giai đoạn huấn luyện ngoại tuyến định vị trực tuyến đề cập - Xây dựng giải pháp thu thập, cập nhật sở liệu tự động - Kết hợp P-RSSIF-IPT với kỹ thuật định vị dự đốn (DR-IPT) nhằm giảm sai số định vị, tăng tính thời gian thực hệ thống