4.1.1 Mục tiêu
Trong mục 2.7 trình bày về những thách thức khi triển khai hệ thống định vị RSS Wlan Fingerprinting, trong đĩ thách thức điển hình nhất hiện nay là sự phân phối ngẫu nhiên của các giá trị RSS tại mỗi vị trí tham chiếu do ảnh hưởng của mơi trường xung quanh. Như vậy độ lệch chuẩn trong phân phối của các giá trị RSS sẽ ảnh hưởng đến tính chính xác của thuật tốn định vị. Để phân tích và tìm cách khắc phục nhược điểm này, luận văn đề xuất xây dựng một chương trình mơ phỏng. Mục tiêu của chương trình mơ phỏng là tạo ra một mơi trường giả lập cĩ giá trị RSS phân phối ngẫu nhiên và tùy biến số lượng AP, các điểm tham chiếu cho phép chúng ta kiểm tra tính hiệu quả của các thuật tốn định vị và kiểm chứng 3 giả định:
Độ lệch chuẩn của RSS càng lớn thì sai số khoảng cách trong dự báo vị trí của người dùng càng lớn.
Số lượng AP tăng lên thì sai số khoảng cách trong dự báo vị trí của người dùng giảm
Sai số khoảng cách trong dự báo sẽ giảm nếu sử dụng thơng tin vị trí trong quá khứ kết hợp với thuật tốn K-Maximum Likelihood Neighbor sẽ dự báo vị trí người dùng chính xác hơn.
4.1.2 Mơ tả
Do thực tiễn trong quá trình nghiên cứu luận văn cĩ những khĩ khăn về trang thiết bị triển khai thực tế lắp đặt nhiều Access Point và diện tích nhà riêng cịn hạn chế để cĩ thể tiến hành đo đạc RSS trên nhiều vị trí tham chiếu nên việc xây dựng chương trình mơ phỏng nhằm giả lập ra các tình huống cĩ nhiều AP và nhiều điểm tham chiếu để cĩ thể đánh giá sai số trong quá trình dự báo vị trí của người dùng trên số lượng dữ liệu Fingerprinting lớn.
Chương trình mơ phỏng gồm các chức năng chính như sau:
Xây dựng bản đồ giả lập
Sản sinh 48 vị trí tham chiếu các vị trí liên tiếp cách nhau 1m
Sản sinh bộ dữ liệu RSS giả lập
Chạy thử các thuật tốn trên bộ dữ liệu này
4.1.2.1 Xây dựng bản đồ giả lập
Bản đồ giả lập thể hiện 1 khu vực cĩ chiều dài 15m, chiều rộng 5m, các điểm tham chiếu được sản sinh cách nhau 1m, vị trí các AP được đặt ngẫu nhiên
Hình 4.1 :Bản đồ mơ phỏng gồm 96 vị trí tham chiếu và 5 AP
4.1.2.2 Xây dựng bộ dữ liệu RSS Fingerprinting
Sử dụng mơ hình Path Loss để sản sinh bộ dữ liệu RSS ngẫu nhiên để kiểm tra thuật giải và các giả định. Mơ hình Path Loss được trình bày ở chương 2 như sau:
Trong đĩ:
: cường độ tín hiệu sĩng vơ tuyến khi trạm phát và trạm thu cách nhau 1m. Giá trị này -32 dbm
d: khoảng cách giữa các trạm phát và trạm thu
n: hệ số suy hao đường truyền tín hiệu trong mơi trường. Giá trị n=2 khi ở mơi trường trống trải.
s: là fading (fading là sự tăng giảm ngẫu nhiên cường độ tín hiệu tại điểm thu) gây bởi sự che khuất tầm nhìn thẳng giữa anten của thiết bị phát và anten của thiết bị thu. Giá trị này khoảng từ 3dbm đến 7 dbm
Sử dụng mơ hình Path Loss trên, chương trình giả lập sẽ tính khoảng cách d giữa các AP và các điểm tham chiếu (thơng tin vị trí các AP và các điểm tham chiếu đã được sản sinh trước đĩ). Sau đĩ dựa vào khoảng cách này để tính ra giá trị RSS tại điểm tham chiếu đĩ. Tuy nhiên do RSS tại một vị trí tham chiếu khơng phải là giá trị duy nhất mà nĩ thay đổi theo thời gian và tuân theo luật phân phối chuẩn nên chương trình giả lập đã sử dụng thuật tốn Box-Muller [4],[17] để sản sinh ra bộ dữ liệu RSS tại một vị trí tham chiếu phân phối ngẫu nhiên theo luật phân phối chuẩn.
4.1.2.3 Phương pháp Box–Muller sinh mẫu phân phối chuẩn ngẫu nhiên
Từ một tính chất của phân phối Gauss:
Ta cĩ thể tìm ra dãy với bất kỳ từ dãy bởi cơng thức
Phương pháp Box-Muller cho phép ta sinh ra 1 dãy phân phối chuẩn
để từ đĩ cĩ thể chuyển qua dãy phân phối chuẩn bất kỳ. Phương pháp Box-Muller được trình bày như sau:
Phân phối , theo định nghĩa, được biểu diễn dưới dạng hàm phân phối xác suất: (4.1)
Như vậy, để lấy ra 1 cặp X=x, Y=x ở 2 dãy phân phối chuẩn tương ứng hàm mật độ xác suất sẽ là: (4.2) Ta đặt (4.3) (4.4) Ta sẽ tìm cách sinh ra dãy và để từ đĩ sinh ra dãy ,
Vì nên sẽ được sinh theo phân phối đều trong miền
hay cĩ thể viết dưới dạng với là phân phối đều trong miền . Để sinh r, ta định nghĩa hàm tính xác suất để sinh cặp sao cho
:
(4.5)
(4.6)
Đặt ta cĩ ; với mỗi ta sẽ cĩ 1 bán kính tọa độ các điểm nằm trên đường trịn bán kính
Lúc này sẽ cĩ giá trị phân phối đều, đặt cũng cĩ giá trị phân bố đều, từ đây ta cĩ thể xây dựng 2 dãy phân bố chuẩn độc lập:
(4.7)
(4.8)
4.1.3 Phương pháp đánh giá
Trong tình huống giả định 1: “Độ lệch chuẩn của RSS càng lớn thì sai số khoảng cách trong dự báo vị trí của người dùng càng lớn”, chương trình mơ phỏng sẽ đánh giá kết quả giả định bằng cách sử dụng thuật tốn Box-Muller để tạo ra tập các giá trị RSS tại mỗi vị trí tham chiếu biến đổi theo quy luật phân phối chuẩn trong các trường hợp mà độ lệch chuẩn của RSS ứng với các giá trị từ 14. Sau đĩ sử dụng thuật tốn K-Maximum Likelihood Neigbor để kiểm tra sai số khoảng cách trung bình của nhiều lần dự báo từng trường hợp tương ứng với độ lệch chuẩn của RSS là 1,2,3 và 4.
Trong tình huống giả định 2: “Số lượng AP tăng lên thì sai số khoảng cách trong dự báo vị trí của người dùng giảm”, chương trình mơ phỏng đánh giá kết quả giả định bằng cách tạo ra nhiều AP giả lập theo 3 trường hợp: 5 AP, 10 AP và 15 AP. Sau đĩ chạy thuật tốn K-Maximum Likelihood Neighbor nhiều lần để xác định sai số khoảng cách trung bình của các dự báo trong từng trường hợp 5AP, 10 AP và 15 AP. Từ kết quả sai số khoảng cách đĩ sẽ đánh giá kết quả đúng sai của giả định và đưa ra kết luận.
Trong tình huống giả định 3: “Sai số khoảng cách trong dự báo sẽ giảm nếu sử dụng thơng tin vị trí trong quá khứ kết hợp với thuật tốn K-Maximum Likelihood Neighbor sẽ dự báo vị trí người dùng chính xác hơn”. Chương trình mơ phỏng đánh giá kết quả giả định bằng cách tạo ra 5 AP giả lập và 96 vị trí tham chiếu sau đĩ chạy thuật tốn K-Maximum Likelihood Constraint Tracking Neighbor nhiều lần để dự báo vị trí, sau đĩ khảo sát sai số khoảng cách trung bình của tất cả các lần định vị để đánh giá hiệu suất của thuật tốn.
4.1.4 Đánh giá kết quả và phân tích
Thuật tốn Box-Muller với độ lệch chuẩn là 3 và giá trị RSS trung bình là -45 dbm tạo ra phân bố RSS tuân theo quy luật phân phối chuẩn với kết quả như hình 4.2.
Hình 4.2: Biểu đồ phân phối chuẩn RSS sinh ra từ thuật tốn Box-Muller
Giả định 1: Độ lệch chuẩn của RSS càng nhỏ thì thuật tốn định vị càng chính xác, sai số càng lớn thì càng thiếu chính xác.
Ta xét trường hợp cĩ 5 AP, vị trí của 5 AP này là ngẫu nhiên. Chúng ta sẽ xem xét sai số trong thuật giải trên khi chỉ lắp đặt 5AP
Phân phơi xác suat cua RSSI
Histogram Normal Rssi (dbm) -40 -42 -44 -46 -48 -50 X ác S uâ t 0.36 0.32 0.28 0.24 0.2 0.16 0.12 0.08 0.04 0
Hình 4.3: Biểu đồ mối quan hệ giữa độ lệch chuẩn của RSS và sai số khoảng cách dự báo
Mẫu biểu đồ 4.3 là kết quả của chương trình mơ phỏng chạy thử với số lượng 500 lần dự báo vị trí.
Dựa trên hình 4.3 chúng ta thấy rằng:
Trong trường hợp độ lệch chuẩn RSS là 1 thì sai số trung bình trong dự báo vị trí người dùng là 0.71m.
Trong trường hợp độ lệch chuẩn RSS là 2 thì sai số trung bình trong dự báo vị trí người dùng là 1.04 m.
Trong trường hợp độ lệch chuẩn RSS là 3 thì sai số trung bình trong dự báo vị trí người dùng là 1.36 m. 0.57 0.71 0.85 0.91 1.04 1.17 1.18 1.36 1.54 1.31 1.50 1.69 0.00 0.20 0.40 0.60 0.80 1.00 1.20 1.40 1.60 1.80 2.00 2.20 2.40 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 Sa i số kh oảng c ách (m ) Độ lệch chuẩn 1 2 3 4
Trong trường hợp độ lệch chuẩn RSS là 4 thì sai số trung bình trong dự báo vị trí người dùng là 1.5m.
Như vậy chúng ta dễ dàng nhận ra rằng độ lệch chuẩn RSS càng lớn thì sai số khoảng cách việc dự đốn vị trí người dùng càng lớn.
Để giảm bớt sai số chúng ta cĩ thể lọc nhiễu sĩng RSS hoặc tăng số lượng AP để nâng cao độ chính xác trong quá trình định vị.
Aùp dụng phương pháp lọc nhiễu giúp độ chính xác của quá trình định vị được cải thiện hơn. Trong trường hợp độ lệch chuẩn của RSS là 4 cĩ sai số trung bình trong dự báo khoảng cách là 1.5m, sau khi xử lý lọc nhiễu, sai số giảm xuống cịn 1.41m. Đối với trường hợp độ lệch chuẩn RSS là 3 thì sai số trung bình trong dự báo vị trí người dùng là 1.36 m, sau khi xử lý nhiễu sai số giảm xuống cịn 1.28m. Đây là kết quả cho thấy hiệu quả của việc lọc dữ liệu nhiễu
trong việc nâng cao độ chính xác của quá trình định vị. Một kết luận được rút ra là quá trình lọc nhiễu RSS sẽ loại bỏ đi những mẫu RSS xấu khi đo đạc, điều này giúp cải thiện tính chính xác của bộ dữ liệu huấn luyện, từ đĩ thuật tốn định vị sẽ đưa ra những dự báo chính xác hơn.
Từ kết quả rút ra từ giả định trên, chúng ta thấy rằng RSS dao động với độ lệch chuẩn càng thấp thì quá trình định vị càng chính xác. Liên hệ với thực tế triển khai hệ thống định vị, để cĩ được các giá trị RSS phân bố với độ lệch chuẩn thấp, chúng ta cần chú ý tới tính ổn định của sĩng vơ tuyến của các AP, chọn những loại AP cĩ cường độ sĩng ổn định. Vấn đề tiếp theo là mơi trường xung quanh cũng làm ảnh hưởng tới sĩng vơ tuyến như hiện tượng phản xạ, tán xạ, nhiễu xạ, suy hao tín hiệu … Chúng ta phải chọn vị trí thích hợp để lắp đặt các AP sao cho giảm thiểu được các ảnh hưởng của mơi trường tới sĩng vơ tuyến. Cuối cùng chúng ta sử dụng bộ lọc nhiễu để loại ra những giá trị RSS bị nhiễu trong quá trình thu thập.
Giả định 2: càng lắp đặt nhiều AP(với điều kiện là các AP lắp vào thêm là
các AP cĩ sĩng RSS ổn định), sai số khoảng cách trong dự đốn vị trí càng nhỏ.
Ta chạy chương trình mơ phỏng với độ lệch chuẩn của RSS là 2, trong 3 trường hợp: 5AP, 10 AP và 15 AP, biểu đồ hình 4.4 cho ta thấy chi tiết sai số khoảng cách trong dự báo:
Hình 4.4: Mối quan hệ giữa số lượng AP và sai số khoảng cách trong dự báo
Trong hình 4.4 cho chúng ta thấy rằng, nếu chỉ cĩ 5 AP thì thuật tốn định vị đưa ra dự báo khoảng cách sai số trung bình 1.04m. Nếu chúng ta tăng lên 10 AP thì sai số trong dự báo sẽ giảm xuống cịn 0.81m. Đối với trường hợp 15 AP thì sai số giảm xuống cịn 0.61 m.
1.17 1.04 0.91 0.89 0.81 0.73 0.65 0.61 0.58 0 0.2 0.4 0.6 0.8 1 1.2 0 2 4 6 8 10 12 14 16 Sai số k h o ản g các h ( m )
Số lượng Access Point
Độ lệch chuẩn = 2
Chúng ta cùng tiếp tục kiểm tra giả định 2 trong trường hợp sĩng vơ tuyến phát ra từ các AP cĩ độ lệch chuẩn là 4 (sĩng phát ra khơng ổn định).
Hình 4.5: Mối quan hệ giữa số lượng AP và sai số khoảng cách trong dự báo(độ lệch chuẩn = 4)
Trong biểu đồ 4.5, chúng ta thấy rằng số lượng AP càng nhiều lại khiến cho sai số dự báo càng lớn. Điều này là do trong thực tế, số lượng AP khơng quan trọng bằng sự ổn định của các AP. Nếu chúng ta lắp thêm nhiều AP và sĩng vơ tuyến phát ra từ các AP này là ổn định (độ lệch chuẩn thấp) thì mới tăng độ chính xác của thuật tốn. Tuy nhiên nếu các AP được lắp thêm vào này cĩ sĩng khơng ổn định thì sẽ làm giảm độ chính xác của thuật tốn. Như vậy chúng ta cĩ thể kết luận rằng trong quá trình triển khai hệ thống định vị, số lượng AP là khơng quan trọng mà chính sự ổn định của các sĩng vơ tuyên phát ra từ các AP này mới ảnh hưởng nhiều đến tính chính xác của thuật tốn định vị.
1.52 1.36 1.2 1.79 1.66 1.53 2.03 1.83 1.63 1 1.2 1.4 1.6 1.8 2 2.2 2.4 0 2 4 6 8 10 12 14 16 Sai số k h o ản g các h ( m )
Số lượng Access Point
Độ lệch chuẩn = 4
Giả định 3: sai số khoảng cách trong dự báo sẽ giảm nếu sử dụng thơng tin vị trí trong quá khứ kết hợp với thuật tốn K-Maximum Likelihood Neighbor sẽ dự báo vị trí người dùng chính xác hơn.
Ngồi 2 phương án lọc nhiễu và tăng thêm số lượng AP, luận án này cịn nghiên cứu cải tiến thuật tốn định vị để giảm sai số khoảng cách, nâng cao sự
chính xác trong dự báo vị trí. Cụ thể trong luận án đã đề xuất thuật tốn K-Maximum Looklihood Constraint Tracking Neighbor, sử dụng thơng tin K vị
trí cĩ khả năng nhất trước đĩ như là một ràng buộc để xác định K vị trí cĩ khả năng nhất của người dùng ở hiện tại.
Để đánh giá thuật tốn này rõ hơn chúng ta xem xét hình 4.5 để thấy rõ các sai số khoảng cách đã giảm xuống như thế nào.
Hình 4.6: Sai số khoảng cách trong dự báo khoảng cách của
0.45 0.60 0.75 0.80 0.92 1.04 1.07 1.22 1.38 1.20 1.36 1.52 0.00 0.20 0.40 0.60 0.80 1.00 1.20 1.40 1.60 1.80 2.00 2.20 2.40 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 Sa i số kh oảng c ách (m ) Độ lệch chuẩn 1 2 3 4
thuật tốn K-Maximum Likelihood Constraint Tracking Neighbor
Hình 4.5 cho chúng ta thấy các kết quả sau:
Trong trường hợp độ lệch chuẩn RSS là 1 thì sai số trung bình trong dự báo vị trí người dùng là 0.6m. Thuật tốn gốc cĩ sai số trung bình là 0.71m.
Trong trường hợp độ lệch chuẩn RSS là 2 thì sai số trung bình trong dự báo vị trí người dùng là 0.92. Thuật tốn gốc cĩ sai số trung bình là 1.04 m.
Trong trường hợp độ lệch chuẩn RSS là 3 thì sai số trung bình trong dự báo vị trí người dùng là 1.22m. Thuật tốn gốc cĩ sai số trung bình là 1.36 m.
Trong trường hợp độ lệch chuẩn RSS là 4 thì sai số trung bình trong dự báo vị trí người dùng là 1.36m. Thuật tốn gốc cĩ sai số trung bình là 1.5m. Dựa vào kết quả khảo sát hình 4.3 và hình 4.5 chúng ta thấy rằng, đối với trường hợp độ lệch chuẩn của RSS là 2 thì thuật tốn K-Maximum Likelihood Constraint Tracking Neighbor cĩ sai số khoảng cách trong dự báo từ 1.04m, trong khi thuật tốn K-Maximum Likelihood Constraint Tracking Neighbor cĩ sai số là 0.92m. Đây là giải pháp cho hiệu suất dự báo chính xác nhất.
Như vậy, với sự cải tiến dựa vào thơng tin vị trí trước đĩ, thuật giải K-Maximum Likelihood Constraint Tracking Neighbor cũng đem lại một kết quả
khả quan, giảm sai số trong dự báo vị trí của người dùng.
Chương trình mơ phỏng đã giả lập ra 3 tình huống giả định và thử nghiệm thuật tốn định vị trên các giả định để khảo sát và đánh giá các kết quả đạt được