3.1.1 Kiến trúc
Định vị bằng phương pháp WLAN RSS Fingerprinting bao gồm 2 giai đoạn: giai đoạn huấn luyện (thu thập dữ liệu RSS) và giai đoạn hoạt động định vị. Trong giai đoạn huấn luyện, mục tiêu là xây dựng một cơ sở dữ liệu đào tạo thực nghiệm cho mỗi vị trí tham chiếu bằng cách lấy mẫu cường độ tín hiệu RSS từ một số Access Point. Sau đĩ, trong giai đoạn hoạt động định vị, người sử dụng thiết bị thoại di động sẽ gửi đến máy chủ định vị thơng tin về các giá trị RSS thu được của các AP tại thời điểm hiện tại và máy chủ sẽ thực hiện tính tốn vị trí của người đang sử dụng thiết bị di động dựa trên thuật tốn định vị và cơ sở dữ liệu sĩng vơ tuyến đã thu thập trong giai đoạn huấn luyện.
Kiến trúc cơ bản của một hệ thống WLAN Fingerprinting RSS được hiển thị trong hình 3.1. Trong giai đoạn huấn luyện, các mẫu RSS được đo đạc cẩn thận tại mỗi vị trí tham chiếu RP(i)(x,y) như là một vector
từ một số AP (n là số lượng Access Point bị ảnh hưởng và RP(i) là tham chiếu ID thứ i) để xây dựng một cơ sở dữ liệu huấn luyện RSS.
Các AP thường được đặt tại các vị trí cố định như các trạm cơ sở. Mỗi vị trí tham chiếu là một vị trí trong tịa nhà, và các tín hiệu RSS tại mỗi vị trí tham chiếu được ghi lại trong cơ sở dữ liệu huấn luyện.
Hình 3.1: Mơ hình hoạt động của phương pháp RSS Fingerprinting
Trong giai đoạn hoạt động định vị, một người sử dụng điện thoại di động đo lường các giá trị RSS của sĩng vơ tuyến phát ra từ các AP, tạo thành một vector
chứa các giá trị RSS tương ứng với các AP. Sau đĩ thơng tin vector vị trí này sẽ được gửi đến dịch vụ định vị của máy chủ, máy chủ này sẽ thực hiện tính tốn để so sánh với các mẫu vector RSS trong cơ sở dữ liệu huấn luyện bằng cách sử dụng một thuật tốn định vị, và cuối cùng là tính tốn các vị trí cĩ khả năng của một người sử dụng điện thoại di động đang đứng, sau đĩ chọn ra một vị trí phù hợp nhất. Vị trí người dùng … … AP(1) AP(2) AP(3) AP(n) Fingerprinting Data Base (?,?) Thuật tốn
Giai đoạn thu thập dữ liệu RSS
3.1.2 Mơ tả
Để triển khai hệ thống định vị sử dụng kỹ thuật WLAN RSS Fingerprinting cần sử dụng các thiết bị sau:
Các thiết bị Access Point để triển khai mạng WLAN.
Các thiết bị di động của người sử dụng.
Một máy chủ IPS server để lưu trữ cơ sở dữ liệu huấn luyện và xử lý tín hiệu RSS từ thiết bị di động gửi tới để xác định vị trí của người dùng Trong giai đoạn thu thập dữ liệu, các AP sẽ được gắn cố định tại các vị trí thích hợp, ít bị di chuyển. Sau khi xác định các vị trí tham chiếu trong tịa nhà bằng cách chia sàn nhà thành các ơ lưới, người dùng sẽ cầm thiết bị di động trong tay và di chuyển theo các vị trí tham chiếu và thu thập RSS của các AP tại mỗi điểm tham chiếu. Thơng tin vị trí của các điểm tham chiếu cùng với các giá trị RSS tại mỗi vị trí tham chiếu sẽ được lưu vào cơ sở dữ liệu huấn luyện để phục vụ cho giai đoạn định vị. Cơ sở dữ liệu huấn luyện này được đặt tại máy chủ IPS server.
Trong giai đoạn định vị, người dùng cầm thiết bị di động cĩ kết nối vào mạng WLAN và truy cập dịch vụ định vị của máy chủ IPS server. Khi người dùng di chuyển qua các vị trí trong tịa nhà, thiết bị di động sẽ tự động thu thập RSS của các AP tại thời điểm hiện tại và gửi các thơng tin này tới máy chủ IPS server. Sau khi máy chủ IPS server nhận được thơng tin RSS của thiết bị di động gửi lên, và sử dụng các thuật tốn định vị để so sánh chúng với các giá trị RSS trong cơ sở dữ liệu huấn luyện và phản hồi cho người dùng biết vị trí của họ trong tịa nhà.
3.2 Các giai đoạn chính trong kiến trúc của RSS Wlan Fingerprinting
Trong phần 3.1.1 và 3.1.2 đã nêu khái quát về kiến trúc của một hệ thống định vị trong các tịa nhà dựa trên mơ hình WLAN RSS Fingerprinting, trong phần này luận văn sẽ trình bày chi tiết giải pháp thu thập và xử lý tín hiệu sĩng vơ tuyến thành thơng tin vị trí. Như chúng ta đã biết để thực hiện phương pháp Fingerprinting gồm 2 giai đoạn chính:
Giai đoạn huấn luyện
Giai đoạn hoạt động định vị
3.2.1 Giai đoạn huấn luyện
Trong giai đoạn huấn luyện cần thực hiện 3 cơng việc:
Đo đạc và lưu trữ các giá trị tín hiệu sĩng RSS của các AP trong tịa nhà.
Phân tích và lọc nhiễu các giá trị RSS đã thu thập.
Xây dựng cơ sở dữ liệu Fingerprinting hay gọi là bản đồ sĩng vơ tuyến Chi tiết các bước thực hiện trong giai đoạn huấn luyện được mơ tả trong hình 3.2.
Hình 3.2: Lưu đồ xây dựng cơ sở dữ liệu bản đồ sĩng Fingerprinting
Thu thập thơng tin vị trí của mỗi điểm lưới Chia sàn nhà thành các điểm lưới
RSS của AP1 RSS của AP2 ……… RSS của APn
Ứng Dụng Thu Thập RSS
Dữ liệu thơ
Bộ chuyển đổi dữ liệu Dữ liệu đã xĩa nhiễu
Cơ sở dữ liệu Fingerprinting Bộ lọc nhiễu
Quá trình đo đạc được tiến hành qua các bước như sau: 1. Aùp hệ trục tọa độ Oxy vào khu vực tịa nhà. 2. Đặt các AP vào các vị trí cố định trong tịa nhà
3. Chia khu vực thành các ơ lưới, mỗi vị trí trên ơ lưới ứng với một vị trí tham chiếu.
4. Lưu trữ thơng tin vị trí của các điểm tham chiếu đã sử dụng để đo đạc RSS từ các AP
5. Tại mỗi vị trí tham chiếu, sử dụng thiết bị di động để đo và thu thập các chỉ số RSS của các AP.
Hình 3.3: Minh họa quá trình đo đạc RSS
Quá trình lọc nhiễu dữ liệu RSS được tiến hành qua các bước sau:
Dựa vào đặc tính của sĩng vơ tuyến và khảo sát sự biến đổi của RSS tại vị trí tham chiếu để tìm ra quy luật phân phối giá trị RSS của AP
Sau khi xác định được quy luật phân phối RSS sẽ đưa ra phương pháp lọc nhiễu phù hợp
Hình 3.4: Biểu đồ thực nghiệm minh họa sự phân phối giá trị RSS của một AP tại vị trí tham chiếu
Quan sát hình 3.4 chúng ta cĩ thể thấy rằng giá trị RSS biến đổi theo thời gian, các giá trị RSS khơng nằm trên đường thẳng mà tăng giảm liên tục, tuy nhiên theo như nghiên cứu của tài liệu [24], các giá trị phân phối theo một quy luật phân phối chuẩn. Tuy nhiên cĩ một số ít giá trị RSS vượt ra khỏi quy luật phân phối chuẩn, ta gọi đĩ là giá trị RSS bị nhiễu. Tình trạng nhiễu cĩ thể xảy ra khi cĩ sự cố là một vật thể chắn ngang qua thiết bị AP khiến cho giá trị RSS bị giảm bất thường, hoặc một số trường hợp do mơi trường tác động đến sĩng vơ tuyến cũng khiến giá trị RSS bị nhiễu. Do đĩ, quá trình lọc nhiễu sẽ loại bỏ đi những giá trị RSS này. -66 -64 -62 -60 -58 -56 -54 -52
Chúng ta hãy cùng quan sát hình 3.5, đây là biểu đồ thể hiện lại tần số phân bố các giá trị RSS của hình 3.4 để thấy rõ hơn quy luật phân phối chuẩn trong sự phân bố của RSS.
Hình 3.5: Biểu đồ thực nghiệm minh họa sự phân bố theo phân phối chuẩn của các giá trị RSS
Về hình dạng, chúng ta dễ dàng nhận thấy rằng sự phân bố các giá trị RSS tại vị trí tham chiếu cĩ hình dạnh như một hình chuơng. Các phân phối cĩ hình dạng này gọi là “Normal Distribution” hay cịn gọi là phân phối chuẩn. Luật phân phối này phù hợp với các hiện tượng tự nhiên. Thật vậy, hầu hết các hiện tượng sinh học tự nhiên (như chiều cao, trọng lượng cơ thể, huyết áp, mật độ xương, v.v…) đều cĩ thể mơ tả bằng luật phân phối chuẩn một cách chính xác. Chính vì thế mà luật phân phối chuẩn được ứng dụng rộng rãi trong khoa học thực nghiệm.
Phân phơi xác suat cua RSSI
Histogram Normal Rssi (dbm) -57 -58 -59 -60 -61 -62 -63 -64 -65 X ác S uâ t 0.56 0.52 0.48 0.44 0.4 0.36 0.32 0.28 0.24 0.2 0.16 0.12 0.08 0.04 0
Để hiểu rõ hơn về phân phối chuẩn, chúng ta tìm hiểu hàm mật độ phân phối chuẩn:
Hàm mật độ phân phối chuẩn (Normal Density Probability Function) cĩ dạng tổng quát như sau:
(3.1) Trong đĩ: trị số trung bình của tập RSS độ lệch chuẩn
: là biến ngẫu nhiên của giá trị RSS tại mỗi thời điểm thu được Muốn đổi hàm y=f(x) ra hàm chuẩn tắc y=f(z) ta đặt:
(3.2)
Chỉ số z bây giờ cĩ số trung bình là = 0 và độ lệch chuẩn là = 1. Nếu thay (3.11) vào (3.10), chúng ta cĩ một hàm số mới và đơn giản hơn như sau:
(3.3)
Tiếp theo chúng ta sẽ khảo sát biểu đồ của hàm phân phối chuẩn được chuẩn hĩa để hiểu được các khái niệm về khoảng tin cậy, thế nào là khoảng tin cậy 90%, thế nào là khoảng tin cậy 95%, thế nào là khoảng tin cậy 99%.
Hình 3.6: Biểu đồ hàm phân phối chuẩn tắc (Nguồn[2])
Khảo sát biểu đồ trên chúng ta cĩ những kết luận sau:
Xác suất mà z <= -1.96 là 0.025 (tức 2.5%). Nĩi cách khác, diện tích dưới đường biểu diễn tính từ z = -1.96 hay thấp hơn là 0.025.
Bởi vì phân phối chuẩn cân đối , chúng ta cũng cĩ thể nĩi rằng xác suất mà z >=1.96 cũng bằng 0.025.
Như vậy, xác suất mà z nằm trong khoảng -1.96 và 1.96 là 1–0.025–0.025 = 0.95 (hay 95%). Nĩi cách khác, khoảng tin cậy 95% của z là -1.96 đến 1.96.
Tương tự, chúng ta cũng cĩ thể phát biểu rằng xác suất mà z nằm trong khoảng -1.645 đến 1.645 là 90%. Xác suất mà z nằm trong khoảng -2.576 đến 2.576 là 99%. Xác suất mà z nằm trong khoảng -3.09 đến 3.09 là 99.9%.
Sau khi thu thập và phân tích giá trị RSS đo được tại vị trí tham chiếu, chúng ta tiến hành lọc nhiễu để loại bớt các giá trị RSS bất thường.
Một vấn đề mà chúng ta hay thấy là ước tính khoảng tin cậy 95% (thuật ngữ tiếng Anh là 95% confidence interval hay cĩ khi cịn viết là 95% confidence limit, hoặc 95% credible interval).
Để lọc nhiễu dữ liệu ta sử dụng kiến thức về phân phối chuẩn và khoảng tin cậy 95% trong phân phối chuẩn.
Hai thơng số quan trọng trong một phân phối là giá trị trung tâm hay gọi là trung bình µ và phương sai (hoặc độ lệch chuẩn ) và thường biểu thị bằng X ~ N, (µ, ) với N viết tắt của từ normal.
Nếu phân phối chuẩn được chuẩn hĩa với trung bình µ=0 và độ lệch chuẩn
được viết tắt là: Z ~ N (µ=0, ) được gọi là phân phối chuẩn chuẩn hĩa (Standardized Normal Distribution)
Nếu giá trị của RSS tại một vị trí tham chiếu nằm ngồi khoảng tin cậy 95% thì chúng ta cĩ thể phát biểu rằng giá trị RSS này “bất bình thường” hay “nhiễu”.
Để ước tính khoảng tin cậy 95% (KTC95%), chúng ta chú ý mối liên hệ giữa x và trong cơng thức (3.2).
Vì , do đĩ: (3.4)
Như đề cập trong phần trên, 95% giá trị của nằm trong khoảng -1.96 đến +1.96, cho nên chúng ta cũng cĩ thể nĩi rằng 95% giá trị của x nằm trong khoảng và . Hay nĩi ngắn gọn, 95% các giá trị x nằm trong khoảng:
Thuật Tốn Lọc Nhiễu:
Ta sẽ dựa vào (3.5) để xây dựng thuật tốn lọc nhiễu RSS với ý tưởng như sau: nếu giá trị hoặc thì đây là các giá trị nhiễu.
Với là giá trị trung bình của tập RSS tại mỗi vị trí tham chiếu và là độ lệch chuẩn.
Để thực hiện ý tưởng lọc nhiễu trên, ta thực hiện các bước sau:
1. Tìm mean của tập RSS tại vị trí tham chiếu 2. Với mỗi x trong tập RSS, tính độ lệch (deviation) của nĩ so với mean
bằng phép tính (x - mean)
3. Tính bình phương của các giá trị thu được ở bước 2.
4. Tìm mean của các bình phương độ lệch tìm được ở bước 3. Giá trị này được biết đến như là phương sai .
5. Tính căn bậc hai của phương sai ta được kết quả cần tìm là .
6. Sau khi tính được và ta áp dụng cơng thức (3.5) để xác định các giá trị RSS nhiễu
Sau đây là vài cơng thức mơ tả cho các bước trên
(3.6)
Cài đặt thuật tốn lọc nhiễu:
Algorithm 1 RSS Noise Filter Algorithm 1. Sum 0
2. N Count(tập RSS) 3. SumOfDeviation 0
4. for each RSS trong tập RSS đo được tại vị trí tham chiếu do
5. Sum Sum + RSS 6. Sum / N
7. for each RSS trong tập RSS đo được tại vị trí tham chiếu do
8. SumOfDeviaton SumOfDeviation + 9.
10. for each RSS trong tập RSS đo được tại vị trí tham chiếu do
11. if or then
12. Xĩa giá trị RSS nhiễu ra khỏi dữ liệu
Sau khi đã lọc nhiễu cho các dữ liệu RSS đo được tại các vị trí tham chiếu, cơng việc tiếp theo trong giai đoạn huấn luyện là xây dựng cơ sở dữ liệu huấn luyện để lưu trữ bản đồ sĩng vơ tuyến Fingerprinting.
3.2.2 Giai đoạn hoạt động định vị
Trong giai đoạn hoạt động định vị này, chúng ta sử dụng các thuật tốn định vị để xử lý các tín hiệu sĩng vơ tuyến của các AP do các thiết bị di động như laptop hay điện thoại di động thơng minh thu được tại thời điểm hiện tại để ước tính vị trí của người đang sử dụng thiết bị dị động. Chúng ta cĩ thể thấy rõ hơn về mơ hình xử lý trong giai đoạn này qua lưu đồ dự đốn vị trí hình 3.7:
Hình 3.7: Lưu đồ minh họa quá trình dự đốn thơng tin vị trí
Dựa trên lưu đồ 3.7 ta thấy rằng, quá trình định vị trong giai đoạn này dựa trên các giá trị RSS thu thập tại vị trí hiện tại của người đang sử dụng thiết bị di động. Trong trường hợp trên, bộ giá trị RSS thu thập được gồm n giá trị RSS của các AP tương ứng. Các thơng tin RSS của các AP này sẽ được sử dụng để so sánh với các dữ liệu RSS trong cơ sở dữ liệu Fingerprinting mà chúng ta đã xây dựng trong giai đoạn huấn luyện. Các thuật tốn định vị sẽ làm cơng việc so sánh, tính tốn để tìm ra thơng tin vị trí thích hợp nhất của người dùng đang sử dụng thiết bị di động.
3.3 Các thuật tốn định vị trong nhà
Trong các loại thuật tốn định vị trong nhà sử dụng cho kỹ thuật RSS Wlan Fingerprinting đã trình bày trong mục 2.5, thuật tốn dựa trên Neural Network và Support Vector Machine rất phức tạp, khơng hiệu quả đối với ứng dụng cĩ tính thời gian thực như hệ thống định vị trong nhà. Vì vậy phần này của luận văn nghiên cứu chi tiết các thuật tốn định vị cơ bản cĩ tính khả thi hơn, đĩ là thuật tốn Nearest Neighbor, K-Nearest Neighbor và K-Maximum Likelihood Neighbor và từ đĩ đề xuất một thuật tốn định vị cải tiến K-Maximum Likelihood Constraint Tracking Neighbor.
RSS của AP1 RSS của AP2 …… RSS của APn
Các thuật tốn định vị trong nhà
Thơng tin vị trí
3.3.1 Thuật tốn Nearest Neighbor
Thuật tốn định vị này dựa trên kiến thức về khoảng cách Euclide để tính khoảng cách từ vector RSS Fingerprinting ở thời điểm hiện tại và các vector
Fingerprinting của các vị trí tham chiếu đã lưu trữ trong cơ sở dữ liệu huấn luyện. Sau đĩ chọn ra vị trí tham chiếu cĩ khoảng cách Euclide ngắn nhất so với vector RSS Fingerprinting hiện tại để xác định vị trí của người dùng. Khoảng cách Euclide được xác định như sau:
(3.17) Cài đặt thuật tốn
Algorithm 2 Nearest Neighbor Algorithm 1. số lượng AP
2. 0 3.
4. Location null
5. for each vị trí trong tập các vị trí tham chiếu do
6. for each giá trị thuộc vector trung bình tại vị trí
( 7. + 8. if then 9. EuDis 10. Location