b) Kỹthuật định vị TDOA (Time Difference of Arrival) [3]
2.3.3. Kỹthuật định vị K-Nearest Neighbor
Thuật toán láng giềng gần nhất (K-Nearest Neighbor) là một phương pháp xác định sử dụng vector trung bình của các mẫu RSS từ các cơ sở dữ liệu Fingerprinting để ước tính vị trí của người sử dụng. Đầu tiên xem xét các khoảng cách Euclide giữa vector RSS thu thập tại thời điểm hiện tại và vector RSS trung
bình tại các vị trí tham chiếu đã lưu trữ trong cơ sở dữ liệu Fingerpringting để chọn ra K láng giềng gần nhất.
Vector RSS trung bình là vector trung tâm đại diện cho tập các vector Fingerprinting tại mỗi vị trí tham chiếu. Thuật toán phân hoạch Nearest Neighbor sẽ chọn những vị trí tham chiếu có mẫu vector RSS trung bình gần nhất so với vector RSS được thu thập ở hiện tại để đưa ra ước lượng về vị trí của người sử dụng.
Giả sử rằng tập Fingerprinting của lvị trí được ký hiệu {𝐹1, 𝐹2 … . , 𝐹𝑙}
tương ứng với tập vị t rí tham chiếu {𝐿1, 𝐿2 … . , 𝐿𝑙}. Một mẫu RSS Fingerprinting được đo ở hiện tại được ký hiệu là S.
Giả sử rằng hệ thống định vị trong nhà xem RSS trung bình của n số lượng AP như là một dấu hiệu Fingerprinting của vị trí tham chiếu, mẫu vector RSS là
𝑆 = (𝑠1, 𝑠2, … 𝑠𝑛)𝑇 và mỗi vị trí tham chiếu i trong cơ sở dữ liệu được ký hiệu
như sau 𝐹𝑖 = (𝑝1𝑖, 𝑝2𝑖, … , 𝑝𝑛𝑖)𝑇
Để xác định vị trí hiện tại của người dùng, chúng ta đo khoảng cách từ vector RSS Fingerprinting tại thời điểm hiện tại tới các RSS trung bình của các vị trí tham chiếu đã lưu trong cơ sở dữ liệu huấn luyện. Để đo khoảng cách giữ 2 vector chúng ta sử dụng kiến thức về khoảng cách Euclide.
Việc xác định khoảng cách Euclide là một sự lựa chọn đơn giản cho RSS Fingerprinting để đo khoảng cách giữa một giá trị vector RSS hiện tại và vector RSS tring bình tại mỗi vị trí tham chiếu trong cơ sở dữ liệu Fingerprinting.
Khoảng cách Euclide được tính bằng công thức sau:
Trong công thức trên n là số lượng Aps bị ảnh hưởng, RSS là cường độ tín hiệu của AP thức i nhận được trong giai đoạn trực tuyến và 𝑅𝑆𝑆̅̅̅̅̅̅𝑖 là giá trị RSS trung bình của một vị trí tham chiếu trong cơ sở dữ liệu huấn luyện. Vị trí của
xung quanh với các khoảng cách Euclide tối thiểu. Giá trị của K có thể ảnh hưởng đến tính chính xác kết quả và nếu K=1 thì đây là thuật toán tính toán láng giềng gần nhất.
Mặc dù tính toán đơn giản nhưng nếu gia tăng số lượng các yếu tố trong mô hình (số lượng tín hiệu của điểm truy cập n) và số lượng các vị trí và một môi trường trong nhà phức tạp sự biến đổi (khoảng cách Euclide) của RSS đo tại mỗi vị trí tham chiếu có thể là rất lớn. Vì vậy việc xác định vị trí bằng quy tắc Bayes được đề xuất để đạt được một ước lượng chính xác hơn