CHƯƠNG II: GIỚI THIỆU KỸ THUẬT MDS, MDS SVM
2.1.3 Cấu trúc kỹ thuật Ordinal MDS (MDS chỉ số)
Bảng 2: Thứ tự khoảng cách của bảng 1, khoảng cách nhỏ nhất là 1. Sử dụng Ruler-and-Compass cho phương pháp Ordinal MDS:
Hình 2.9: Không gian của tất cả điểm 9 với d39 < d29.Hình 2.10: Không gian các điểm với điều kiện d29 < d23 và d39 < d23. Bước đầu tiên của ordinal MDS vẫn giống các bước của Ratio MDS và kết quả
trả về cũng là khoảng cách trong không gian MDS. Tuy nhiên trong Ordianl MDS chỉ yêu cầu thứ tự của dữ liệu được thể hiện đúng theo việc sắp xếp khoảng cách của các đối tượng. Các khoảng cách của các đối tượng được sắp xếp theo thứ tự giống như bảng trên. Ở đây chúng ta bắt đầu chọn một cặp thành phố được xem như là hai điểm dầu tiên được thiết lập. Nếu thành phố 2 và 3 được chọn trước, chúng ta có thể sử dụng hình 2.1 để thiết lập, giả sử rằng chúng ta muốn thêm điểm 9 vào cấu hình, thì vị trí của 9 sẽ được định vị như thế nào so với 2 và 3.
Theo khoảng cách trong bảng 2 thì điểm 9 phải gần 3 hơn 2, bởi vì khoảng cách d39 nhỏ hơn d29. Theo bảng 2 thì d39 = 36 và d29 = 41, Khoảng cách trong cấu hình dữ liệu MDS được sắp xếp chỉ khi nếu d39 < d29. Do đó mặt phẳng hình 2.9 sẽ chia đoạn 2 và 3 thành hai vùng theo phương vuông góc giữa với đoạn thẳng thông qua khu vực có hình bóng mờ. Như vậy điểm 9 phải nằm dưới đoạn thằng phần bóng mờ vì nếu d39 < d29. Chúng ta gọi những điểm thuộc đường này là các giải pháp thiết lập hoặc không gian giải pháp cho vấn đề thiết lập vị trí điểm 9, ví dụ 9, 9’hoặc 9’’ có thể được chọn như điểm 9.
Hình 2.11: các vị trí chọn điểm 9. Hình 2.12: vị trí chọn điểm 5.
Hình 2.13: Không tìm thấy vị trí. điểm 10.
d23=45, do vậy điểm 9 phải được đặt trong một vòng tròn xung quanh điểm 2 có bán
kính nhỏ hơn so với d23 (được thể hiện hình 2.10).
Tiếp tục ta xem xét điều kiện của 9: d39 < d29 và d29 < d23 thì điểm 9 sẽ được
nằm trong vùng của hình 2.11. Như vậy sẽ có rất nhiều vị trí trong hình 2.11 để chọn
vị trí điểm 9. Bây giờ ta xét thêm điểm 5 vào thì ta có các điều kiện như sau: d25 < d29,
d35 < d39, d59 < d35, d59 < d25, d35 < d25. Với các điều kiện trên ta sẽ xác định được khu vực mà vị trí 5 xuất hiện.
Hình 2.14: Khoảng cách của các điểm màu trong không gian MDS.
Vấn đề có thể xảy ra trong giải pháp không gian MDS là rỗng ”empty” hay không xác định được vị trí.
Ví dụ như ta chọn vị trí cho 9 bị sai lệch (chọn 9”), thì khi ta chọn điểm tiếp theo như điểm 10, với các điều kiện từ bảng 2 kèm theo ta thấy. Ta cố gắng thêm điểm
10 vào cấu hình với các điểm {2, 3, 9”} với điều kiện d3,10 < d9”,10 và 10 phải gần 2 hơn
9”. Tuy nhiên ta không thể nào xác định cũng như tìm ra vị trí của điểm 10. Vậy nên có hiện tượng không tìm ra không gian của vị trí các điểm “empty”.
Mô hình MDS và độ đo:
Mục tiêu của kỹ thuật MDS là tìm kiếm một cấu hình không gian mới khi biết độ đo khoảng cách của các đối tượng với nhau và không gian đó có thể là tương đồng hoặc bất tương đồng với khoảng cách đo hiện tại. Một cấu hình không gian trong MDS sẽ cung cấp cho ta cái nhìn sâu sắc về việc tính toán những khoảng nhỏ bị kích thích thay đổi, những khoảng nhỏ bị thay đổi khi kích thước có khả năng chưa biết. Kết quả của dữ liệu ban đầu là khoảng cách của các đối tượng và MDS tính bằng một chương trình máy tính.
Classical MDS: [5]
Xem xét các vấn đề sau đây: nhìn vào một bản đồ hiển thị một số thành phố, một trong những quan tâm là khoảng cách giữa chúng. Những khoảng cách có thể dễ dàng thu được bằng cách đo chúng bằng cách sử dụng một dụng cụ đo đạt. Bên cạnh đó, một công thức toán học có sẵn: biết tọa độ x và y, khoảng cách Euclide giữa hai thành phố a và b được định nghĩa bởi:
dab =
Bây giờ xem xét bài toán ngược: chỉ có khoảng cách, là nó có thể để có được bản đồ? Classical MDS được giới thiệu đầu tiên bởi Torgerson (1952), để giải quyết vấn đề này ông giả định khoảng cách là Euclide. Khoảng cách Euclide thường là sự lựa chọn tiên cho một không gian MDS. Tuy nhiên có những khoảng cách không phải là Euclide, trong nhiều ứng dụng của MDS khoảng cách của dữ liệu không phải dựa vào khoảng cách trên bảng đồ mà là dữ liệu khoảng cách thật giữa các đối tượng. khi áp dụng Classical MDS để tính khoảng cách, giả sử rằng khoảng cách giữa các đối tượng cũng tương tự như khoảng cách đo thực tế. Điều này có thể làm cho dữ liệu chuyển sang một ma trận tương ứng. Ưu điểm của Classical MDS là nó cung cấp một giải pháp phân tích, không đòi hỏi thủ tục lặp đi lặp lại.
Các bước thực hiện của thuật toán Classical MDS:
Thuật toán Classical MDS sử dụng để tìm kiếm một ma trận tọa độ X, ma trận
này được lấy từ các giá trị riêng từ ma trận vô hướng B=XX’.
Vấn đề xây dựng ma trận B từ ma trận khoảng cách P được tính toán bởi nhân
bình phương ma trận khoảng cách với ma trận J=I-n-111’. Thủ tục này được gọi là
double centering. Các bước sau đây tóm tắt các thuật toán cổ điển MDS:
1. Thiết lập bình phương ma trận khoảng cách P(2) = [p2] .
2. Áp dụng công thức double centering: sử dụng ma trận J=I-n-111’, với n là số đối tượng, 1 là cột vector với n số 1(11’ là ma trận vuông với n*n số 1).
3. Trích xuất m giá trị lớn nhất có giá trị riêng λ1….λm của B và tương ứng với m vector riêng e1…..em.
4. Một không gian m chiều được thiết lập của n đối tượng, tọa độ không gian mới là tọa độ của ma trận tọa độ , với Em là ma trận của m vector riêng và ᴧm là ma trận đường chéo của m giá trị riêng của B tương ứng.
Ví dụ: Khoảng cách các thành phố ở Đan Mạch
Để minh họa cho MDS cổ điển, giả định rằng chúng tôi đã đo được khoảng cách giữa K_benhavn (cph), _Arhus (aar), Odense (ode) và Aalborg (aal) trên bảng đồ. Do đó, ma trận khoảng cách (hiển thị các khoảng cách tính bằng mm) có thể xem như sau:
cph aar ode aal
cph 0 93 82 133
aar 93 0 52 60
ode 82 52 0 111
Aal 133 60 111 0
Bảng 3: Khoảng cách giữa các thành phố Đan Mạch. Ma trận bình phương khoảng cách là:
P(2) =
Vì có n = 4 đối tượng, ma trận J được tính bằng J =-0.25 x
=
Áp dụng: J cho P(2) ta được ma trận B B= -1/2JP(2)J =
Bốn thành phố được biểu diễn trong không gian hai chiều, ta chọn hai giá trị riêng lớn nhất và vector riêng tương ứng được tính từ B ta được như sau:
λ1 = 9724.168, λ2 = 3160.986, e1 = , e2 =
Cuối cùng tọa độ của các thành phố ta tính được bằng cách nhân vector riêng và giá trị riêng ta được:
X = =
Sau khi tính được các tọa độ của các thành phố, ta sử dụng các tọa độ này để xác định vị trí các thành phố trên bản đồ.
Hình 2.15: Hiển thị các thành phố trên bản đồ. MDS.