6.2 Phương pháp giải bài toán
6.2.3 Áp dụng K-SOM để tìm độ tương quan của một BĐS so với các BĐS khác
khác
Trên giao diện đã hiện thực, khi ta chọn một BĐS làm tâm, những điểm tương quan với BĐS đã chọn sẽ có mức độ biểu hiện dựa trên màu sắc. Độ tương quan sẽ giảm dần từ màu xanh dương sang màu xanh lá. Vì giá trịdistance(n1,n2) có giá trị lớn hơn nhiều so với postreet(n1,n2) nên khi dùng KSOM với công thức trên thì hầu hết các BDS đều rơi vào một nhóm. Do các BDS đều cùng 1 nhóm nên việc tính mức độ tương đồng giữa các BDS với nhau dựa vào KSOM trở nên bất khả thi. Do đó, để xây dựng bản đồ K-SOM, cần áp dụng thêm giải thuật di truyền để điều chỉnh các trọng số hợp lý hơn so với thực tế.
Hình dưới đây là các điểm BDS với màu dựa trên các cluster trên KSOM (đều có màu xanh bởi vì đều chung 1 cluster.
Hình 6.4:Các điểm BDS với màu dựa trên các cluster trên KSOM (đều có màu xanh bởi vì đềuchung 1 cluster. chung 1 cluster.
6.2.4 Sử dụng Giải Thuật di truyền cho công thức khoảng cách luận lý của mạng K-SOM
6.2.4.1 Tìm hệ số của cơng thức luận lý trong K-SOM
Công thức khoảng cách tổng quát cho 2 nút n1,n2 trong tập BĐS:
distance(n1,n2) =α+β∗ postreet(n1,n2) +γ∗ latlong(n1,n2) +δ∗ latlongdistrict(n1,n2) (6.1)
• distance(n1,n2): là hàm khoảng cách luận lý (logic).
• postreet(n1,n2) =|pos(n1.position_street)−pos(n2.position_street)|: là độ chênh lệch giữa loại nhà (mặt tiền, hẻm,...).
• latlong(n1,n2): là khoảng cách địa lý giữa hai căn nhà.
• latlongdistrict(n1,n2): là khoảng cách giữa hai quận của hai căn nhà này. Khoảng cách hai quận được tính bằng khoảng cách địa lý giữa hai tâm của quận.
• α,β,γ,δ: là các tham số cho hàm này.
• Vì có sử dụng hàm posnên ta cũng phải xem 6 tham sốχivới i =1..6 là các tham số của hàm cùng vớiα,β,γ,δ.
6.2.4.2 Phương pháp sử dụng GA
• Bước 1: Sau khi áp dụng K-SOM để tìm độ tương quan của một BĐS so với các BĐS khác ở bước trước, ta lưu lại kết quả dưới dạng file excel để nhờ một chuyên gia trong lĩnh vực gán nhãn.
• Bước 2: Sử dụng dữ liệu trên để chạy giải thuật di truyền, tìm hệ số cho cơng thức khoảng cách.
• Bước 3: Chạy lại K-SOM sử dụng công thức khoảng cách với những hệ số mới. Kết quả:
Các hệ số trên được học từ GA và có giá trị phù hợp với các BDS mà chuyên gia đã label.
Hình 6.6:Kết quả chạy GA cho cơng thức khoảng cách
Với trung bình độ chênh lệch giữa cơng thức đã dùng GA và chuyên gia đã label chỉ là 1.0 nên kết quả chấp nhận được.
Khi dùng KSOM sau khi đã học các hệ số trên từ GA cho kết quả: với map KSOM 100x100 thì 7000 BDS phân bố đều vào 2756 clusters (thay vì lệch vào duy nhất 1 cluster).
Với kết quả trên thì người dùng sẽ dễ dàng so sánh độ tương quan giữa bất kỳ các BDS với nhau dựa trên map KSOM.
Hình dưới đây là các điểm BDS với màu dựa trên các cluster trên KSOM (màu từ đỏ sang xanh lá):
Hình 6.7:Kết quả chạy GA cho cơng thức khoảng cách