Khoảng cách giữa các đối tƣợng địa lý

Một phần của tài liệu Khai phá dữ liệu với hệ thông tin địa lý và ứng dụng (Trang 36 - 37)

- Kết hợp cả bốn trường hợp trên, tổng giá trị hoán chuyển O m bằng

2.6 Khoảng cách giữa các đối tƣợng địa lý

Phân cụm dữ liệu không gian đòi hỏi phải tính khoảng cách giữa các đối tượng địa lý. Đặc biệt cần xem xét các định nghĩa khoảng cách giữa 2 khu vực địa lý biểu diễn bằng 2 đa giác trên bản đồ. Câu hỏi là làm thế nào để tính toán khoảng cách giữa hai đối tượng đa giác mà ở đây là các đơn vị hành chính sao cho hiệu quả đối với mục đích phân cụm.

Trước hết có hai cách tiếp cận để tính khoảng cách giữa hai đa giác: sử dụng một điểm đại diện (ví dụ trọng tâm) thay cho cả đa giác và sử dụng đường gấp khúc biểu diễn biên đa giác. [1], [7], [11]

Sử dụng một điểm đại diện rõ ràng đơn giản hơn nhưng dễ thấy rằng nó có nhiều nhược điểm, có thể sinh ra phân cụm tồi. Khoảng cách giữa hai trọng tâm luôn lớn hơn khoảng cách tách biệt thực tế. Sự khác biệt chính là khoảng cách giữa hai trọng tâm tùy thuộc phần lớn vào các kích thước và hình dạng của đa giác, cung cấp một xấp xỉ "không đều". Các đối tượng đa giác có thể có kích thước diện tích và hình dạng thay đổi lớn. Ví dụ, một đơn vị hành chính cấp thành thị, thành phố có diện tích nhỏ hơn diện tích các đơn vị hành chính ở nông thôn và miền núi. Nếu hai điểm đại diện được dùng để tính khoảng cách sẽ cho kết quả chất lượng kém.

Một số cách tiếp cận sử dụng đường biên giới đa giác, tức là khai thác được đầy đủ hơn các thông tin về hình dạng, diện tích, … Dưới đây trình bày 3 phương pháp khác nhau:

Dựa trên tính toán chính xác khoảng cách tách giữa hai đối tượng đa giác lồi.

Sử dụng khoảng cách tối thiểu giữa các đỉnh để tính gần đúng khoảng cách tách biệt chính xác.

Phương pháp xấp xỉ bằng cách sử dụng khoảng cách tách giữa hình chữ nhật isothetic.

Một phần của tài liệu Khai phá dữ liệu với hệ thông tin địa lý và ứng dụng (Trang 36 - 37)

Tải bản đầy đủ (PDF)

(85 trang)