2. Ứng dụng công nghệ viễn thám và GI Sở trên thế giới
2.5. Đơn giản hóa dữ liệu không gian
Với một bản đồ có tỷ lệ nhất định, nhu cầu biểu diễn chi tiết các đối tượng là khác nhau tùy thuộc vào mục đích sử dụng và khai thác thông tin từ bản đồ đó. Hơn nữa, để thuận lợi cho việc xây dựng bản đồ ta cần giản lược hơn. Việc giản lược dữ liệu ở đây không làm ảnh hưởng tới số lượng đối tượng bản đồ mà chỉ làm đơn giản dữ liệu biểu diễn của từng đối tượng bản đồ đó, cụ thể là giảm bớt số lượng điểm biểu diễn đối tượng bản đồ. Việc giản lược dữ liệu đương nhiên sẽ ảnh hưởng đến độ chi tiết hay nói cách khác độ chính xác của bản đồ. Do đó mức độ giản lược cần được khảo sát và tính toán sao cho dung hòa được 2 yếu tố: dung lượng và sai số của bản đồ. Việc làm giảm số điểm biểu diễn bản đồ chỉ có ý nghĩa với các đối tượng bản đồ dạng polyline (đường cong) như các đối tượng đường phố, sông ngòi hay các đối tượng dạng polygone (vùng) như ranh giới quận huyện...các đối tượng dạng vùng thực chất được biểu diễn bởi một đường cong khép kín. Như vậy, việc đơn giản hóa bản đồ có thể coi như việc đơn giản hóa đường cong. Có nhiều thuật toán sử dụng cho việc đơn giản hóa đường cong như thuật toán Lang, thuật toán Reumann và Witkam, giải thuật Douglas-Peucker, thuật toán đơn giản hóa đường cong phân cấp Cromley...Trong đó, thuật toán Douglas-Peucker là một trong những thuật toán đơn giản đường cong tốt nhất.
Thuật toán Douglas-Peucker (1973). Thuật toán này được minh họa trong hình vẽ dưới đây:
Hình 2.4. Minh họa thuật toán Douglas-Peucker
Tư tưởng của thuật toán như sau: Giả sử có đường cong được tạo thành bởi tập hợp các điểm v1, v2,...v15 như hình vẽ trên. Kẻ một đường thẳng nối điểm đầu v1 và điểm cuối v15 làm đường thẳng cơ sở. Tính khoảng cách từ các điểm khác đến đường cơ sở, nếu điểm nào có khoảng cách nhỏ hơn một giá trị delta chọn trước thì sẽ loại bỏ điểm đó, điểm có khoảng cách lớn nhất lớn hơn delta sẽ được chọn làm điểm bẻ gãy, nối điểm bẻ gãy với 2 đầu mút v1 và v15 ta thu được 2 đường cơ sở mới, từ đó, lặp lại thuật toán cho 2 đường cơ sở mới này. Hình 2.4 minh họa điểm bẻ gãy ban đầu là điểm v10, điểm bẽ gãy tiếp theo là điểm v4 và v13...cuối cùng, thu được đường gấp khúc đơn giản hơn, bao gồm các điểm v1, v4, v6, v7, v10, v13, v14 và v15, như vậy đã loại bỏ được 7 điểm dư thừa. Đường cong mới là đường con ở hình 2.4d đơn giản hơn đường cong ban đầu ở hình 2.4a nhưng vẫn biểu diễn được dáng điệu của đường cong ban đầu này.