Các phƣơng pháp khái quát hóa có thể đƣợc xây dựng xuất phát từ các quan điểm và điều kiện khái quát hóa khác nhau:
- Quan điểm/chiến lược hướng quá trình
Khái quát hóa là quá trình thành lập bản đồ phù hợp với tỷ lệ, chủ đề và mục đích sử dụng từ cơ sở dữ liệu chi tiết duy nhất. Do tính chất phức tạp của vấn đề, hiện chƣa có giải pháp trọn vẹn cho chiến lƣợc này.
- Quan điểm/chiến lược hướng thể hiện
Cách tiếp cận khác hẳn hƣớng đến phát triển các cơ sở dữ liệu đa tỷ lệ (multi scale, multi resolution) bao gồm các bản đồ nhiều tỷ lệ khác nhau là các hình ảnh với mức độ chi tiết khác nhau của thế giới thực cùng đƣợc lƣu trữ trong cơ sở dữ liệu. Chiến lƣợc này loại trừ đƣợc các vấn đề của khái quát hóa trong biến đổi tỷ lệ, nhƣng lại phải đối mặt với các thách thức khác ví dụ nhƣ vấn đề hiệu chỉnh, cập nhật thay đổi mà không ảnh hƣởng đến tính thống nhất về dữ liệu giữa các tỷ lệ.
- Quan điểm/chiến lược hướng dẫn xuất
Chiến lƣợc mang tính trung gian. Tƣơng tự nhƣ chiến lƣợc hƣớng thể hiện, chiến lƣợc này hƣớng tới xây dựng cơ sở dữ liệu với nhiều mức độ chi tiết khác nhau, tuy nhiên chúng đƣợc dẫn xuất từ một cơ sở dữ liệu chi tiết ban đầu duy nhất và luôn đảm bảo tính đồng nhất. Dữ liệu ở các mức độ chi tiết khác nhau liên kết chặtchẽ tạo thành hệ thống thứ bậc.
Thế giới thực
Mô hình chính
Khái quát hóa đối tƣợng
Mô hình phụ Khái quát hóa
mô hình
Khái quát hóa bản đồ
Sản xuất bản đồ
41
2.7. Đánh giá chất lượng khái quát hóa bản đồ
Do khái quát hóa là một quá trình phức tạp với các hợp phần có tính trực giác cao, khó có thể kỳ vọng về bất kỳ một thủ tục đánh giá nào hoàn toàn khách quan. Tuy vẫn có những tiêu chuẩn có thể đƣợc đánh giá một cách khách quan nhƣ sự phá vỡ quan hệ hình học tôpô, nhƣng với những khía cạnh khác nhƣ tính rõ ràng, toàn diện của các hình ảnh trên bản đồ thì rất khó khăn để thể hiện một cách chính xác. Những đối tƣợng và các thành phần chủ quan của khái quát hóa có thể đƣợc thể hiện bởi các tiêu chuẩn đã đƣợc định lƣợng và định tính cụ thể. Thông thƣờng, các tiêu chuẩn định lƣợng gắn liền với tính chất và cách trình bày của đối tƣợng khái quát hóa, trong khi sự mô tả định tính thƣờng thu đƣợc những khía cạnh chủ quan. Cả các tiêu chuẩn định tính cũng nhƣ định lƣợng trƣớc hết đều phải cho phép so sánh đƣợc sự khác biệt giữa các phƣơng án khái quát hóa khác nhau để cân nhắc lựa chọn cách giải quyết tối ƣu và cho phép đánh giá và phân loại các giải pháp khác nhau một cách có cơ sở. Vấn đề còn lại là ở giai đoạn nào của quá trình đánh giá và ở phạm vi nào thì các tiêu chuẩn định lƣợng có thể trở thành nền tảng cho sự đánh giá định tính.
Các tiêu chuẩn định lƣợng có thể sử dụng để đánh giá/ƣớc lƣợng mức độ khái quát hóa, mức độ vi phạm hay tuân thủ các qui định kỹ thuật. Phân biệt các loại tiêu chuẩn định lƣợng sau:
Các tiêu chuẩn chung phản ánh mức độ khái quát hóa chung của toàn mảnh bản đồ hoặc khu vực đo. Các tiêu chuẩn chung gắn với mật độ đối tƣợng, tỷ lệ diện tích có ký hiệu và nền bản đồ...
Các tiêu chuẩn hình học chỉ ra các trƣờng hợp các kích thƣớc tối thiểu bị vi phạm nhƣ các đối tƣợng quá nhỏ, các đối tƣợng quá gần nhau, các phân đoạn quá ngắn …
Các tiêu chuẩn hình học tôpô đƣợc sử dụng để nhận biết ra sự vi phạm đối với những quan hệ hình học tôpô cần duy trì từ bản đồ gốc. Ví dụ những điểm cắt nhau của các đối tƣợng hình tuyến cũng nhƣ giao điểm giữa các đối tƣợng hình tuyến với nhau hoặc điểm giao của các đối tƣợng hình tuyến chồng lên các đối tƣợng khác và các mối quan hệ liền kề bị vi phạm khác.
2.8. Tình hình nghiên cứu trong và ngoài nước.
2.8.1. Tình hình nghiên cứu ứng dụng khái quát hóa tự động bản đồ ở các nước trên thế giới
Trong khoảng 30 năm trở lại đây đã có nhiều nỗ lực của các chuyên gia toán học, địa lý, bản đồ và công nghệ thông tin để phát triển các phƣơng pháp, giải thuật, công cụ khái quát hóa tự động. Các công cụ khái quát hóa(KQH) tự động trong thời kỳ đầu
42
đƣợc xây dựng chủ yếu nhằm mục đích giảm nhẹ lao động trong thành lập bản đồ bằng cách mô phỏng các thao tác khái quát hóa trong thành lập bản đồ truyền thống.
Để phân biệt mức độ tự động trong khái quát hóa các nhà bản đồ đƣa ra thuật ngữ Khái quát hóa hoàn toàn tự động (On -the-fly, Real - time) và Khái quát hóa trên màn hình (On-screen) hoặc tƣơng tác (interactive). Các vấn đề của khái quát hóa hoàn toàn tự động hiện chƣa đƣợc giải quyết trọn vẹn. Các phần mềm thƣơng mại thƣờng cung cấp các giải pháp KQH On screen đòi hỏi các mức độ can thiệp khác nhau của kỹ thuật viên trong quá trình KQH.
Hiện đang có hai xu hƣớng rõ rệt trong nghiên cứu khái quát hóa tự động. Trong khi khái quát hóa bản đồ (cartographic generalisation), còn gọi là khái quát hóa hình học, có mục đích chính là thành lập bản đồ, chú trọng nhiều hơn đến việc thể hiện các đối tƣợng theo các qui tắc của bản đồ học truyền thống thì các nghiên cứu về khái quát hóa mô hình (model generalisation, database generalisation) có mục đích tạo ra các gói, tập dữ liệu từ CSDL ban đầu.
Trƣớc đây các nghiên cứu về khái quát hóa tự động trƣớc đây tập trung vào xây dựng các giải thuật và công cụ dành cho khái quát hóa hình học, mô phỏng thao tác của kỹ thuật viên. Chẳng hạn, các giải thuật khái quát hóa các yếu tố hình tuyến độc lập nhƣ giải thuật làm trơn đƣờng Douglass-Peuker (1973) và giải thuật approximation của Li-Openshaw (1993) đã đƣợc áp dụng trong nhiều phần mềm thƣơng mại.
Có thể kể đến một số công trình nghiên cứu quan trọng, có nhiều ảnh hƣởng đối với các nghiên cứu lý thuyết và ứng dụng khái quát hóa tự động nhƣ McMaster và Shea - Generalization in Digital Catorgraphy (1992) trình bày một cách có hệ thống các vấn đề khái quát hóa đối với bản đồ số. GIS and Generalization: Methodology and Practice (Muller, Weibel và nnk, 1995) đề cập đến mối liên hệ giữa bản đồ và hệ thống thông tin địa lý, vai trò của khái quát hóa trong xây dựng và duy trì cơ sở dữ liệu.
Các trung tâm lớn về nghiên cứu khái quát hóa tự động có thể kể đến Đại học tổng hợp(ĐHTH) Edinburgh (UK) ĐHTH Zurich (Thụy Sỹ), ĐHTH Hannover (Đức) và các tổ chức bản đồ quốc gia của Pháp (IGN) , Anh (OS), Đức, Đan Mạch (KMS), Hà Lan, Nga .
Các công ty phát triển phần mềm liên quan đến khái quát hóa tự động quan trọng là ESRI, Intergraph (Mỹ), LaserScan(Anh) và và Sibgeoinform (Nga).
Các kết quả nghiên cứu trong lĩnh vực khái quát hóa tự động đã đƣợc các cơ quan đo đạc bản đồ quốc gia một số nƣớc phát triển áp dụng trong thực tế sản xuất. Chẳng hạn, Canada đã ứng dụng các công cụ khái quát hóa tự động tự phát triển cho thành lập Atlas Canada từ bản đồ tỷ lệ 1:1.000.000. Cơ quan bản đồ quốc gia Nga mới đây cũng tuyên bố phần mềm khái quát hóa sử dụng chuẩn dữ liệu địa hình của Nga đã đƣợc
43
đƣa vào sản xuất thành lập bản đồ địa hình tỷ lệ 1:1.000 - 1:200.000 từ bản đồ tỷ lệ 1:500.
2.8.2. Tình hình nghiên cứu ứng dụng khái quát hóa tự động bản đồ tại Việt Nam
Tại Việt Nam đã có một số nghiên cứu đánh giá các phần mềm khái quát hóa bản đồ hiện có trên thế giới, tình hình áp dụng tại các cơ quan đo đạc bản đồ trên thế giới, nghiên cứu qui trình khái quát hóa bản đồ thủ công , xác định khả năng tự động hóa, đề ra các nguyên tắc khái quát hóa với mục đích xây dựng qui trình ứng dụng các phần mềm nƣớc ngoài cho khái quát hóa thành lập bản đồ địa hình số của Việt Nam.
Ngoài ra các công cụ khái quát hóa có sẵn trong các phần mềm thƣơng mại thông dụng cũng đƣợc các cơ sở sản xuất và nghiên cứu quan tâm ứng dụng để giảm bớt chi phí và nâng cao chất lƣợng thành lập bản đồ số. Các công cụ này tƣơng đối ít, chủ yếu dành cho khái quát hóa các đối tƣợng độc lập, đòi hỏi sự can thiệp của kỹ thuật viên ở nhiều công đoạn. Việc khái quát hoá mạng lƣới, đặc biệt là mạng lƣới các đối tƣợng hình tuyến nhƣ giao thông, thuỷ hệ, các đƣờng cấu trúc địa hình ..., khi thể hiện các đặc điểm mật độ, phân bố, cấu trúc của toàn hệ thống hiện hoàn toàn dựa vào kinh nghiệm chuyên môn và quan điểm thẩm mỹ của ngƣời biên tập.
Trong số công trình nghiên cứu tƣơng đối sâu về khái quát hóa bản đồ có thể kể đến đề tài Nghiên cứu một số vấn đề về khái quát hóa bản đồ và ứng dụng trong các hệ thông tin địa lý (Đặng Văn Đức) tập trung vào các thuật toán khái quát hóa dữ liệu raster.
44
Chương 3: MỘT SỐ THUẬT TOÁN KHÁI QUÁT HÓA BẢN ĐỒ
Từ góc độ kỹ thuật, khái quát hoá bản đồ là một nhóm các biện pháp kỹ thuật nhằm rút gọn dữ liệu mà vẫn giữ đƣợc tất cả các thông tin cần thiết trên bản đồ. Ví dụ khi số lƣợng các điểm trên một đƣờng bị giảm đi, chỉ giữ lại là các điểm đƣợc chọn, kết quả là các đƣờng không bị thay đổi về hình dạng.
Các hoạt động đơn giản hoá chọn lựa các đặc điểm, miêu tả hình dạng, giữ lại các điểm hoặc sẽ loại bỏ điểm thừa, điểm không cần thiết, dựa trên các tiêu chuẩn hình học nhƣ khoảng cách giữa các điểm hoặc là sự dịch chuyển từ tâm đƣờng, các đặc trƣng của đƣờng đƣợc hiển thị. Kết quả các hoạt động đơn giản hoá làm giảm bớt số lƣợng các điểm nhận đƣợc từ nguồn dữ liệu ban đầu mà không thay đổi vị trí của điểm.
3.1. Toán tử lựa chọn đối tượng
Lựa chọn đối tƣợng tuy đơn giản nhƣng rất hiệu quả giúp ta có đƣợc khoảng trống trên bản đồ bằng cách bỏ bớt một số đối tƣợng không liên quan đến bản đồ đích. Trƣớc tiên cần trả lời các câu hỏi:
- Chọn bao nhiêu đối tƣợng? - Chọn đối tƣợng nào?
- Chọn đối tƣợng theo ràng buộc nào? Tổng số đối tƣợng chọn:
- Theo Topfer thì tổng số các đối tƣợng cần lựa chọn đƣợc tính theo công thức sau: Trong đó: nS - tổng số đối tƣợng trên bản đồ tỷ lệ gốc. SS - tỷ lệ bản đồ gốc. ST - tỷ lệ bản đồ đích. nT - tổng số đối tƣợng cần có trên bản đồ đích.
- Nguyên tắc Sukhôv chỉ ra mối liên quan giữa số lƣợng đối tƣợng cần biểu thị và tải trọng bản đồ.
Công thức chung: v = f ( M, r, q, ν ). Trong đó:
v: Số lƣợng kí hiệu địa vật cần biểu thị trên bản đồ thành lập. M: tỉ lệ bản đồ.
45 r: diện tích kí hiệu.
q : mật độ địa vật. ν: trọng tải diện tích.
Chọn các đối tượng đặc trưng: Có thể mở rộng nguyên tắc chọn tổng số đối
tƣợng của Topfer để chọn các đối tƣợng hay nhóm đối tƣợng đặc trƣng. Việc chọn nhóm đối tƣợng chỉ đƣợc thực hiện nhờ sử dụng ngữ nghĩa đối tƣợng. Giả sử mỗi đặc trƣng bản đồ đều đƣợc đặc trƣng bởi tập các thuộc tính, các đối tƣợng có thể đƣợc chọn nhờ truy vấn các thuộc tính. Nếu có nhiều thuộc tính và có nhiều chuẩn mực thì phải tính toán và xếp hạng để từ đó chọn ra các đối tƣợng mong muốn.
Ràng buộc của lựa chọn: Lựa chọn có thể bị ràng buộc bởi tôpô các đặc trƣng.
Nhƣ trong mạng lƣới đƣờng giao thông thì phải xem xét lôgic của lƣu lƣợng. Thí dụ mạng lƣới đƣờng sông có cấu trúc nhánh cây. Chúng chỉ có thể bị "tỉa" từ các lá xuống gốc.
3.2. Đơn giản hóa đường cong
Đơn giản hóa đƣờng cong đƣợc xem là thao tác quan trọng nhất của khái quát hóa. Phần lớn các đặc trƣng bản đồ đƣợc biểu diễn trực tiếp bằng các đƣờng (đƣờng sông, quốc lộ), các đa giác đƣợc hình thành từ các đƣờng bao quanh (vùng hành chính, khu rừng, mảnh đất). Đơn giản hóa làm giảm tổng số chi tiết đƣờng cho thấy rõ hiệu quả của khái quát hóa. Nếu đơn giản hóa đƣờng đƣợc cài đặt bằng thuật toán loại bớt cặp tọa độ thì chúng tự động làm giảm thiểu khối dữ liệu lƣu trữ. Trên hình 3-1, phía trái là dữ liệu gốc, phía phải là kết quả của tiến trình đơn giản hóa. Các dữ liệu bản đồ tạo ra từ các thiết bị nhập nhƣ bàn số hóa hay vectơ hóa tự động từ ảnh bitmap đôi khi dƣ thừa, không cần thiết. Thí dụ một điểm trên đoạn thẳng hay số lƣợng điểm xác định xâu quá nhiều, quá chi tiết. Nhƣ vậy ta phải rút gọn dữ liệu đầu vào hay còn gọi là làm sạch dữ liệu. Khái quát, thuật toán đơn giản hóa bắt đầu bằng đƣờng gấp khúc (polyline) C hình thành từ hai điểm cuối và tập đỉnh V tuỳ ý. Sau đó C đƣợc biến thành polyline đơn giản C' bằng cách làm giảm tổng số đỉnh V thành V' với hai điểm cuối cố định. Do vậy V' là tập con của V sẽ không tạo ra các đỉnh mới hay dịch chuyển vị trí của các đỉnh cũ. Tiêu chuẩn áp dụng khi giảm thiểu các đỉnh là: biến dạng đƣờng là tối thiểu, tập con V' là tối thiểu và độ phức tạp tính toán là ít nhất.
46
Giản lƣợc hóa các đối tƣợng dạng đƣờng là vấn đề đƣợc nghiên cứu tỉ mỉ nhất trong quá trình nghiên cứu về khái quát hoá. Các thuật toán đƣợc sử dụng phổ biến nhất bao gồm:
3.2.1. Thuật toán Douglas- Peucker
Thuật toán Douglas – Peucker[5] nguyên thuỷ đƣợc viết bởi Douglas và Peucker (1973) và đƣợc sửa đổi bởi Hershberger và Snoeyink (1992) là một thuật toán đơn giản hoá toàn thể thƣờng đƣợc sử dụng trong thành lập bản đồ và GIS. Thuật toán đƣợc triển khai theo các bƣớc sau:
1. Đƣa ra khoảng các dung sai (tolerance)
2. Nối điểm đầu và điểm cuối của đƣờng thành một đƣờng (đƣờng đơn giản thứ nhất)
3. Từ các điểm còn lại trên đƣờng hạ vuông góc xuống đƣờng vừa dựng(đƣờng đơn giản).
4. Tìm điểm có chiều dài đƣờng vuông góc lớn nhất, lớn hơn dung sai. Trƣờng hợp không có điểm nào thì đƣờng đơn giản đầu tiên chính là đƣờng kết quả. Trƣờng hợp tìm thấy điểm(điểm bẻ gãy) có chiều dài đƣờng vuông góc lớn nhất, lớn hơn dung sai thì chia đƣờng ban đầu tại điểm bẻ gãy. Sau đó thực hiện lại từ bƣớc 2 với 2 đƣờng cơ sở mới. Giữ lại điểm đầu và điểm cuối của đƣờng.
v2 v1 v2 v3 v4 v5 v6 v7 v1 v3 v4 v5 v6 v7
47
3.2.2. Thuật toán sử dụng điểm độc lập
Thuật toán bỏ điểm là phƣơng pháp làm đơn giản yếu tố dạng đƣờng dựa vào mật độ điểm có trên đƣờng. Thuật toán này thực chất là quá trình xử lý từng điểm nằm trên đƣờng. Có thể lƣợc bỏ bớt điểm của đƣờng theo một trong hai cách là lƣợc bỏ bớt điểm của đƣờng theo một chu kỳ nhất định hoặc là lựa chọn điểm ngẫu nhiên. Đƣợc triển khai theo các bƣớc sau:
1. Thực hiện nhóm các điểm liền kề nhau thành các nhóm.
2. Lƣợc bỏ bớt điểm theo một trong hai cách: Lựa chọn điểm ngẫu nhiên (Chọn ngẫu nhiên một số điểm giữ lại điểm đầu và điểm cuối của đƣờng line) hoặc Lựa chọn điểm theo chu kỳ (Đặt ra một chu kỳ lấy điểm, cứ bao nhiêu điểm trên đƣờng thẳng ta lấy một điểm các điểm còn lại ta lƣợc bỏ và giữ lại điểm đầu và điểm cuối của đƣờng line) Dung sai v15 v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11 v12 v13 v14 v1 v15 v2 v3 v5 v6 v7 v8 v9