- Phân loại có kiểm định:
b. Nhập dữ liệu Vector
Hiện nay, hệ thống bản đồ giấy đang được lưu trữ tại các cơ quan quản lý chưa được số hóa còn nhiều, đặc biệt ở các nước đang phát triển. Dữ liệu bản đồ giấy có sẵn này đã được điều tra và thu thập qua nhiều thập kỷ. Những dạng dữ liệu này cần được số hóa để sử dụng và lưu trữ. Số hóa có thể được thực hiện bằng phương pháp thủ công và phương pháp bán tự động. Phương pháp thủ công ghi lại tọa độ của con chuột khi ta nhấn chuột tại vị trí đối tượng cần thiết. Phương pháp tự động được thực hiện sử dụng ảnh quét làm nền để số hóa đối tượng bản đồ. Ngoài ra, dữ liệu sơ cấp được thu thập trực tiếp ngoài thực địa như dữ liệu trắc địa, dữ liệu thu thập bằng GPS cũng cần phải nhập và tạo cơ sở dữ liệu địa lý. Hình dưới mô tả tóm tắt các bước cơ bản của quá trình nhập và biên tập dữ liệu Vector trong GIS. Nguồn dữ liệu cho xây dựng dữ liệu Vector có thể là ảnh vệ tinh, ảnh máy bay, bản đồ giấy, dữ liệu điều tra điểm. Ảnh vệ tinh độ phân giải cao như ảnh vệ tinh Quikbird và ảnh máy bay có thể sử dụng để số hóa các đối tượng trên bề mặt Trái đất như đường giao thông, thủy văn, các thửa đất,…Tuy nhiên, sau khi hoàn thành số hóa cần thăm quan hiện trường để kiểm chứng kết quả. Các bản đồ giấy được lưu trữ tại các cơ quan quản lý hay chuyên môn thường được sử dụng để số hóa như bản đồ đường bình độ (bản đồ địa hình) tỷ lệ 1:50000 của nước ta được xây dựng từ năm 1970. Dữ liệu điểm điều tra thường là dữ liệu thu thập trực tiếp ngoài thực địa sử dụng thiết bị GPS. Các tệp dữ liệu được nhập vào phần mềm GIS. Các tệp dữ liệu điểm từ GPS nội suy sẽ trở thành dữ liệu Vector. Ví dụ, điểm lấy mẫu phẫu diện đất được định vị bằng GPS, sau quá trình phân tích ta có dữ liệu phân bố về các tính chất vật lý và hóa học đất. Các dữ liệu theo điểm này được nội suy để xác định tính chất lý hóa học của đất trong toàn vùng lãnh thổ nghiên cứu. Các dữ liệu số hóa cần phải đăng ký hệ quy chiếu nhất định. Mục đích của đăng ký hệ quy chiếu nhằm tạo khung tham chiếu chuẩn cho cơ sở dữ liệu Vector. Hệ quy chiếu chuẩn của Việt Nam là VN-2000. Vì vậy, các bản đồ Vector nhìn chung cần phải chuyển về hệ VN-2000.
86
Ảnh vệ tinh
Quét ảnh
Làm sạch ảnh
Ảnh máy bay Số hóa Nắn ảnh, nắn bản đồ
Bản đồ giấy
Số hóa
Quá trình nhập và biên tập cơ sở dữ liệu Vector
*. Số hóa dữ liệu trực tiếp từ bàn số hóa
Số hóa dữ liệu dựa vào bàn số hóa (on-tablet manual digitizing) là quá trình chuyển thông tin từ dạng bản đồ giấy sang dạng số. Phương pháp này chiếm vị trí quan trọng trong xây dựng cơ sở dữ liệu địa lý, đặc biệt xây dựng cơ sở dữ liệu bản đồ địa chính tỷ lệ lớn (1:200, 1:500, 1:1.000, 1:2.000, 1:5.000 và 1:10.000).
Bản đồ giấy thu thập được đặt trên bàn số hóa. Bàn số hóa có kích thước khác nhau, biến động từ 30cm x 30cm đến 1,1m x 1,5m. Bàn số hóa được chia thành các ô vuông đều nhau sử dụng hệ tọa độ phẳng để định vị các đối tượng trên bản đồ đặt trên bàn số hóa. Quá trình số hóa thực hiện đơn giản bằng quá trình sử dụng chuột số hóa cho nhập đối tượng điểm, đường hay đa giác trên bản đồ. Quá trình số hóa cần thực hiện các nội dung cơ bản sau:
- Thu thập và xác định số mảnh bản đồ trong vùng nghiên cứu. Các bản đồ cần làm phẳng.
- Đăng ký tọa độ cho mỗi mảnh bản đồ số hóa bằng cách nhập tọa độ các điểm điều khiển tại góc của mảnh bản đồ.
- Nhập dữ liệu là tiến hành số hóa từng nhóm đối tượng dạng điểm, đường và vùng. - Hiệu chỉnh và biên tập dữ liệu, chuẩn hóa dữ liệu theo quy chuẩn ngành.
*. Số hóa dữ liệu dựa trên nền ảnh quét
Số hóa dữ liệu dựa trên nền ảnh quét (on-screem manual digitizing) là phương pháp số hóa các đối tượng bản đồ (điểm, đường, vùng) trực tiếp trên màn hình máy tính. Phương pháp này có nhiều ưu điểm so với phương pháp số hóa bằng bàn số hóa. Khâu số hóa được thực hiện trên cơ sở ảnh quét đảm bảo chất lượng và cập nhật. Các bước thực hiện số hóa dựa trên nền ảnh quét có sự khác nhau giữa các phần mềm GIS và loại dữ liệu Vector. Nhìn chung, những nội dung cơ bản của số hóa dựa vào ảnh quét bao gồm:
- Thu thập bản đồ giấy hay ảnh cần quét. - Quét bản đồ giấy và làm sạch bản đồ quét.
- Nắn ảnh quét để đăng ký hệ quy chiếu tọa độ cho bản đồ số hóa.
- Số hóa (vectorization) các đối tượng điểm, đường, vùng trên nền ảnh quét. - Chỉnh lý, biên tập và chuẩn hóa bản đồ đã được số hóa.
Tuy nhiên, lưu ý rằng dữ liệu Vector dạng vùng như thửa đất, dạng tuyến như mạng lưới giao thông có quy trình số hóa đơn giản hơn số hóa đối tượng là đường bình độ. Với việc số hóa bản đồ đường bình độ, ngoài các công việc thực hiện như đối tượng vùng và
tuyến, ta còn phải tiến hành nội suy để tạo mô hình số độ cao (DEM). Hình 3.4 mô tả các bước chủ yếu của quá trình số hóa và tạo bản đồ số độ cao từ bản đồ giấy đường bình độ có sẵn.
Thu thập dữ liệu bản đồ giấy hay ảnh là khâu quan trọng. Các bản đồ thu thập để số hóa phải là các bản đồ đảm bảo chất lượng. Bản đồ địa chính (thửa đất) và bản đồ địa hình dạng đường bình độ thường được quét và số hóa để thành lập bản đồ số địa chính và địa hình. Các loại ảnh máy bay được thu thập và in trước đây cũng là nguồn tư liệu tốt.
Khâu tiếp theo là tiến hành quét bản đồ giấy. Quét bản đồ là phương pháp tự động nhập dữ liệu sử dụng máy quét bản đồ. Máy quét là thiết bị có thể đọc được văn bản hay các dạng dữ liệu đồ họa như bản đồ và dịch các dạng thông tin này để máy tính có thể đọc và hiển thị được. Máy quét thực hiện quét dữ liệu đồ họa theo lớp. Mỗi lớp dữ liệu là dẫy các ô vuông (pixels). Mỗi pixel trong lớp dữ liệu đặc trưng cho một giá trị nhất định. Các máy quét quanh học (optical scanner) không phân biệt được dạng văn bản. Dạng văn bản chỉ được hiển thị như các đối tượng đồ họa, vì vậy ta không thể biên tập được dạng dữ liệu văn bản của sản phẩm quét. Để biên tập được dạng văn bản, ta cần phải có hệ thống OCR (optical character recognition) để dịch tệp ảnh sang dạng ASCII. Các máy quét quang học hiện đại đều có OCP tích hợp vào hệ thống. Quét dữ liệu là quá trình chuyển bản đồ giấy thành dạng số mà máy tính có thể đọc được. Máy quét sử dụng thiết bị CCD (charge coupled devices) để đọc giá trị ánh sáng phản xạ từ bề mặt. Thiết bị điện tử chuyên dụng chuyển giá trị phản xạ sang dạng số. Mỗi giá trị phản xạ đặc trưng bởi bước sóng điện từ nhất định. Kết quả của quét ảnh là bản đồ số Raster. Mỗi pixel của tệp ảnh Raster đặc trưng cho một mức độ phản xạ mà CCD ghi lại được. Mỗi giá trị này có thể hiển thị theo một màu nhất định. Lựa chọn độ phân giải để quét ảnh là rất quan trọng. Nó ảnh hưởng đến chất lượng ảnh và sự khái quát hóa các đối tượng trên bản đồ giấy. Tuy nhiên, độ phân giải liên quan đến kích thước của tệp ảnh. Tùy theo khả năng lưu trữ của máy tính, ta cần cân nhắc lựa chọn độ phân giải phù hợp, vừa đảm bảo chi tiết đối tượng và vừa phù hợp với khả năng của lưu trữ của máy tính. Thông thường, ta nên xác định độ phân giải cho ảnh quét dựa theo kích thước cụ thể của đối tượng nhỏ nhất mà ta muốn hiển thị trên bản đồ. Ví dụ, ta có thể chọn độ phân giải cho bản đồ quét là 150 dpi hay 250 dpi (dot per inch). Dpi là số điểm ảnh trên một đơn vị chiều dài là một inh.
Số hóa đối tượng trên nền ảnh quét là khâu tiếp theo. Quá trình này tiến hành với sự hỗ trợ của các phần mềm GIS chuyên dụng. Lưu ý rằng quy trình vector hóa có sự khác nhau giữa các phần mềm GIS. Số hóa đối tượng đường là công việc chính của quá trình chuyển dữ liệu ảnh quét thành dữ liệu Vector. Đường là dãy các pixel của ảnh quét. Độ rộng của đường có thể lớn hơn kích thước của một pixel. Quá trình di chuột số hóa đường chỉ thực hiện tại dẫy pixel tại tâm của đường nền ảnh quét (centerline pixels). Các centerline pixels được chuyển thành các dẫy tọa độ x,y để định nghĩa đối tượng đa giác hay vùng.
*. Nhập dữ liệu Vector từ kết quả đo đạc thực địa
Dữ liệu đo đạc thực địa là dữ liệu được thu thập bằng các thiết bị chuyên dùng như máy trắc địa điện tử, máy định vị toàn cầu GPS hay các thiết bị quan trắc môi trường khác. Máy trắc địa hỗ trợ đo đạc và thành lập bản đồ địa chính (thửa đất) ở tỷ lệ lớn. Dữ liệu thu thập từ máy trắc địa đáp ứng được mô tả chi tiết từng thửa đất. Tuy nhiên, việc thu thập dữ liệu bổ sung, thiết bị GPS cũng là một trong những thiết bị hiệu quả. GPS cho
phép thu thập dữ liệu không gian phổ biến nhằm bổ sung và cập nhật cơ sở dữ liệu địa lý. Từ thời xa xưa, con người đã sử dụng dụng cụ thiên văn, la bàn và bản đồ để xác định vị trí và tìm đường trong các chuyến thám hiểm khai phá các miền đất lạ. Tuy nhiên, phải đến năm gần đây, khi các hệ thống vệ tinh định vị toàn cầu GPS của Mỹ chính thức đi vào hoạt động, việc định vị dẫn đường mới được giải quyết một cách cơ bản. Ngoài mục tiêu phục vụ các chức năng của lĩnh vực quân sự như ý tưởng thiết kế ban đầu, các hệ thống vệ tinh định vị đã được ứng dụng rộng rãi và hiệu quả trong nhiều lĩnh vực dân sự. Hệ thống định vị toàn cầu GPS là một tập hợp các phần cứng và phần mềm dùng để xác định vị trí các đối tượng trên bề mặt Trái đất bằng cách sử dụng các tín hiệu nhận được từ hệ thống vệ tinh. Các dữ liệu về vị trí và các thuộc tính đi kèm có thể được nhập vào hệ thống GIS. GPS thu thập dữ liệu của điểm, đường hoặc vùng theo một tập hợp bất kỳ phù hợp cho việc sử dụng trong GIS. GPS có thể được sử dụng như một công cụ hữu hiệu thu thập và cập nhật dữ liệu không gian cho GIS. Các thiết bị quan trắc môi trường có thể bổ sung dữ liệu, tuy nhiên dữ liệu này chủ yếu là dạng điểm về hệ thống chỉ số môi trường. Việc mô tả vị trí các điểm quan trắc môi trường cần có sự hỗ trợ của thiết bị GPS.
Dữ liệu đo đạc trắc địa có thể nhập trực tiếp vào phần mềm chuyên dùng như phần mềm đo vẽ và thành lập bản đồ địa chính (FAMIS). Hiện nay, các thiết bị GPS có thể kết nối với máy tính và dữ liệu số lưu trong thiết bị GPS được tải trực tiếp vào các phần mềm GIS thương mại như ArcGIS hay IDRISI.
*. Chỉnh lý và biên tập dữ liệu Vector
Xây dựng dữ liệu và biên tập dữ liệu là hai nội dung quan trọng nhất trong xây dựng cơ sở dữ liệu địa lý. Quá trình thu thập, nhập dữ liệu không gian và thuộc tính không thể tránh khỏi các lỗi. Việc chỉnh lý và biên tập dữ liệu, chuẩn hóa dữ liệu là rất cần thiết. Chất lượng dữ liệu và các sản phẩm thông tin tạo ra từ cơ sở dữ liệu sẽ phụ thuộc chặt chẽ vào khâu này.
Các lỗi dữ liệu Vector xuất hiện trong quá trình số hóa bản đồ hay quá trình chuyển đổi từ dữ liệu Raster sang Vector. Nội dung công tác biên tập dữ liệu Vector có thể phân ra theo các nhóm đối tượng dạng điểm, đường và đa giác (vùng). Tuy nhiên, việc phân chia này mang tính chất tương đối bởi vì đường và vùng cũng được tạo ra từ đơn vị cơ sở là điểm.
Chỉnh lý và biên tập dữ liệu dạng điểm: Các lỗi điểm trong quá trình số hóa dữ liệu
điểm có thể bao gồm sai lệch vị trí (tọa độ) của các điểm dữ liệu so với hệ quy chiếu lựa chọn, thuộc tính đồ họa, lỗi sai về hình dạng và kích thước điểm. Như vậy, công việc chỉnh lý dữ liệu điểm sẽ là giảm thiểu hay khử đi những lỗi thuộc về sai lệch vị trí, thuộc tính đồ họa, hình dạng và kích thước của đối tượng điểm.
Chỉnh lý và biên tập dữ liệu dạng đường: Sau quá trình số hóa các dữ liệu dạng
đường có thể có các lỗi về chứa nhiều điểm thừa trên đường, thiếu điểm nên đường chưa trơn và mềm, tồn tại các điểm cuối tự do bởi vì do đường bắt quá (overshoot), chưa bắt tới (undershoot), đường trùng nhau. Như vậy, các hoạt động biên tập và chỉnh lý với nhóm đối tượng dạng đường sẽ là lọc bỏ điểm thừa, bổ sung thêm điểm, cắt bớt đường bắt quá và chưa bắt tới.
Thủ tục để thực hiện các chỉnh lý và biên tập có sự khác nhau tùy phần mềm GIS khác nhau. Ví dụ, làm trơn đường được thực hiện sử dụng MicroStation và Mapping Officce có thể thực hiện theo nhiều thủ tục. Cách thứ nhất là thêm từng điểm bằng công
cụ Insert Vertex thuộc công cụ Modify. Cách thứ hai là làm trơn đường bằng công cụ FC thin segment của MSFC. Cách thứ ba là xử lý tự động trên một level hay các level trong một file bằng công cụ Smooth/Filter của Geovec.
Chỉnh lý và biên tập dữ liệu dạng vùng: Các lỗi vùng thường bao gồm thừa vùng
hay thiếu vùng sinh ra trong quá trình số hóa. Thừa vùng là hiện tượng sinh ra khi số hóa nhiều lần đường biên chung. Kết quả là các vùng đa giác nhỏ được sinh ra. Để khử đi hiện tượng “thừa vùng” trong quá trình chỉnh lỗi ta có thể thiết lập topology cho lớp dữ liệu Vector. Tạo topology có thể thực hiện dễ dàng sử dụng phần mềm ArcGIS hay FAMIS.
Chỉnh lý và biên tập dữ liệu dạng chữ: Sau quá trình số hóa, dữ liệu dạng chữ có thể
lỗi về vị trí, kiểu chữ và kích thước và các thuộc tính định dạng text. Quá trình sửa lỗi liên quan đến dữ liệu dạng chữa là chỉnh font chữ, kích thước, hướng và vị trí của chữ cho phù hợp.