Thu thập và tiền xử lý dữ liệu bản đồ véctơ

Một phần của tài liệu TÍCH HỢP GIS VÀ ẢNH VIỄN THÁM HỖTRỢ QUẢN LÝ VÙNG VEN BIỂN HẢI PHÒNG (Trang 32 - 39)

5. Phương pháp nghiên cứu

2.2 Thu thập và tiền xử lý dữ liệu bản đồ véctơ

Dữ liệu GIS được thu thập, nhận diện và đo đạc vào cùng thời điểm, cùng độ phân giải không gian, tuân thủ cùng một thủ tục nhận diện và nhập vào GIS theo cùng phương pháp là lý tưởng nhất. Nếu như vậy các thao tác phân

tích trên khối dữ liệu đó mới cho kết quả có chất lượng cao. Nhưng trên thực tế, việc thu thập dữ liệu lại được thực hiện vào các thời điểm khác nhau và chúng thường có độ phân giải khác nhau. Một số dữ liệu được thu thập từ bản đồ có sẵn mà không biết được tọa độ thực, một số khác được thu thập bằng đo đạc trực tiếp. Cần chú ý là trong mọi trường hợp việc thu thập tọa độ vị trí các đối tượng và thu thập các thuộc tính của chúng phải tiến hành vào cùng thời điểm.

Có rất nhiều loại dữ liệu được sử dụng trong công việc phân tích GIS. Điều này phản ánh mục tiêu của chính hệ thống. Vì GIS được sử dụng trong nhiều loại ứng dụng khác nhau từ phân tích địa chất, phân tích thị trường đến lập kế hoạch nông thôn cho nên chúng ta khó có thể kiểm kê và phân lớp dữ liệu một cách dễ hiểu.

Nhập dữ liệu là công đoạn tốn kém thời gian nhất trong thao tác GIS, thường tốn đến 80% ngân sách trong một dự án.

Cách tốt nhất để có nhanh dữ liệu là sử dụng dữ liệu có sẵn của các công ty hay tổ chức khác. Việc chia sẻ dữ liệu trở nên thông thường trong thế giới GIS góp phần đẩy nhanh chuẩn hóa dữ liệu và phát sinh khái niệm dữ liệu về dữ liệu (metadata) để mô tả nguồn gốc và độ chính xác của các lớp GIS. Điều quan trọng trong xử lý dữ liệu có sẵn là phải đáp ứng nhu cầu cụ thể. Nếu dữ liệu có sẵn mà không phù hợp với nhiệm vụ thì phải tự số hóa bản đồ.

Có thể nói rằng tập dữ liệu không có tài liệu là dữ liệu không có giá trị. Nếu không biết nguồn gốc của dữ liệu thì người dùng sẽ mất nhiều thời gian để kiểm chứng chúng.

Mỗi đối tượng GIS được mô tả bởi kiểu, hình dạng, các thuộc tính, quan hệ và số lượng của nó. Các kiểu dữ liệu bao gồm: dữ liệu hình học và dữ liệu thuộc tính.

Các phương pháp thu thập dữ liệu có thể được phân chia thành hai loại chính. Thứ nhất là phương pháp thu thập dữ liệu bằng chính những đối tượng. Phương pháp này thương cho kết quả chính xác nhất, nhưng chi phí cũng tốn kém nhất. Chúng bao gồm:

- Trắc địa mặt đất

- Phương pháp định vị bằng vệ tinh - Chụp ảnh bằng máy bay hay vệ tinh

Thứ hai là phương pháp thu thập dữ liệu từ nguồn số hóa hay tương tự có

sẵn. Phương pháp này cho dữ liệu ít chính xác hơn phương pháp trên nhưng

đòi hỏi chi phí thấp hơn. Chúng bao gồm: - Số hóa bằng tay các bản đồ giấy

- Số hóa tự động bản đồ giấy bằng máy quét - Sử dụng các cơ sử dữ liệu, bản đồ số hóa có sẵn.

Phương pháp thu thập bản đồ bằng ảnh vệ tinh

Viễn thám bao hàm sử dụng thiết bị hay cảm biến để thu thập từ xa các quan hệ phổ và không gian của đối tượng quan sát được. Từ viễn cảnh thẳng đứng hay xiên trên cao, cảm tưởng về bề mặt trái đất khác đáng kể so với khi quan sát từng điểm xung quanh ta. Ta có thể nhìn thấy vô số các đặc trưng trên bề mặt trái đất như là quan sát thấy các quan hệ ngữ cảnh và không gian thích ứng của chúng trên bản đồ chuyên đề. Đó là lý do viễn thám được sử dụng rộng rãi. Bằng các cảm biến trên máy bay hoặc vệ tinh mà các đặc trưng trên các vùng rộng lớn được đo đạc và phân tích, không bị các vùng lân cận cản trở. Đó là phương pháp hiệu quả nhất để duy trì, cập nhật thông tin về trái đất.

Khi nói đến viễn thám hầu như người ta suy nghĩ đến vệ tinh mang thiết bị cảm biến. Hầu hết các vệ tinh bay vòng quanh trái đất theo quỹ đạo mặt trời có độ cao tử 700 đến 1000 km.

Các ảnh do vệ tinh chụp được gửi về trái đất bằng tín hiệu sóng radio để các chạm thu mặt đất thu được. Đặc trưng của cảm biến vệ tinh bao gồm các điểm chính sau:

- Lớp quang phổ (vị trí dải tần) - Mật độ quang phổ (độ rộng dải tần)

- Kính thước quang phổ (tổng số dải tàn) - Mật độ phóng xạ (lượng tử)

- Mật độ hình học (kích thước điểm ảnh trên mặt đất - Tần suất chụp (số lần chụp trong đơn vị thời gian)

Bộ cảm biến được sử dụng nhiều có chất lượng cao được đặt trên vệ tinh Landsat loại TM (Thematic Mapper)

Sau khi đã có dữ liệu ảnh, công việc tiếp theo là xử lý chúng theo một trong các cách mà con người diễn giải hay kỹ thuật xử lý tự động ảnh số. Con người có thể nhận biết nhanh các mẫu của ảnh trong một số trường hợp. Nhưng nên ứng dụng phương pháp xử lý ảnh số bằng máy tính trong phần lớn các trường hợp khác. Các công việc phải làm là: - Làm rõ và tách sườn ảnh - Lọc nhiễu - Ghép ảnh - Phân tích các thành phần chính - Tính toán tỷ lệ và chỉ sốảnh

Mục tiêu chính của xử lý ảnh bằng máy tính là phân lớp (classification) hay còn gọi là nhận dạng mẫu. Phân lớp là nhóm các đối tượng vào các lớp trên cơ sở mức độ tương tự và tuân thủ một hay nhiều biến. Mục tiêu của hầu hết các ứng dụng viễn thám là phân biệt và ánh xạ các lớp thông tin mặt đất chính xác.

S hóa bản đồ

B1. Tìm kiếm bản đồ phù hợp

Tìm kiếm bản đồ phù hợp phụ thuộc vào lựa chọn vùng, chủ đề và chu kì phù hợp, thời gian phù hợp. Phần lớn thư viện bản đồ chứa mô tả vùng, chủ đề trong danh mục đồng thời chứa cả thời gian phát hành bản đồ. Tuy nhiên hiếm khi thời gian thu thập dữ liệu phù hợp mà vẫn còn hợp lệ với thời gian lập bản đồ. Vào năm 1992, DCW (Digital Char of the World), bản đồ thế giới

có kèm theo chỉ báo khung thời gian được phát hành trên giấy và dạng số trong tệp. Tệp dữ liệu của DCW chứa toàn bộ các đoạn thẳng tạo thành bờ biển, sông ngòi, đường bình đồ, đương biên quốc gia, đường quốc lộ chính, đường xe hỏa và các thành phố. Các tệp này được số hóa từ bản đồ tỷ lệ 1 :1000000 của ONC (Operational Navigation Charts). Dung lượng của dữ liệu DCW khoảng 1.6 Gbyte được lưu trữ trên CD-ROM. Nội dung của chúng được chia thành nhiều lớp bản đồ, như đường biên hành chính, bờ biển, sử dụng đất, đường quốc lộ, đường sát, hệ thống thủy lợi. Mỗi lớp lại được chia thành lớp bản đồ con. Thí dụ lớp đường sắt được chia thành đường đơn hay đường đôi. Xâm nhập bản đồ được thực hiện thông qua chỉ số tên dịa phương hay cho trước tọa độ kinh vĩ tuyến. Dữ liệu này có cấu trúc topo trong khuôn mẫu vector VPF (Vector Product Format).

B2: Số hóa bản đồ

Khi chuẩn bị bản đồ để số hóa thì cần coi trọng phương pháp quy chiếu không gian của dữ liệu. Tiến trình tham chiếu địa lý là tiến trình cung cấp địa chỉ không gian có thể thực hiện nhờ sử dụng hệ tọa độ địa lý, tọa độ lưới hay không dùng tạo độ. Trong trường hợp này, dữ liệu mới tạo ra không thể phù hợp với dữ liệu có sẵn trong các tệp mà phải thực hiện nắn chỉnh chúng. Khi sử dụng hệ tọa độ địa lý, Trái đất được coi như là hình cầu. Khi sử dụng hệ tọa độ lưới, trái đất được coi như mặt phẳng. Hệ tọa độ lưới UTM tổ hợp cả hệ tọa độ địa lý và tọa độ lưới nó là tập các mặt phẳng bao quanh trái đất.

Nhiều hệ GIS không lưu trữ tọa độ theo khuôn dạng mẫu độ, phút, giây mà lưu trữ hệ tọa độ thập phân. Do vậy, khi hiển thị và khi nhập tọa độ đặc trưng bản đồ thường phải chuyển đổi giữa chúng. Công thức biến đổi độ, phút, giây sang khuôn mẫu độ thập phân như sau:

60 ) 60 Seconds (Minutes + Degrees = Degrees Decimal 

Với ví dụ phải chuyển đổi 42o45’30” sang độ thập phân ta có:

758333333 . 42 60 ) 60 30 (45 + 42 = Degrees Decimal  

Công thức biến đổi độ thập phân sang độ, phút, giây được mô tả thông qua ví dụ. Số nguyên của độ thập phân là độ, ví dụ độ thập phân 75,213458 thì có 75 độ. Số phút bằng phần nguyên của phép nhân phần lẻ độ thập phân với 60, ta có 0,213458 * 60 = 12,807480, kết quả là 12 phút. Tính tương tự cho số giây: 0,807480 * 60 = 48,4488 để có kết quả là 48”. Vậy 75,213458 = 75o12’18”.

Số hóa bản đồ bằng bàn số hóa (digitizer) hay nhập bản đồ giấy bằng máy quét (scanner) là phương pháp thường được sử dụng. Số hóa bằng bàn số hóa là tiến trình ghi lại vị trí của trình tự các điểm đặc trưng dọc theo đường trên

bản đồ. Phương pháp này cho kết quả dưới dạng bản đồ vector 2D. Máy quét

làm việc tương tự máy fax. Kết quả nhập bản đồ bằng máy quét là số liệu raster. Nếu sử dụng công cụ phần mềm chuyển đổi raster sang vector thì ta cũng có số liệu bản đồ vector 2D. Một trong những đặc trưng quan trọng của dữ liệu bản đồ là độ chính xác. Độ chính xác của dữ liệu phát sinh từ tiến trình số hóa hay quét bản đồ phụ thuộc trước hết vào độ chính xác của bản đồ giấy. Hình là giao diện của module nhập bản đồ của hệ thống PopMap for Windows 4.2. Module này có đầy đủ chức năng vẽ, cập nhật, sửa đổi các đường biên đối tượng bản đồ và gắn nhãn cho đối tượng kiểu điểm, đường, vùng. Các đặc trưng bản đồ được nhập thông qua bàn số hóa hay chuột.

Phương tiện chính để chuyển đổi dữ liệu tuyến tính sang dữ liệu số là bàn số hóa và máy quét. Sử dụng bàn số hóa bằng tay còn máy quét thì làm việc tự động. Bàn số hóa bao gồm bàn nhỏ chứa lưới dây kim loại mịn đặt theo các trục Đecac. Con trỏ chứa cuộn dây kim loại và được nối với bàn để người thao tác xác định điểm cần ghi lại. Vị trí chính xác được xác định nhờ dấu thập mỏng tại đầu con chạy. Trên con trỏ còn có các phím để nhập mã lệnh và hay dữ liệu. Công nghệ chung nhất của bàn số hóa dựa trên nguyên tắc điện từ. Lưới dây trong bảng nhỏ và cuộn dây con trỏ hoạt động như bộ thu , bộ phát hay ngược lại. Nếu con trỏ là bộ phát thì bộ điều khiển của bàn sẽ quét lưới dây kim theo chiều X và Y để tìm ra vị trí của chữ thập mỏng đầu con trỏ

Hình 2.4. Số hóa bản đồ

Mục tiêu chính của tiến trình chuyển đổi thông tin không gian từ dạng tuyến tính sang dạng số hóa là bảo toàn quan hệ trên bản đồ, bao gồm:

- Đảm bảo liên kết tồn tại giữa các điểm

- Các đường song song vẫn còn song song

- Bảo toàn các vị trí tương đối

- Bảo toàn các vị trí tuyệt đối (thông qua tọa độ) - Bảo toàn tính liền kề

- Các đường gần nhau không được cắt nhau

Tiến trình số hóa thường bắt đầu bằng cố định bản đồ gốc trên mặt bàn số hóa. Trước khi số hóa các đặc trưng bản đồ, phải số hóa các điểm điều khiển (điểm tham chiếu) hay lưới tọa độ để đăng ký hệ thống tọa độ. Một phần rất quan trọng của số hóa bản đồ là đảm bao thông tin tham chiếu địa lý, biểu thị

bằng lưới và các đường kinh tuyết, vĩ tuyến cần được lưu trữ theo bản đồ số hóa. Phần lớn bản đồ tỷ lệ trung bình và tỷ lệ lớn (> 1 : 50000) đều chứa lưới vùng làm cơ sở cho phép chuyển đổi tuyến tính từ tọa độ số hóa sang tọa độ lưới. Nếu giả sử bản đồ không bị biến dạng hay không đòi hỏi độ chính xác cao thì chỉ cần xác định 3 điểm điều khiển không cùng năm trên đường thẳng có tọa độ lưới đã biết. Khi bản đồ cần đọ chính xác cao hay biết rằng bản đồ nguồn méo mó thì phải xác định nhiều điểm điều khiển tọa độ lớn hơn (ví dụ 20 điểm)

Bàn số hóa thường có hai chế độ nhập tọa độ, đó là điểm và đường (stream, line). Khi làm việc trong chế độ điểm, bàn số háo chỉ phát sinh tọa độ mỗi khi nhấn phím trên con chạy. Chế độ làm việc này thường áp dụng để số hóa đặc trưng điểm như độ cao điểm, thành phố trong bản đồ tỷ lệ nhỏ và số hóa các đặc trưng đường hay đa giác như hệ thống sông ngòi, đường biên hành chính. Chế độ đường của bàn số hóa nhằm tăng tốc độ số hóa các đặc trưng đường hay đa giác vì chúng tự động ghi lại tọa độ các điểm khi thao tác viên dịch chuyển con trỏ theo đường số hóa. Việc tự động ghi lại tọa độ dựa trên cơ sở thời gian hay cơ sở khoảng cách. Có nghĩa rằng, mỗi tọa độ được ghi sau một khoảng thời gian nhất định theo chiều X, Y hay cả hai. Chế độ đường của bàn số hóa thường làm phát sinh một lượng lớn dữ liệu dư thừa. Vì vậy chế độ điểm thường sử dụng trong nhiều loại ứng dụng.

Một phần của tài liệu TÍCH HỢP GIS VÀ ẢNH VIỄN THÁM HỖTRỢ QUẢN LÝ VÙNG VEN BIỂN HẢI PHÒNG (Trang 32 - 39)