Microsoft Word Can GTHeThongThongTinDiaLy 1 PGS TS ĐÀM XUÂN VẬN (Chủ biên) TS NGUYỄN HUY TRUNG, ThS NGÔ THỊ HỒNG GẤM GIÁO TRÌNH HỆ THỐNG THÔNG TIN ĐỊA LÝ NHÀ XUẤT BẢN BÁCH KHOA HÀ NỘI 2 Biên mục trên.
GIỚI THIỆU VỀ HỆ THỐNG THÔNG TIN ĐỊA LÝ
Lịch sử phát triển của hệ thống thông tin địa lý
1.1.1 Giới thiệu chung về hệ thống thông tin địa lý
Hệ thống thông tin địa lý (GIS) là một nhánh của công nghệ thông tin, hình thành từ những năm 60 của thế kỷ XX Ngày nay, GIS là một ngành công nghiệp hàng tỷ đô la với sự tham gia của hàng trăm nghìn người trên toàn thế giới GIS được dạy phổ biến trong các trường phổ thông, trường đại học trên toàn thế giới Các chuyên gia của mọi lĩnh vực đều nhận thức được những ưu điểm của sự kết hợp công việc
GIS được coi là sự liên kết của một số kỹ thuật cho phép nhà địa lý tổ chức dữ liệu và áp dụng những phương pháp hỗ trợ phân tích địa lý truyền thống như phân tích chồng ghép bản đồ và mô hình hóa trên máy tính GIS có thể thực hiện các công việc như: vẽ bản đồ, xây dựng mô hình, hỏi đáp và phân tích một lượng lớn dữ liệu Tất cả đều được lưu giữ trong một cơ sở dữ liệu Sự phát triển của GIS dựa trên nền tảng của nhiều ngành khoa học khác nhau như: địa lý, bản đồ học, đo vẽ ảnh, viễn thám, khảo sát, trắc địa, xây dựng công trình, thống kê, khoa học máy tính, dân tộc học và nhiều nhánh khoa học khác của khoa học trái đất và khoa học tự nhiên GIS có thể được xem xét như một cơ sở dữ liệu số, trong đó dữ liệu thông tin được liên kết trong một tọa độ không gian GIS cho phép:
– Nhập dữ liệu (các bản đồ, ảnh hàng không, vệ tinh và các nguồn khác);
– Lưu trữ dữ liệu, truy nhập và hỏi đáp;
– Chuyển đổi dữ liệu, phân tích và mô hình hóa;
– Báo cáo dữ liệu (các bản đồ, báo cáo và sơ đồ) Đối tượng chính của các ứng dụng GIS là sự chồng ghép của những lớp thông tin khác nhau thông qua việc sử dụng nhiều nguồn dữ liệu đa dạng được xây dựng trên một bản đồ cơ sở địa hình Điều quan trọng là tất cả các lớp thông tin phải được đăng ký với cùng một hệ quy chiếu không gian phổ dụng Với chức năng đo đạc và tổ hợp những thành phần khác nhau, GIS cho ta nhìn thấy và quản lý tất cả những gì đang diễn ra trên bề mặt trái đất
GIS cho phép tìm kiếm những loại hình không gian, xử lý và cho những mối quan hệ giữa những lớp chuyên đề khác nhau Một bản đồ có thể là lớp chồng xếp của nhiều bản đồ chuyên đề cùng được đăng ký vào một hệ tọa độ chung GIS cũng cho phép tách biệt một hay nhiều lớp từ các lớp thông tin nguồn Thông tin của những lớp cụ thể có thể được tập hợp và chuyển sang lớp mới để tiếp tục phân tích về sau Đây là quá trình thực hiện các phép tính đại số trên bản đồ
Cùng với khoa học bản đồ, kỹ thuật GIS đã tăng cường hiệu quả và sức mạnh phân tích của việc thành lập bản đồ truyền thống Một hệ GIS có thể được sử dụng để sản xuất những hình ảnh không phải chỉ là những bản đồ mà còn là những bản vẽ kỹ thuật và sản phẩm minh họa khác Những hình ảnh này cho phép các nhà quan sát cảm nhận các đối tượng của họ theo cách mà chưa bao giờ nhìn thấy trong các tài liệu trước đây Những hình ảnh này rất có ích trong việc dẫn dắt tới các khái niệm kỹ thuật của GIS dành cho những người không chuyên nghiên cứu khoa học
1.1.2 Lịch sử phát triển của GIS
1.1.2.1 L ị ch s ử hình thành và phát tri ể n c ủ a GIS trên th ế gi ớ i
Kỷ nguyên thông tin có thể xem như được bắt đầu với sự sử dụng của thẻ đục lỗ để lập trình văn hóa dệt tại Pháp cuối những năm 1800
Cuộc tổng điều tra dân số Mỹ năm 1890 đã sử dụng công nghệ thẻ đục lỗ và máy đọc thẻ cơ học để thống kê kết quả điều tra
Từ xa xưa, con người đã biết cách biểu diễn các thông tin địa lý bằng cách thu nhỏ các sự vật theo một kích thước nhất định sau đó vẽ lên mặt phẳng Năm 1936, tại hội nghị của Hiệp hội Các nhà địa lý Mỹ đã nêu ra sự cần thiết phải phát triển các tiếp cận về lượng trong giải quyết các vấn đề dựa trên bản đồ Để đánh dấu các đặc tính của sự vật, người ta dùng các loại ký hiệu khác nhau như độ cao được biểu diễn bằng những đường bình độ, một số đối tượng được biểu thị bởi các loại màu sắc tương ứng hoặc bằng chú thích cùng các số hiệu đi kèm Sự biểu thị kết quả thể hiện các ý tưởng đó được gọi là bản đồ Dần dần, bản đồ chiếm một vị trí quan trọng không thể thiếu được trong đời sống của con người và có thể nói: Bản đồ là một công cụ thông tin quen thuộc đối với loài người Trong quá trình phát triển kinh tế kỹ thuật, bản đồ luôn được cải tiến sao cho ngày càng đầy đủ thông tin hơn, ngày càng chính xác hơn Khi khối lượng thông tin quá lớn trên một đơn vị diện tích bản đồ thì người ta tiến đến lập bản đồ chuyên đề Ở bản đồ chuyên đề chỉ biểu diễn những thông tin theo một chuyên đề sử dụng Trên một đơn vị diện tích địa lý sẽ có nhiều loại bản đồ chuyên đề: bản đồ địa hình, bản đồ hành chính, bản đồ địa chất, bản đồ du lịch, bản đồ giao thông vận tải, v.v
* Tr ướ c n ă m 1960: Kho ả ng t ố i c ủ a GIS
Trong những năm 1950, do máy tính chưa phát triển nên việc tạo ra bản đồ rất đơn giản Họ có thể xây dựng bản đồ định tuyến xe, các bản đồ quy hoạch mới và các điểm vị trí quan tâm, vẽ trên giấy Với các bài toán phân tích không gian, một lựa chọn là lập bản đồ lưới Bản đồ lưới được sử dụng là các lớp trong suốt được chiếu trên bảng ánh sáng để xác định khu vực chồng lên nhau Nhưng điều này đi kèm với thách thức: khu vực tính toán kề nhau là không thể, dữ liệu là thô và thường không chính xác, việc đo khoảng cách phức tạp Đây chính là động lực để chuyển đổi từ bản đồ giấy sang bản đồ số (bản đồ trên máy tính)
* Giai đ o ạ n 1960 – 1975: Ý t ưở ng tiên phong trong GIS
Trong những năm 1960, Roger Tomlinson khởi xướng, lên kế hoạch và chỉ đạo trực tiếp việc phát triển của hệ thống địa lý Canada (CGIS) Đây là một thời điểm quan trọng trong lịch sử của GIS và nhiều người coi CGIS là gốc của hệ thống thông tin địa lý Bởi vì chỉ CGIS tiếp cận theo lớp để xử lý bản đồ Hệ thống CGIS được sử dụng để lưu trữ, phân tích và thao tác trên dữ liệu được thu thập cho Canada land Inventory (sử dụng các đặc tính của đất, hệ thống thoát nước và khí hậu để xác định khả năng trồng các loại cây trồng và các vùng trồng rừng) Họ nhanh chóng nhận ra rằng dữ liệu chính xác và phù hợp nhất là rất quan trọng để quy hoạch đất đai và ra quyết định Trong những năm sau, CGIS đã được chỉnh sửa và cải tiến để theo kịp với công nghệ
Bên cạnh Canada, nhiều trường đại học ở Mỹ cũng tiến hành nghiên cứu và xây dựng hệ thống thông tin địa lý Trong các hệ thống thông tin địa lý được tạo ra cũng có rất nhiều hệ không tồn tại được lâu vì nó được thiết kế cồng kềnh mà giá thành lại cao Lúc đó, người ta đặt lên hàng đầu việc khắc phục những khó khăn nảy sinh trong quá trình xử lý các số liệu đồ họa truyền thống Họ tập trung giải quyết vấn đề đưa bản đồ, hình dạng, hình ảnh, số liệu vào máy tính bằng phương pháp số để xử lý các dữ liệu này Tuy kỹ thuật số hóa đã được sử dụng từ năm 1950 nhưng điểm mới của giai đoạn này chính là các bản đồ được số hóa có thể liên kết với nhau để tạo ra một bức tranh tổng thể về tài nguyên thiên nhiên của một khu vực Từ đó, máy tính được sử dụng và phân tích các đặc trưng của các nguồn tài nguyên đó, cung cấp các thông tin bổ ích, kịp thời cho việc quy hoạch Việc hoàn thiện một hệ thống thông tin địa lý còn phụ thuộc vào công nghệ phần cứng mà ở thời kỳ này, các máy tính IBM 1401 còn chưa đủ mạnh Giai đoạn đầu những năm 60 của thế kỷ XX đánh dấu sự ra đời của hệ thống thông tin địa lý được phục vụ chủ yếu cho công tác điều tra quản lý tài nguyên
Trong năm 1964, Howard T Fisher lập Phòng thí nghiệm Đồ họa máy tính và Phân tích không gian ở Harvard Graduate School of Design, nơi mà một số những khái niệm trong kiểm soát dữ liệu không gian được phát triển và trong những năm 1970 đã phân phối mã nguồn và hệ thống phần mềm như SYMAP, GRID và ODYSSEY (được xem là nguồn của sự phát triển các phần mềm thương mại ngày nay)
Năm 1968, Hội Địa lý học Quốc tế đã quyết định thành lập Ủy ban Thu thập và Xử lý Dữ liệu Địa lý
Trong những năm 1970, ở Bắc Mỹ đã có sự quan tâm nhiều hơn đến việc bảo vệ môi trường và phát triển hệ thống thông tin địa lý Cũng trong khung cảnh đó, hàng loạt yếu tố đã thay đổi một cách thuận lợi cho sự phát triển của hệ thống thông tin địa lý, đặc biệt là sự giảm giá thành cùng với sự tăng kích thước bộ nhớ, tăng tốc độ tính toán của máy tính Chính nhờ những thuận lợi này mà hệ thống thông tin địa lý dần dần được thương mại hóa Đứng đầu trong lĩnh vực thương mại phải kể đến các cơ quan, công ty ESRI, GIMNS,
Intergraph, v.v Chính ở thời kỳ này đã xảy ra “loạn khuôn dạng dữ liệu” và vấn đề phải nghiên cứu khả năng giao diện giữa các khuôn dạng
Năm 1977 đã có 54 hệ thống thông tin địa lý khác nhau trên thế giới Bên cạnh hệ thống thông tin địa lý, thời kỳ này còn phát triển mạnh mẽ các kỹ thuật xử lý ảnh viễn thám Một hướng nghiên cứu kết hợp hệ thống thông tin địa lý và viễn thám được đặt ra và cũng bắt đầu thực hiện
* Giai đ o ạ n 1975 – 1990: Ph ầ n m ề m GIS th ươ ng m ạ i
Khi Chính phủ nhận ra những ưu điểm của bản đồ số, điều này ảnh hưởng tích cực đến công việc tại Phòng thí nghiệm Đồ họa máy tính tại Harvard Vào những năm 1970, Phòng thí nghiệm Đồ họa máy tính Harvard đã phát triển GIS vector đầu tiên, được gọi là ODYSSEY GIS ARC/INFO của ESRI đã sử dụng framwork của ODYSSEY GIS và việc này dẫn đến giai đoạn phát triển tiếp theo trong GIS – thương mại hóa phần mềm GIS Đầu những năm 1980, M&S Computer (mà sau này trở thành Intergraph) cùng với Bentley Systems Incorporated xây dựng nền tảng CAD (Computer Aid Design), ESRI (Environmental Systems Research Institute), CARIS (Computer Aided Resource Information System), ERDAS (Earth Resource Data Analysis System) nổi lên như những phần mềm thương mại GIS, đã thành công trong việc kết hợp phương pháp thời kỳ đầu là tách thông tin không gian và thuộc tính với phương pháp thời kỳ thứ hai là sắp xếp thuộc tính vào trong những cấu trúc CSDL Song song đó, sự phát triển của hai hệ thống công cộng (MOSS và GRASS GIS) bắt đầu từ những năm 1970 đến đầu những năm 1980 Một trong những nhà cung cấp phần mềm GIS là ESRI – hiện là công ty phần mềm GIS lớn nhất trên thế giới Năm 1982, ARC/INFO chạy trên máy tính mini được phát hành và vào năm 1986, PC ARC/INFO đã được giới thiệu trên các máy tính chạy bộ vi xử lý của Intel ESRI hiện tại là chuyên gia hàng đầu thế giới trong việc phát triển phần mềm GIS và đã đóng một vai trò quan trọng trong lịch sử của GIS Ở thời điểm này, có hội nghị đầu tiên và các xuất bản về GIS Hội nghị đầu tiên của GIS diễn ra ở Anh năm 1975, với sự tham gia của các nhóm nghiên cứu nhỏ Hội thảo ESRI tổ chức đầu tiên vào năm 1981 thu hút sự tham gia của 18 thành viên Các nhà tư vấn về GIS đã bắt đầu xuất hiện Thuật ngữ
“Geographic Information System” được Roger Tomlinson đưa ra đầu tiên trong bài báo của ông năm 1968 “A Geographic Information System for Regional Planning”
Thập kỷ 80 được đánh dấu bởi các nhu cầu sử dụng hệ thống thông tin địa lý ngày càng tăng với các quy mô khác nhau Người ta tiếp tục giải quyết những tồn tại của những năm trước mà nổi lên là vấn đề số hóa dữ liệu: sai số, chuyển đổi khuôn dạng, v.v Thời kỳ này có sự nhảy vọt về tốc độ tính toán, sự mềm dẻo trong việc xử lý dữ liệu không gian Thập kỷ này được đánh dấu bởi sự nảy sinh các nhu cầu mới trong việc ứng dụng hệ thống thông tin địa lý như: khảo sát thị trường, đánh giá khả thi các phương án quy hoạch, sử dụng tối ưu các nguồn tài nguyên, các bài toán giao thông, cấp thoát nước, v.v Có thể nói đây là thời kỳ bùng nổ hệ thống thông tin địa lý
Định nghĩa GIS
1.2.1 Các khái niệm chung về GIS
Khái niệm Hệ thống thông tin địa lý được hình thành từ ba khái niệm: Hệ thống; Thông tin; Địa lý và được viết tắt là GIS (Geographyic Infomation Systems)
Khái niệm hệ thống (System): là một tập hợp có tổ chức gồm nhiều phần tử có mối quan hệ ràng buộc lẫn nhau và cùng hoạt động hướng tới mục tiêu chung Hệ thống đề cập đến cách tiếp cận hệ thống của GIS Môi trường hệ thống GIS được chia nhỏ thành các modul để dễ hiểu, dễ quản lý nhưng chúng được tích hợp thành hệ thống thống nhất, toàn vẹn Công nghệ thông tin trở thành quan trọng và hầu hết các hệ thống đều được tiến hành trên cơ sở máy tính
Ví dụ hệ thống được sử dụng trong cuộc sống hằng ngày: hệ thống giao thông, hệ thống truyền thông, hệ thống các trường đại học, v.v
Phần tử có thể là vật chất hoặc phi vật chất: con người, vật chất, máy móc, thông tin, dữ liệu, phương pháp xử lý, quy tắc, quy trình xử lý
Khái niệm thông tin (Information) đề cập đến khối dữ liệu khổng lồ do GIS quản lý
Các đối tượng thế giới thực đều có tập riêng các dữ liệu chữ số hay dữ liệu thuộc tính và các thông tin vị trí cần cho lưu trữ, quản lý các đặc trưng không gian
Khái niệm địa lý (Geographic) được sử dụng ở đây vì GIS trước hết liên quan đến các đặc trưng địa lý hay không gian Các đặc trưng này thể hiện trên đối tượng không gian Chúng có thể là đối tượng vật lý, văn hóa hay kinh tế trong tự nhiên Các đặc trưng trên bản đồ là biểu diễn ảnh của các đối tượng không gian trong thế giới thực thông qua hệ thống biểu tượng, ký hiệu, màu, kiểu đường, v.v
Bản đồ: Theo Hiệp hội Bản đồ Quốc tế (ICS) thì bản đồ là biểu diễn bằng đồ họa tập hợp các đặc trưng trừu tượng và các quan hệ không gian trên bề mặt trái đất Bản đồ cũng là một hệ thông tin Bản đồ là tập hợp các dữ liệu, các thông tin suy diễn được sử dụng vào việc lập quyết định Để hiệu quả, việc biểu diễn thông tin bản đồ phải rõ ràng, dễ sử dụng
Có rất nhiều định nghĩa về “Hệ thống thông tin địa lý”:
– Theo Calkins và Tomlinson (1977): “Hệ thống thông tin địa lý là một hệ thống thông tin bao gồm một số hệ con (subsystem) có khả năng biến đổi các dữ liệu địa lý thành những thông tin có ích”
– Theo Ducker (1979) định nghĩa: “GIS là một trường hợp đặc biệt của hệ thống thông tin, ở đó cơ sở dữ liệu bao gồm sự quan sát các đặc trưng phân bố không gian, các hoạt động sự kiện có thể được xác định trong khoảng không như đường, điểm, vùng” – Pavlidis, 1982: “Hệ thống thông tin địa lý là một hệ thống có chức năng xử lý các thông tin địa lý nhằm phục vụ việc quy hoạch, trợ giúp quyết định trong một lĩnh vực chuyên môn nhất định”
– Theo Goodchild (1985): “GIS là một hệ thống sử dụng cơ sở dữ liệu để trả lời các câu hỏi về bản chất địa lý của các thực thể địa lý”
– Theo Burrough (1986) định nghĩa: “GIS là một công cụ mạnh dùng để lưu trữ và truy vấn, biến đổi và hiển thị dữ liệu không gian từ thế giới thực cho những mục tiêu khác nhau”
– Theo Trung tâm Thông tin và Phân tích Địa lý Quốc gia, 1988: “Hệ thống thông tin địa lý là một hệ thống quản trị cơ sở dữ liệu bằng máy tính để thu thập, lưu trữ, phân tích và hiển thị dữ liệu không gian”
– Theo Aronoff (1989) định nghĩa: “GIS là một hệ thống gồm các chức năng: nhập dữ liệu, quản lý và lưu trữ dữ liệu, phân tích dữ liệu, xuất dữ liệu”
Xét dưới góc độ là công cụ: GIS dùng để thu thập, lưu trữ, biến đổi, hiển thị các thông tin không gian nhằm thực hiện các mục đích cụ thể
Xét dưới góc độ là phần mềm: GIS làm việc với các thông tin không gian, phi không gian, thiết lập quan hệ không gian giữa các đối tượng
Xét dưới góc độ ứng dụng trong quản lý nhà nước: GIS có thể được hiểu như là một công nghệ xử lý các dữ liệu có tọa độ để biến chúng thành các thông tin trợ giúp quyết định phục vụ các nhà quản lý
Xét dưới góc độ hệ thống, GIS là hệ thống gồm các hợp phần: phần cứng, phần mềm, cơ sở dữ liệu và cơ sở tri thức chuyên gia
Xét theo chức năng: GIS là một hệ thống bao gồm ba hệ con: dữ liệu vào, quản trị dữ liệu (quản lý và phân tích dữ liệu) và dữ liệu ra
Hình 1.1 S ơ đồ khái ni ệ m v ề GIS
Trừu tượng hay đơn giản hóa
Thế giới thực Kết quả
Các thành phần và chức năng của GIS
1.3.1 Các thành phần của GIS
Hình 1.2 Các thành ph ầ n c ủ a GIS
Các thành phần cơ bản để tạo nên một hệ GIS bao gồm các thiết bị tin học (phần cứng của hệ thống), chương trình quản trị dữ liệu (phần mềm của hệ thống), nguồn nhân lực sử dụng hệ thống, nguồn dữ liệu và phương pháp sử dụng hệ thống
Phần cứng của GIS là phần cố định mà mắt thường có thể nhìn thấy được, bao gồm: máy vi tính, kết nối mạng, các thiết bị ngoại vi nhập xuất dữ liệu và lưu trữ dữ liệu Các máy tính có thể làm việc độc lập hoặc có thể được đặt vào một mạng liên kết Các thiết bị nhập dữ liệu như bàn số hóa hoặc máy quét dùng để chọn lọc các đặc tính địa lý từ một bản đồ hay ảnh nguồn vào hệ thống máy tính dưới dạng dữ liệu số Vector hay ma trận dạng lưới Người sử dụng có thể thể hiện dữ liệu như bản đồ trên màn hình từ máy tính và các thiết bị ngoại vi như máy quét, máy in
Hình 1.3 Các thành ph ầ n ph ầ n c ứ ng c ủ a GIS
Phần mềm là tập hợp các câu lệnh, chỉ thị nhằm điều khiển phần cứng thực hiện một nhiệm vụ xác định
Hình 1.4 Các ch ứ c n ă ng c ủ a ph ầ n m ề m trong GIS
Nhập và kiểm tra dữ liệu
Lưu trữ và quản lý cơ sở dữ liệu
Tương tác với người dùng Xuất dữ liệu
Trạm xử lý thông tin
Máy in Trang làm việc
Thiết bị nhận dạng (máy scan)
Thiết bị đọc thông tin Ổ đĩa FDD
Phần mềm GIS rất đa dạng và do nhiều hãng khác nhau sản xuất Các phần mềm GIS có thể giống nhau ở chức năng, song khác nhau về tên gọi, hệ điều hành hay môi trường hoạt động, giao diện, khuôn dạng dữ liệu không gian và hệ quản trị cơ sở dữ liệu Theo thời gian, phần mềm GIS phát triển ngày càng thân thiện với người dùng, toàn diện về chức năng và có khả năng quản lý dữ liệu hiệu quả hơn Tuy nhiên, sự gia tăng mạnh mẽ về số lượng người bán phần mềm cũng như năng lực quản lý của GIS đã khiến cho sự lựa chọn phần mềm GIS trở thành một quyết định không đơn giản Sự lựa chọn đó cần phải căn cứ vào mục đích sử dụng, năng lực tài chính và trình độ cán bộ Về quy mô hay mục đích sử dụng, GIS có thể được dùng ở cấp địa phương, cấp quốc gia, khu vực hay toàn cầu, cho giáo dục, nghiên cứu khoa học, quy hoạch và quản lý Do vậy, có thể chọn phần mềm tổng quát hay chuyên dụng Để tạo thuận lợi cho việc kết nối, chia sẻ dữ liệu, nên chọn dùng các hệ đã được tin dùng ở nhiều nơi, các hệ mở dễ thích ứng với những thay đổi và dễ xuất nhập, trao đổi dữ liệu với các hệ khác
Phần mềm GIS bao gồm 4 loại chính dưới đây:
– Desktop GIS: Hệ thống GIS trên máy tính để bàn là những chương trình phức tạp
Cũng như với các công cụ như Photoshop hoặc Microsoft Excel, hầu hết người dùng có thể tìm ra những kiến thức cơ bản khá nhanh chóng, nhưng để trở thành một bậc thầy thực sự có thể mất nhiều năm
– Web GIS: Nếu như trước đó, tại hệ thống GIS dựa trên web khi bạn muốn câu trả lời cho câu hỏi liên quan đến vị trí hoặc để xem hình ảnh trực quan cụ thể, bạn sẽ liên hệ với nhà cung cấp ứng dụng GIS và yêu cầu họ chuẩn bị bản đồ cho bạn Tuy nhiên, với hệ thống Web GIS, người dùng GIS có thể dễ dàng tương tác với bản đồ và trả lời các câu hỏi của riêng họ mà không cần có sự hỗ trợ của đơn vị cung cấp dịch vụ GIS Mặt khác, người dùng có thể tạo lập, biên tập bản đồ hay theo dõi vị trí đối tượng ở bất cứ đâu và bất cứ lúc nào bằng kết nối Internet
Hệ thống Web GIS từng rất tốn kém để phát triển, triển khai và bảo trì Việc lắp đặt, triển khai cần sự tham gia của lập trình viên, máy chủ và quản trị viên hệ thống Nhưng giờ đây, bản đồ có thể được tạo với chi phí rất thấp, chỉ cần vài cái nhấp chuột trong vài phút bằng cách sử dụng trình duyệt Web
– Server GIS: Hệ thống GIS máy chủ phổ biến nhất là cơ sở dữ liệu không gian Cơ sở dữ liệu không gian được sử dụng thay thế cho các định dạng tệp và dữ liệu trước đó Chúng thường được sử dụng trong các trường hợp tập dữ liệu lớn hoặc trong các trường hợp có nhiều người cần truy cập và chỉnh sửa dữ liệu cùng một lúc, có thể từ các vị trí khác nhau
– GIS chuyên dụng: Có nhiều loại ứng dụng GIS chuyên dụng, có thể kể ra một số loại như sau: Giải đoán ảnh là một ứng dụng của GIS chuyên dụng, theo đó hình ảnh của Trái Đất được chuyển thành dữ liệu bản đồ có ý nghĩa, ví dụ: phân loại hình ảnh các loại hoặc lớp sử dụng đất Những bức ảnh hoặc hình ảnh này được chụp bằng kỹ thuật số và được tách thành các dải phổ khác nhau bao gồm phổ khả kiến (đỏ – xanh lá – xanh lam) và những dải khác như hồng ngoại Việc chuyển từ hình ảnh thành thông tin giúp các chuyên gia ra quyết định dễ dàng và chính xác hơn
Lidar: Dữ liệu Lidar được mô hình hóa dưới dạng “đám mây điểm” của thế giới thực, mọi thực thể đều có thể được quét và mô hình hóa với mật độ điểm rất cao và chi tiết nhất Thông qua các ứng dụng chuyên biệt có thể có nhiều sản phẩm từ mô hình đám mây điểm như: mô hình số bề mặt, mô hình 3D, v.v
Phần mềm được sử dụng trong kỹ thuật GIS phải bao gồm các tính năng cơ bản sau:
+ Nhập và kiểm tra dữ liệu (Data Input): Bao gồm tất cả các khía cạnh về biến đổi dữ liệu đã ở dạng bản đồ, trong lĩnh vực quan sát vào một dạng số tương thích Ðây là giai đoạn rất quan trọng cho việc xây dựng cơ sở dữ liệu địa lý
+ Lưu trữ và quản lý cơ sở dữ liệu (Geographic Database): Lưu trữ và quản lý cơ sở dữ liệu đề cập đến phương pháp kết nối thông tin vị trí (Topology) và thông tin thuộc tính (Attributes) của các đối tượng địa lý (điểm, đường đại diện cho các đối tượng trên bề mặt trái đất) Hai thông tin này được tổ chức và liên hệ qua các thao tác trên máy tính
+ Xuất dữ liệu (Display and Reporting): Dữ liệu đưa ra là các báo cáo kết quả quá trình phân tích tới người sử dụng, có thể bao gồm các dạng: bản đồ (Map), bảng biểu (Table), biểu đồ, lưu đồ (Figure) được thể hiện trên máy tính, máy in, máy vẽ, v.v
+ Biến đổi dữ liệu (Data Transformation): Biến đổi dữ liệu gồm hai lớp điều hành nhằm mục đích khắc phục lỗi từ dữ liệu và cập nhật chúng Biến đổi dữ liệu có thể được thực hiện trên dữ liệu không gian và thông tin thuộc tính một cách tách biệt hoặc tổng hợp cả hai
+ Tương tác với người dùng (Query Input): Giao tiếp với người dùng là yếu tố quan trọng nhất của bất kỳ hệ thống thông tin nào Các giao diện người dùng ở một hệ thống thông tin được thiết kế phụ thuộc vào mục đích của ứng dụng đó
Các phần mềm tiêu chuẩn và sử dụng phổ biến hiện nay trong khu vực châu Á là ARCGIS, MAPINFO, ILWIS, WINGIS, SPANS, IDRISIW, v.v Hiện nay có rất nhiều phần mềm máy tính chuyên biệt cho GIS, bao gồm các phần mềm như sau:
Yêu cầu với một hệ GIS
– Xử lý dễ dàng, nhanh chóng với số lượng dữ liệu địa lý lớn;
– Có khả năng tách chọn chi tiết dữ liệu theo miền, vùng hoặc theo chuyên đề;
– Có khả năng tìm kiếm theo các tính chất đặc trưng đặc biệt của một hay nhiều đối tượng địa lý;
– Có khả năng liên kết hoặc hòa nhập các dữ liệu không gian với nhau;
– Có khả năng phân tích các dữ liệu không gian, liên kết các dữ liệu không gian và thuộc tính;
– Có khả năng cập nhật dữ liệu nhanh chóng với chi phí thấp;
– Có khả năng mô hình hóa dữ liệu và đề ra các phương án chọn lựa;
– Có khả năng trao đổi dữ liệu với các hệ thống thông tin khác, có khả năng để phát triển tiếp với các chức năng tiện ích khác;
– Có khả năng kết xuất dữ liệu ra với các hình thức khác nhau
– Khả năng quản lý được lượng lớn thông tin không gian
– Khả năng truy cập các thông tin có liên quan đến sự tồn tại, vị trí cũng như tính chất của một đối tượng không gian
– Tính thích ứng với các đòi hỏi khác nhau của các đối tượng khác nhau.
Mối liên hệ giữa GIS với các ngành khoa học khác
– Ngành Đị a lý: là một lĩnh vực khoa học nghiên cứu về các vùng đất, địa hình, dân cư và các hiện tượng trên Trái Đất Địa lý học gồm hai nhóm ngành khoa học chính là Địa lý tự nhiên và Địa lý kinh tế – xã hội Ngành Địa lý được liên hệ với sự nhận thức thế giới, về vị trí con người trong thế giới GIS cung cấp kỹ thuật để tạo ra sự phân tích và nghiên cứu địa lý
– Ngành B ả n đồ h ọ c: là một ngành khoa học chuyên nghiên cứu và phản ánh cụ thể sự phân bố không gian, sự phối hợp mối liên hệ giữa các đối tượng, hiện tượng trong tự nhiên và xã hội trên bề mặt của Trái Đất thông qua các ký hiệu, hình tượng
Bản đồ có chức năng giống như một công cụ trực quan cho các số liệu trong không gian, v.v Những số liệu này đều được tiến hành đo đạc thực tế trên mặt đất, chụp ảnh hàng không, chụp ảnh vệ tinh và có thể lưu trữ trong cơ sở dữ liệu, từ đó nó được xử lý thành các loại bản đồ cho các mục đích khác nhau
Bản đồ biểu diễn đầy đủ tất cả những đối tượng nói trên chính là bản đồ địa hình Đối với những loại bản đồ chuyên đề sẽ thể hiện nổi bật tất cả những thông tin có liên quan tới chuyên đề đó
Bản đồ là thành phần thể hiện các đối tượng địa lý trên bề mặt trái đất trong hệ GIS
Dữ liệu bản đồ là thành phần chính trong cơ sở dữ liệu của GIS Sự phát triển của ngành Bản đồ sẽ giúp cho GIS hoàn thiện các chức năng xử lý dữ liệu không gian, phong cách thể hiện các dữ liệu bản đồ trong hệ thống và các sản phẩm đầu ra
– Công ngh ệ vi ễ n thám : Viễn thám là kỹ thuật thu nhận thông tin của các đối tượng mà không cần tiếp xúc trực tiếp với các đối tượng đó Ngày nay, ở nước ta cũng như các nước khác trên thế giới, công nghệ viễn thám được sử dụng rộng rãi trong nhiều lĩnh vực như thành lập, chỉnh lý bản đồ địa hình, điều tra hiện trạng sử dụng đất, điều tra thảm thực vật, nghiên cứu tài nguyên môi trường, nghiên cứu biển, nghiên cứu tai biến thiên nhiên Các ảnh vệ tinh và ảnh máy bay là nguồn dữ liệu địa lý quan trọng cho hệ GIS Viễn thám bao gồm cả kỹ thuật thu thập và xử lý dữ liệu mọi vị trí trên Trái Đất với giá rẻ Các dữ liệu đầu ra của hệ thống ảnh vệ tinh có thể được trộn với các lớp dữ liệu của GIS
– Khoa h ọ c đ o đạ c : là một ngành khoa học đo đạc và xử lý các số liệu đo đạc vị trí tọa độ và độ cao, hình dạng, kích thước, phương hướng của địa hình, địa vật nằm trên bề mặt trái đất nhằm mục đích để vẽ lên mặt phẳng giấy
Ngành đo đạc có từ lâu đời tại các nước châu Âu, sản phẩm của ngành có đóng góp quan trọng và liên quan mật thiết đến nhiều lĩnh vực của xã hội, đặc biệt trong hoạt động lập bản đồ địa hình quốc gia, nghiên cứu và quy hoạch, thiết kế, thi công các công trình, quản lý đất đai, quản lý tài nguyên khoáng sản, quản lý rừng, quản lý biến đổi khí hậu, quản lý giao thông, điện lực, viễn thông, thủy lợi, v.v., đây nguồn cung cấp các vị trí cần quản lý có độ chính xác cao cho GIS
– Ngành Toán h ọ c: các chức năng xử lý của GIS luôn gắn liền với các thuật toán cụ thể trong tính toán Sự hoàn thiện trong giải quyết các thuật toán ứng dụng đã giúp cho các nhà lập trình có thêm khả năng mở rộng và hoàn thiện các chức năng GIS, nhất là chức năng xử lý địa lý Toán học là một trong những nền tảng để phát triển và hoàn thiện chức năng bên trong của các phần mềm GIS
– Ngành Th ố ng kê: nhiều mô hình được xây dựng trên cơ sở về mặt bản chất mang tính thống kê Ngoài ra, nhiều kỹ thuật thống kê được sử dụng để phân tích Thống kê đóng vai trò quan trọng trong việc xác định sự phát sinh của các lỗi và tính không xác định của một số liệu khác
– Ngành Truy ề n thông thông tin: các thông tin trong các hệ GIS chỉ có thể trao đổi với nhau thông qua các phương tiện truyền thông Sự phát triển của ngành này sẽ cung cấp cho GIS năng lực liên kết mạng trong máy tính, tạo ra các hệ GIS đa ngành Nếu trước đây phần lớn GIS được sử dụng độc lập với nhau thì ngày nay hầu hết được kết nối thành mạng máy tính sử dụng chung cho các cơ quan khác nhau, đã làm cho các nhà quản lý thấy rõ thêm hiệu quả đầu tư và ích lợi của công nghệ GIS
– Ngành Khoa h ọ c qu ả n tr ị d ữ li ệ u: các nguồn dữ liệu trong GIS được tổ chức và quản lý dựa trên nền tảng nguyên tắc của các phần mềm quản trị dữ liệu Cơ sở dữ liệu cũng là một thành phần cơ bản của GIS Sự phát triển và hoàn thiện của các hệ thống quản trị dữ liệu sẽ giúp cho GIS hoàn thiện các chức năng quản lý cơ sở dữ liệu của mình tối ưu hơn
CÂU HỎI THẢO LUẬN CHƯƠNG 1
1 Liệt kê các mốc lịch sử phát triển của GIS
2 Liệt kê các lĩnh vực ứng dụng của GIS
3 Phân tích sự khác biệt về yêu cầu phần cứng trong hệ thống GIS so với các hệ thông thông tin thông thường
4 Các chức năng chính của GIS nằm trong thành tố nào của GIS? Các chức năng đó là gì?
5 Thông thường, thành phần nào trong GIS thường phải đầu tư chiếm tỷ lệ lớn nhất? Giải thích tại sao?
6 Sự phát triển nhanh và mạnh của GIS gắn liền với ngành khoa học nào? Giải thích tại sao?
CẤU TRÚC DỮ LIỆU GIS
Các khái niệm cơ sở
2.1.1 Bản đồ Đã từ lâu con người đã biết lập ra và sử dụng bản đồ phục vụ cho các hoạt động dân sự và quân sự của mình Bản đồ được xem như là một công cụ truyền thống để biểu diễn hay mô hình hóa các sự vật, hiện tượng hay quá trình trên bề mặt trái đất ở các tỷ lệ và hệ quy chiếu khác nhau
Hình 2.1: Bi ể u th ị c ủ a b ề m ặ t trái đấ t lên m ặ t ph ẳ ng
(Nguồn: Keith Clarke 1995) Đị nh ngh ĩ a b ả n đồ
Bản đồ là sự biểu thị thu nhỏ quy ước của bề mặt trái đất lên mặt phẳng, xây dựng trên cơ sở toán học với sự trợ giúp và sử dụng các ký hiệu quy ước để phản ánh sự phân bố, trạng thái và mối quan hệ tương quan của các hiện tượng thiên nhiên và xã hội được lựa chọn và khái quát hóa để phù hợp với mục đích sử dụng của bản đồ và đặc trưng cho khu vực nghiên cứu
2.1.2 Hệ tọa độ địa lý
Vị trí của một đối tượng bất kỳ trên bề mặt trái đất được xác định theo hai kiểu hệ tọa độ khác nhau: tọa độ địa lý và tọa độ vuông góc trong một lưới chiếu phẳng
Các tọa độ trên bề mặt trái đất bao gồm vĩ độ (latitude) được đo theo đơn vị độ Bắc hoặc Nam của xích đạo, kinh độ (longtitude) được đo theo đơn vị độ Tây hoặc Đông của kinh độ Greenwich ở Anh Vị trí của kinh độ và vĩ độ thực tế chỉ có tính tương đối từ tâm của Trái Đất (Datum)
Các giao điểm của bán trục nhỏ với mặt Ellipsoid trái đất được gọi là các cực Bắc và Nam Các vòng tròn tạo ra do các mặt phẳng thẳng góc với trục nhỏ và cắt Ellipsoid gọi là các vĩ tuyến Vĩ tuyến lớn nhất nằm trên mặt phẳng đi qua tâm Ellipsoid gọi là đường xích đạo
Hình 2.2 H ệ th ố ng các đườ ng kinh tuy ế n, v ĩ tuy ế n
(Nguồn: Understanding Map Projections, ESRI 2004)
Các giao tuyến của các mặt phẳng Ellipsoid với các mặt phẳng đi qua trục quay là những Ellipsoid bằng nhau và còn gọi là các kinh tuyến Vị trí của các điểm trên mặt Ellipsoid trái đất hoặc mặt cầu xác định bằng tọa độ địa lý là vĩ độ () và kinh độ () Qua bất kỳ một điểm nào đó trên bề mặt Ellipsoid kẻ một đường thẳng đứng (pháp tuyến) hướng vào trong Ellipsoid khi cắt mặt phẳng xích đạo, đường pháp tuyến tạo với nó một góc đó chính là vĩ độ địa lý, được tính từ xích đạo, nhận giá trị từ 0 o đến 90 o lên hướng Bắc (độ vĩ Bắc) và từ 0 o đến 90 o xuống hướng Nam (độ vĩ Nam)
Góc giữa các mặt phẳng kinh tuyến đi qua một điểm cho trước và mặt phẳng của kinh tuyến gốc gọi là kinh độ địa lý, ký hiệu Kinh độ tính từ kinh tuyến gốc (kinh tuyến Greenwich) sang phía Đông đến 180 o là kinh độ Đông, từ kinh tuyến gốc sang phía Tây đến 180 o là kinh độ Tây
Hình 2.3 Xác đị nh t ọ a độ đị a lý (kinh độ , v ĩ độ )
2.1.3 Bề mặt Geoid và các dạng hình Ellipsoid
Trái Đất có dạng Geoid, nhưng trong thực tế được coi là hình Ellipsoid có kích thước và hình dạng gần đúng như hình Geoid
20 Đường xích đạo Đường kinh tuyến (các đường kinh độ)
Mạng lưới các đường kinh độ và vĩ độ
Kinh tuyến gốc Đường song song vĩ tuyến
Khi biểu thị lên mặt phẳng một phần nhỏ bề mặt trái đất (trong phạm vi 20 × 20 km) thì độ cong trái đất có thể bỏ qua Trong trường hợp này, các đường thẳng đã đo trên thực địa được thu nhỏ theo tỷ lệ quy định và biểu thị trên giấy không cần hiệu chỉnh độ cong của Trái Đất
Hình 2.4 M ố i quan h ệ gi ữ a b ề m ặ t trái đấ t, Geoid và Ellipsoid
Việc chuyển từ mặt Ellipsoid lên mặt phẳng được thực hiện nhờ phép chiếu bản đồ Các phép chiếu biểu hiện quan hệ giữa tọa độ các điểm trên mặt đất và tọa độ các điểm đó trên mặt phẳng bằng các phương pháp toán học Trong trường hợp này, các phần tử nội dung bản đồ giữ đúng vị trí địa lý, nhưng sẽ có sai số về hình dạng, khoảng cách hoặc diện tích Bề mặt trái đất được biểu thị trên bản đồ với mức độ thu nhỏ khác nhau tại những phần khác nhau của nó, có nghĩa là tỷ lệ ở những điểm khác nhau trên bản đồ cũng khác nhau Có thể biểu thị mặt cầu trái đất trên mặt phẳng theo nhiều cách khác nhau Nếu dùng các phép chiếu khác nhau và tuân theo các điều kiện toán học nhất định đặt ra cho sự biểu thị đó
Bề mặt tự nhiên của Trái Đất rất phức tạp về mặt hình học không thể biểu thị nó bởi một quy luật nhất định nào Trong trắc địa bề mặt tự nhiên trái đất được thay thế bằng mặt Geoid Mặt Geoid là mặt nước biển trung bình yên tĩnh trải rộng xuyên qua lục địa và luôn vuông góc với hướng dây dọi Tuy được định nghĩa đơn giản như vậy song do sự phân bố không đồng đều của các khối vật chất trong vỏ quả đất làm biến đổi hướng trọng lực, nên bề mặt Geoid có dạng phức tạp về mặt hình học
Trong thực tiễn trắc địa bản đồ, người ta lấy mặt Ellipsoid quay có hình dạng kích thước gần giống Geoid làm bề mặt toán học thay cho Geoid Ellipsoid có khối lượng bằng khối lượng Geoid, tâm trùng với trọng tâm của Trái Đất, mặt phẳng xích đạo trùng với mặt phẳng xích đạo trái đất Kích thước của Ellipsoid trái đất được tính theo tài liệu đo đạc trắc địa, thiên văn và trọng lực
Ngoài việc xác định kích thước của Ellipsoid thay cho Geoid, cần phải đặt đúng Ellipsoid ở thể trái đất gọi là định hướng Ellipsoid Định hướng Ellipsoid khác nhau dẫn đến sự khác nhau về tọa độ của một điểm khi tính tọa độ từ những góc khác nhau
Zenith Geoid Đại dương Đáy đại dương Đại dương
Góc lệch so với phương thẳng đứng
Góc lệch so với phương thẳng đứng
Góc lệch so với phương thẳng đứng
Hình 2.5 thể hiện Ellipsoid phù hợp với khu vực và Ellipsoid phù hợp cho toàn cầu
Ví dụ North American Datum 1927 (NAD27) là gốc quy chiếu (Datum) khu vực và phù hợp cho khu vực Bắc Mỹ (Locally Fitting Ellipsoid) World Geodetic System 1984 (WGS84) phù hợp với toàn cầu (Global Fitting Ellipsoid) với gốc quy chiếu trùng với trọng tâm của Trái Đất, thường được sử dụng cho dữ liệu GPS Giữa hai hệ quy chiếu này sẽ có dịch chuyển tâm trái đất, là gốc xác định tọa độ địa lý nên sẽ có sự sai lệch về tọa độ tại một điểm trên bề mặt đất Tuy nhiên, có thể sử dụng phần mềm chuyển đổi giữa các hệ quy chiếu cho dữ liệu địa lý
Hình 2.5 Các d ạ ng hình Ellipsoid khác nhau
Geoid Ellipsoid phù hợp với khu vực Ellipsoid phù hợp toàn cầu
Ellipsoid phù hợp toàn cầu
Ellipsoid phù hợp với khu vực
Khu vực phù hợp nhất
Khu vực ít phù hợp
Bề mặt hình cầu của Trái Đất chỉ có thể được biểu thị đồng dạng trên quả địa cầu, để nghiên cứu bề mặt trái đất một cách chi tiết, chúng ta bắt buộc phải xây dựng bản đồ, vấn đề cần thiết là phải biểu thị bề mặt hình cầu của Trái Đất lên mặt phẳng
Khoảng cách giữa các điểm, diện tích, hình dạng các khu vực trên Trái Đất khi biểu thị lên mặt phẳng không tránh khỏi sự biến dạng, hay nói cách khác có sai số Sự phân bố độ lớn của các sai số này rất khác nhau, phụ thuộc vào độ lớn của lãnh thổ được biểu thị và vị trí của chúng trong hệ tọa độ được sử dụng, chia nhỏ bề mặt nghiên cứu sẽ giảm phần nào các sai số trên, song mất sự liên tục cần thiết cho nghiên cứu khái quát, cũng thực hiện công tác đo đạc ở các vùng giáp ranh Để biểu thị bề mặt Ellipsoid lên mặt phẳng, người ta sử dụng phép chiếu bản đồ Phép chiếu bản đồ xác định sự tương ứng giữa bề mặt Ellipsoid và mặt phẳng, có nghĩa là mỗi điểm trên bề mặt Ellipsoid quay có tọa độ , tương ứng với một điểm duy nhất trên mặt phẳng với tọa độ vuông góc X, Y Lưới chiếu bản đồ đó là cơ sở toán học để phân bố chính xác các yếu tố nội dung bản đồ
Hình 2.7 Các l ướ i chi ế u hình tr ụ , nón và ph ươ ng v ị (Cylindrical, Conical, Arimuthal)
Mô phỏng cầu (Mô phỏng toán học gần với kích thước và hình dạng của Trái Đất) Địa cầu
Dữ liệu GIS
Dữ liệu là một khái niệm rất quan trọng trong các vấn đề lưu trữ và xử lý thông tin Trong một nghĩa giới hạn thì dữ liệu là sự thể hiện của thông tin, thể hiện này phải ở dạng thích hợp cho việc thao tác, truyền phát bởi các phương tiện tự động, thường là các hệ máy tính Trong các hệ máy tính thì dữ liệu được lưu trữ ở dạng nhị phân Trong việc xử lý thông tin trên máy tính, thuật ngữ “data” thường để chỉ các thông tin được xử lý chứ không chỉ các phần mềm, các chương trình xử lý những dữ liệu này Tuy nhiên, nhiều khi thuật ngữ “data” cũng được dùng với nghĩa rộng hơn để chỉ mọi dạng thông tin bao gồm cả các chương trình
Dữ liệu (Data) và thông tin (Information) là hai khái niệm khác biệt nhau Dữ liệu là các con số hay sự kiện được tập hợp có hệ thống cho một hay nhiều mục đích cụ thể Chúng có thể tồn tại dưới nhiều hình thức khác nhau như: ngôn ngữ tự nhiên (tên, tuổi, địa chỉ); biểu thức toán học (y = sin2x); biểu tượng (biển giao thông); tín hiệu (sóng điện từ)
Dữ liệu là thành phần của thông tin, nhưng không phải mọi dữ liệu đều có ích Thông tin chỉ có ích khi nó có liên quan, tin cậy, chính xác, kịp thời, đầy đủ, dễ hiểu, phù hợp và dễ quản lý Hệ thống thông tin có nhiệm vụ chuyển đổi dữ liệu thành thông tin theo các tiến trình khác nhau như biến đổi, tổ chức, cấu trúc hóa và mô hình hóa
Hình 2.15 Ch ứ c n ă ng bi ế n đổ i d ữ li ệ u thành thông tin Đặc điểm dữ liệu trong các hệ thống thông tin địa lý khác biệt với dữ liệu ở các hệ thống thông tin khác (ngân hàng, thư viện, quản lý, giáo dục, y tế, v.v.) ở chỗ chúng bao gồm cả thông tin về vị trí không gian, thậm chí cả các mối liên hệ topo không gian và các thông tin diễn tả thuộc tính của các vật thể trong hệ thống dữ liệu
Dữ liệu địa lý biểu thị các vật thể trên bề mặt trái đất bao giờ cũng được thể hiện trên mặt giấy phẳng hai chiều bằng ba đối tượng chính là: điểm (points), đường (lines) và vùng (polygons) được mã hóa vào trong hệ thống CSDL địa lý Các đối tượng này biểu thị tất cả các vật thể địa lý trên mặt đất để mô hình hóa thế giới thực tế Ngoài các dữ liệu không gian như diễn tả ở trên, trong các hệ thống thông tin địa lý còn tồn tại loại dữ liệu phi không gian hay còn gọi là dữ liệu thuộc tính
Dữ liệu đầu vào Chuyển đổi, sửa chữa, kiểm chứng Tổ chức, cấu trúc dữ liệu
Phân tích, mô hình hóa
Cơ sở dữ liệu Thông tin đầu ra
Hiện nay, người ta có nhiều nguồn dữ liệu hiện đại hơn như ảnh hàng không, ảnh viễn thám Những dữ liệu này cho phép nhìn thấy các sự thay đổi dưới mặt đất theo thời gian như sự xói mòn đất, sự thay đổi của thảm thực vật, rừng, v.v Thế nhưng ảnh viễn thám hay ảnh hàng không không phải là bản đồ Chúng ở khuôn dạng số và lưu trữ trong các đĩa từ Các dữ liệu số thể hiện đối tượng thực tế không ở dạng điểm, đường hay vùng mà chúng ở dưới dạng ma trận điểm, mỗi điểm ảnh được gọi là pixel (picture element) Đây là một nguồn tài liệu hết sức phong phú, khách quan và kịp thời cho nhiều mục đích khác nhau Những người lập bản đồ địa hình, địa lý, địa mạo đều có thể sử dụng dữ liệu này để tách ra các thông tin cần thiết cho mình Quá trình phân tích thông tin trên ảnh được tiến hành theo nhiều phương pháp rất khác nhau và được trợ giúp bởi các công cụ toán học, vật lý học và tin học
Như vậy, trong GIS, dữ liệu tồn tại dưới hai dạng là dữ liệu không gian và dữ liệu thuộc tính:
D ữ li ệ u không gian: là những dữ liệu xác định vị trí của các đối tượng, các vật thể trên bề mặt trái đất, nó trả lời cho câu hỏi đối tượng này có ở đâu? (Where?) Ví dụ: Số liệu đo GPS, bản đồ, ảnh viễn thám, v.v là các số liệu không gian
D ữ li ệ u thu ộ c tính: là các dữ liệu mô tả đặc tính đối tượng, hay nói cách khác, nó trả lời cho câu hỏi đối tượng này là cái gì? (What?), nó như thế nào? (How?) Ví dụ: tên chủ sử dụng, số thửa, loại đất, hạng đất, giá đất, v.v là các số liệu thuộc tính.
Cấu trúc dữ liệu không gian
Cấu trúc là cách hình thức hóa các dữ liệu địa lý, thuộc tính hay không gian với mục đích xử lý ở phía sau Cấu trúc đưa ra một khái niệm là sự liên kết của thông tin, nó rất cần thiết để duy trì chất lượng và cần thiết cho việc cập nhật dữ liệu Cấu trúc được xây dựng tùy thuộc vào khung cảnh cụ thể: tin học (các thuật toán, hệ thống quản lý cơ sở dữ liệu, v.v.), chuyên đề (các xử lý, v.v.) và bản đồ học Cấu trúc được xem xét trên ba phương diện: tổ chức dữ liệu, cấu trúc mô tả, cấu trúc không gian
Dữ liệu không gian được thể hiện ở dạng số và thể hiện trên hai kiểu cấu trúc dữ liệu không gian cơ bản là cấu trúc Raster và cấu trúc Vector
Dữ liệu Vector Dữ liệu Raster
Hình 2.16 Mô hình t ổ ch ứ c d ữ li ệ u trên GIS Điểm
Môi trường xây dựng Mặt nước Rừng Đất ngập nước Vùng
2.3.1 Cấu trúc dữ liệu Vector
Theo quan niệm toán học thì Vector bao gồm một điểm (với cặp tọa độ x, y trong không gian hai chiều hay x, y, z trong không gian ba chiều), cùng với một khoảng cách và một chỉ số hướng
Như vậy, cấu trúc dữ liệu Vector thể hiện chính xác các đối tượng trong thế giới thực lên bản đồ số bằng giá trị liên tục của các cặp tọa độ và xác định chính xác mối quan hệ không gian của các đối tượng
2.3.1.2 Các đố i t ượ ng trong c ấ u trúc d ữ li ệ u Vector
Cấu trúc Vector coi vật thể tự nhiên là tập hợp các đối tượng không gian cơ bản (điểm, đường và vùng) và tổ hợp giữa các đối tượng này Các đối tượng cơ bản này được thành lập trên cơ sở các cặp tọa độ của các điểm trong một hệ tọa độ nhất định
Hình 2.17 Các đố i t ượ ng trong c ấ u trúc d ữ li ệ u Vector
– Đố i t ượ ng đ i ể m (Point): Điểm là dạng đơn giản nhất của số liệu không gian, điểm là đối tượng vô hướng, chỉ có vị trí trong không gian, không có chiều dài Điểm được xác định vị trí bằng một cặp tọa độ Ngoài ra, các dữ liệu mô tả điểm như ký hiệu, tên gọi, v.v cũng được lưu trữ cùng với cặp tọa độ
Hình 2.18 S ố li ệ u Vector đượ c bi ể u th ị d ướ i d ạ ng đ i ể m (Point)
Kiểu thành phần sơ cấp Biểu diễn bằng đồ họa Biểu diễn số Điểm Đường
Tọa độ (x, y) trong 2D và (x, y, z) trong 3D
1 Đường có điểm đầu và cuối trùng nhau
2 Tập các đường nếu vùng có lỗ hổng
– Đố i t ượ ng đườ ng (Line): Đường là đối tượng một chiều, đường không những có vị trí mà còn có cả độ dài, hướng trong không gian Đường được xác định bởi một chuỗi các cặp tọa độ x, y liên tiếp nhau Đường được định nghĩa như là tập hợp các đoạn thẳng
Hình 2.19 S ố li ệ u Vector đượ c bi ể u th ị d ướ i d ạ ng đườ ng (Line)
– Đố i t ượ ng vùng (Polygon): Là đối tượng hai chiều, chúng có vị trí, độ dài và xác định cả độ rộng trong không gian (có diện tích) Đối tượng vùng được tạo bởi một chuỗi các cặp tọa độ với tọa độ điểm đầu và tọa độ điểm cuối trùng nhau Vùng có thể là một đa giác đơn giản hay hợp của nhiều đa giác đơn giản
Hình 2.20 S ố li ệ u Vector đượ c bi ể u th ị d ướ i d ạ ng vùng (Polygon)
M ố i quan h ệ gi ữ a d ữ li ệ u Vector và d ữ li ệ u thu ộ c tính
Sự liên kết giữa dữ liệu Vector và thuộc tính chính là điểm mạnh của các hệ thống thông tin địa lý nhằm tạo ra các khả năng cho các quá trình phân tích và xử lý các số liệu Các dữ liệu không gian và dữ liệu thuộc tính liên kết với nhau qua một cột thuộc tính với một khóa chung (FID – Feature Identifier) và theo mô hình dữ liệu dạng quan hệ
Chỉ số Polygon Label Point
Nodes Điểm (vertex) Điểm đầu
File mô tả arc File tọa độ
Hình 2.21 Liên k ế t d ữ li ệ u Vector và thu ộ c tính
Chú ý rằng cả hai bản ghi tọa độ và thuộc tính đều có phần tử chung là số hiệu đối tượng Số hiệu này dùng để kết nối các thuộc tính với các tọa độ của đối tượng, duy trì liên kết một – một giữa các bản ghi tọa độ và bản ghi thuộc tính Khi phép kết nối được thiết lập, ta có thể truy vấn bản đồ để hiển thị thông tin thuộc tính, hoặc tạo ra bản đồ dựa trên thông tin thuộc tính được lưu trữ trong bảng thuộc tính đối tượng
2.3.1.3 Mô hình t ổ ch ứ c d ữ li ệ u Vector Đối với dữ liệu Vector, có hai loại mô hình được sử dụng phổ biến: mô hình Spaghetti và mô hình Topology
Vùng Tọa độ Đây là dạng mô hình sơ đẳng của dữ liệu Vector, trong đó mỗi đối tượng địa lý được mô tả bằng các thực thể hình học độc lập được biểu diễn bằng tọa độ hoặc bằng các phương trình tham số (đường thẳng, đường cong, đường tròn, v.v.)
Mô hình này rất hữu hiệu đối với công việc thiết kế và trình bày đồ họa, song lại rất hạn chế đối với việc nghiên cứu các quan hệ giữa các đối tượng địa lý vì mỗi đối tượng độc lập với các đối tượng láng giềng
Dữ liệu Spaghetti thường được tạo ra từ việc số hóa thủ công các bản đồ, trong đó ranh giới chung của các đa giác bị lặp lại do phải số hóa hai lần, dẫn đến dư thừa dữ liệu, tốn bộ nhớ và các cung có thể vắt qua nhưng không hề cắt nhau Như vậy, dữ liệu Spaghetti là một tập hợp các điểm và đường không có kết nối Việc lưu trữ và tìm kiếm dữ liệu này là tuần tự và rất mất thời gian
Trong GIS, Topology được dùng để ghi lại và xử lý các mối quan hệ không gian giữa các đối tượng địa lý
Một số thuật ngữ liên quan đến Topology là nút, cung và vùng; trong đó nút là điểm đầu và điểm cuối của một cung và là điểm giao nhau của hai hay nhiều cung; cung là tập hợp các điểm kết nối với nhau và mỗi cung có một điểm đầu và điểm kết thúc; vùng là một đa giác khép kín được tạo thành bởi các cung
Trong các bản đồ số, các mối quan hệ không gian giữa các đối tượng được mô tả bằng cách sử dụng Topology Topology giúp xác lập rõ ràng các mối quan hệ không gian giữa các đối tượng độc lập với tọa độ của chúng Mô hình Topology có năm tính chất như sau:
1) Tất cả các cung có hai điểm nút (đầu và cuối);
2) Tất cả các cung chia hai đa giác;
3) Tất cả các đa giác được bao quanh bởi các cung và điểm nút;
4) Tất cả các điểm được bao quanh bởi các cung và các đa giác;
5) Tất cả các điểm giao nhau nằm ở điểm nút
Hình 2.23 Các đ i ể m nút đượ c bao quanh b ở i m ộ t vòng các cung và đ a giác
Cấu trúc dữ liệu thuộc tính
Dữ liệu phi không gian được liên kết với một đối tượng địa lý không gian được gọi là một thuộc tính Một đối tượng trên bản đồ GIS được liên kết với bản ghi của nó trong bảng thuộc tính bằng một số nhận dạng (Feature Identifier – FID) duy nhất Mỗi đối tượng trong một lớp đều có một mã định danh Vì các đối tượng địa lý trên bản đồ được liên kết với các bản ghi của chúng trong bảng Phần mềm GIS sẽ cho phép bạn nhấp vào đối tượng địa lý bản đồ và xem các thuộc tính liên quan của đối tượng đó trong bảng
Dữ liệu thuộc tính hay là các thông tin đi kèm với các dữ liệu Vector chỉ ra các tính chất đặc trưng cho mỗi đối tượng điểm, đường và vùng trên bản đồ Phần lớn dữ liệu thuộc tính được lưu trữ trong các tệp tin riêng biệt và cấu trúc lưu trữ riêng được xây dựng dựa trên cơ sở dữ liệu quan hệ (Relational Database Management Systems – RDBMS)
Trong ngành Môi trường và Tài nguyên, người ta phân các thông tin thuộc tính thành các nhóm như sau:
– Thông tin đất đai, địa chính: các thông tin về tài nguyên đất, hệ thống thửa đất, đăng ký đất đai, hệ thống thuế đất, định giá đất và tài sản, hệ thống pháp luật đất đai, v.v
– Thông tin môi trường: các thông tin về ô nhiễm môi trường, về hạn hán, ngập lụt, sâu bệnh, về các thảm họa, rủi ro do thiên nhiên gây ra, v.v
– Thông tin cơ sở hạ tầng: gồm các thông tin bổ trợ cho các lớp dữ liệu không gian như thông tin về các loại đường giao thông, hệ thống thủy lợi, thủy văn, về mạng lưới điện, mạng lưói cấp thoát nước, về các công trình cơ sở hạ tầng, v.v
– Thông tin kinh tế – văn hóa – xã hội: các thông tin về mạng lưới hành chính, dân cư, phát triển kinh tế, đầu tư giáo dục, y tế, an ninh quốc phòng, v.v
Các thông tin thuộc tính thường được lưu trữ dưới dạng các tệp tin dữ liệu của các phần mềm GIS như MAPINFO, ARCGIS, ILLWIS dưới dạng các tệp *.DAT, *.DBF
2.4.2 Các mô hình cơ sở dữ liệu thuộc tính
Một CSDL là một tập hợp thông tin về loại vật thể nào đó và các quan hệ giữa chúng Mục đích của việc thu thập dữ liệu và quản lý dữ liệu trong khuôn khổ bất kỳ hệ thống CSDL nào là tốc độ truy cập và cập nhập dữ liệu nhanh chóng và thuận tiện Hệ quản trị CSDL cung cấp các công cụ về nhập dữ liệu, lưu trữ dữ liệu, truy vấn dữ liệu và xuất dữ liệu theo yêu cầu một cách có hiệu suất cao
Cơ sở dữ liệu thuộc tính bao gồm các file dữ liệu mô tả các đối tượng địa lý Các dữ liệu thuộc tính cũng phải được cấu trúc sao cho dễ quản lý và khai thác Các thuộc tính được lưu trữ như một tập hợp các số và ký tự Trong GIS, cơ sở dữ liệu thuộc tính thường bao gồm một số lớn các file Các file dữ liệu thường được tổ chức theo ba mô hình cơ sở dữ liệu sau: phân cấp, mạng và quan hệ Trong đó, mô hình cơ sở dữ liệu quan hệ được sử dụng phổ biến nhất và được coi là hiệu quả nhất
Trong mô hình này, dữ liệu được phân loại theo một đẳng cấp được thiết lập rõ ràng Cấu trúc này rất đơn giản, phù hợp cho một số kiểu quản lý, đặc biệt nếu biết trước các câu hỏi đặt ra Tuy nhiên, nó bị hạn chế khi các dữ liệu không đồng nhất Trong mô hình phân cấp, dữ liệu được tổ chức theo cấu trúc cây Tổ chức phân cấp xác định quan hệ giữa các thực thể và mã hóa chúng trong các bản ghi dữ liệu Đỉnh của cây phân cấp gọi là gốc của cây được biểu diễn bởi một bản ghi dữ liệu có một hoặc nhiều trường
Trừ phần tử gốc và các phần tử ngọn, mỗi phần tử trong cây đều có quan hệ với phần tử mức trên nó gọi là phần tử bố và một hoặc nhiều phần tử mức dưới nó gọi là phần tử con Mỗi phần tử chỉ có một bố và có thể có nhiều con Do đó, trong mô hình phân cấp, các quan hệ được thiết lập có thể là quan hệ 1:1 hay quan hệ n:1 Trong mô hình phân cấp, việc truy cập được thực hiện qua cấu trúc cây, rất thuận lợi cho các bài toán tìm kiếm thông qua đường liên kết trực tiếp giữa hai thực thể Cấu trúc dữ liệu phân cấp có ưu điểm cơ bản là dễ hiểu và dễ cập nhật, tuy nhiên cũng có nhược điểm là khó tìm kiếm thông tin theo thuộc tính
Hình 2.35 Mô hình c ơ s ở d ữ li ệ u phân c ấ p
Mô hình mạng cung cấp các liên kết giữa các mục với nhau trong cơ sở dữ liệu Cấu trúc này rất hiệu quả trong quản lý thông tin địa lý tuyến tính đặc biệt cho thiết lập quan hệ mạng Tuy nhiên, nó làm tăng tính phức tạp qua số liên kết giữa các cây
Mô hình mạng khắc phục sự thiếu mềm dẻo của mô hình phân cấp trong tiến trình truy vấn Trong mô hình mạng, mỗi thực thể có thể có nhiều bố hoặc nhiều con và không nhất thiết phải có thực thể gốc Do đó, khả năng tìm kiếm tốt hơn nhờ cách truy vấn trực tiếp các bản ghi, không qua các thực thể trung gian
Hình 2.36 Mô hình c ơ s ở d ữ li ệ u m ạ ng
Cũng như mô hình phân cấp, mô hình mạng không chấp nhận quan hệ n:n So với mô hình phân cấp, các thông tin về quan hệ trong mô hình mạng phức tạp hơn Những thay đổi hoặc bổ sung quan hệ giữa các thực thể trong mô hình mạng khó thực hiện hơn so với trong mô hình phân cấp
2.4.2.3 Mô hình c ơ s ở d ữ li ệ u quan h ệ Đa số các hệ quản trị cơ sở dữ liệu hiện nay được thiết kế dựa trên mô hình quan hệ Trong mô hình này, dữ liệu được sắp xếp theo các bảng hai chiều chứa các bản ghi và các mối liên hệ của chúng Ưu điểm của hệ này là rất linh hoạt và có thể trả lời mọi loại câu hỏi đặt ra bằng các toán tử logic hay các phép toán (+), (–), (*), (/)
Trong mô hình quan hệ, không có sự phân cấp các trường dữ liệu trong bản ghi (record) Mỗi trường dữ liệu (field) có thể dùng như một khóa dữ liệu (key) Mỗi trường là đặc tính biểu diễn một sự kiện, nhiều trường được nhóm lại thành bảng hai chiều Mỗi bảng được lưu trữ như một file riêng Bảng dữ liệu biểu diễn toàn bộ các quan hệ giữa tất cả thuộc tính trong nó Bảng dữ liệu còn gọi là cơ sở dữ liệu quan hệ
Hình 2.37 Mô hình c ơ s ở d ữ li ệ u quan h ệ
THU THẬP DỮ LIỆU VÀ CHẤT LƯỢNG DỮ LIỆU GIS
Thu thập dữ liệu GIS
Dữ liệu là một trong những thành phần chính của hệ thống thông tin địa lý (GIS) Dữ liệu trong GIS thường được sử dụng để xử lý, phân tích, mô hình hóa, tổng hợp, báo cáo và thành lập bản đồ Dữ liệu GIS có thể được thu thập từ nhiều nguồn và sử dụng nhiều phương pháp khác nhau Người dùng thường ưu tiên khai thác và sử dụng các nguồn dữ liệu có sẵn, còn gọi là dữ liệu thứ cấp Trong trường hợp dữ liệu cần dùng không có sẵn hoặc không đáp ứng được yêu cầu đặt ra, người dùng có thể thu thập các dữ liệu mới, còn gọi là dữ liệu sơ cấp
Với sự phát triển nhanh chóng của khoa học và công nghệ, đặc biệt là công nghệ số, ngày càng có nhiều nguồn dữ liệu GIS thứ cấp được chia sẻ trên các nền tảng Internet Điều này thúc đẩy việc ứng dụng GIS trong nhiều lĩnh vực và khu vực địa lý khác nhau, nhất là đối với các khu vực kém phát triển, chưa có khả năng tạo ra các dữ liệu mới Các phương pháp truyền thống để thu thập dữ liệu sơ cấp như số hóa (digitalization) và quét (scanning) bản đồ giấy thường rất tốn kém thời gian, chi phí và cho độ chính xác không cao Ngày nay, dữ liệu GIS sơ cấp có thể được thu thập từ nhiều nguồn sử dụng các công nghệ tiên tiến với độ chính xác cao như viễn thám, đo đạc thực địa, công nghệ định vị vệ tinh, hoặc chuyển đổi dữ liệu trong GIS Vấn đề thu thập dữ liệu GIS và các nội dung có liên quan được trình bày cụ thể trong các mục dưới đây
Ngày nay, với sự phát triển mạnh mẽ của khoa học kỹ thuật, cùng với xu hướng toàn cầu hóa của thế giới, vấn đề khai thác quản lý thông tin đòi hỏi không chỉ tính xác thực mà còn phải kịp thời Phương pháp chia sẻ truyền thống như nhân bản dữ liệu và chia sẻ qua các ổ cứng di động không đáp ứng được các yêu cầu chia sẻ thông tin Trong những năm gần đây, các cơ quan chính phủ, tổ chức phi chính phủ và doanh nghiệp tư nhân đã phát triển nhiều hệ thống trực tuyến để chia sẻ dữ liệu địa lý (còn gọi là cổng thông tin địa lý – Geoportal) và định hướng người dùng tới những nguồn dữ liệu mà họ mong muốn Phần này trình bày sơ lược về cổng thông tin địa lý và giới thiệu một số nguồn cung cấp dữ liệu GIS thứ cấp được khai thác phổ biến
3.1.1.1 S ơ l ượ c v ề c ổ ng thông tin đị a lý
Thực tiễn cho thấy các dữ liệu không gian địa lý thường được khởi tạo và lưu trữ với sự đa dạng về hệ thống (như Mapinfo, ArcGIS, Geomedia, Linux, Windows, Oracle, SDE,
Shapefile), được quản lý bởi các chủ thể khác nhau thuộc về nhiều cấp, ban ngành, đơn vị với các yêu cầu về xử lý, khai thác khác nhau Các vấn đề này có thể được giải quyết bằng việc thiết lập hạ tầng cơ sở dữ liệu không gian địa lý, cụ thể là các cổng thông tin địa lý (Geoportal)
Cổng thông tin (Portal) là một cổng trực tuyến (website) cung cấp điểm truy cập đến các nguồn tài nguyên khác nhau Khái niệm Portal lần đầu tiên được sử dụng vào năm
1998, dùng để mô tả một hoặc một nhóm trang web mà từ đó người truy cập có thể dễ dàng truy xuất các trang web và các dịch vụ thông tin khác trên Internet Google, Yahoo, AOL, MSN Lợi ích lớn nhất mà cổng thông tin điện tử đem lại là tính tiện lợi, dễ sử dụng và dễ thay đổi, tùy chỉnh cho phù hợp với nhu cầu của từng cá nhân Web Portal thường được phát triển với các tính năng giúp người quản trị thu thập, quản lý nhiều nguồn thông tin khác nhau, từ đó phân phối chúng dưới dạng các dịch vụ cho từng người dùng khác nhau tùy thuộc vào nhóm quyền, vào nhu cầu cũng như mục đích của người dùng đó Cổng thông tin trực tuyến bắt đầu được ứng dụng vào GIS vào những năm đầu của thế kỷ XXI Công nghệ Portal cho GIS cũng tương tự Portal bình thường khác ngoài việc nó thêm vào yếu tố thông tin không gian địa lý Như vậy, có thể định nghĩa một cổng thông tin dữ liệu không gian (GIS Portal) là cổng thông tin cho phép người dùng giao tiếp đến với các tài nguyên thông tin không gian địa lý trực tuyến, bao gồm các tập dữ liệu và các dịch vụ có liên quan Cùng với sự phát triển mạnh mẽ của công nghệ thông tin, hiện nay có nhiều hướng tiếp cận để xây dựng một Geoportal Geoportal có thể được xây dựng dựa trên các nền tảng thương mại như sản phẩm Portal for ArcGIS của công ty ESRI, hoặc sử dụng các nền tảng mã nguồn mở; ví dụ như nền tảng Geoportal của tổ chức Open Geospatial Consortium (OGC), là một bộ phần mềm mã nguồn mở cho phép phát triển hạ tầng cơ sở dữ liệu không gian
Trên phạm vi toàn cầu, có một số hệ thống Geoportal đã rất phát triển và được coi là nguồn cung cấp dữ liệu địa lý phổ biến như USGS Earth Explorer, Google Earth Engine, Open Street Map, ESRI Open Data Hub Chi tiết về các Geoportal này được trình bày trong mục 3.1.1.2 Hầu hết các nước phát triển hiện nay đều đã phát triển các cổng thông tin địa lý để phục vụ cho nhiều ngành và lĩnh vực khác nhau Ở Việt Nam, Chính phủ và các cơ quan quản lý nhà nước đã sớm nhận thấy tầm quan trọng và những lợi ích to lớn từ dữ liệu không gian địa lý mang lại Chính phủ đã tập trung đầu tư để xây dựng hệ thống dữ liệu không gian địa lý phục vụ cho nhu cầu quản lý nhà nước, phát triển kinh tế – xã hội, đảm bảo quốc phòng, an ninh Từ năm 2021, Bộ Tài nguyên và Môi trường chủ trì xây dựng Cổng thông tin không gian địa lý Việt Nam, góp phần phục vụ chia sẻ, chuyển đổi, phân tích, tích hợp, tra cứu và tải các dữ liệu khung và dữ liệu chuyên ngành
3.1.1.2 Các ngu ồ n d ữ li ệ u th ứ c ấ p ph ổ bi ế n
Ngày nay, dữ liệu GIS thứ cấp có thể được chia sẻ và khai thác dễ dàng thông qua các cổng thông tin địa lý Một số cổng thông tin địa lý phổ biến chia sẻ dữ liệu trên toàn cầu được liệt kê trong bảng 3.1
Bảng 3.1 Một số cổng thông tin địa lý phổ biến chia sẻ dữ liệu trên toàn cầu
1 USGS Earth Explorer http://earthexplorer.usgs.gov
2 Google Earth Engine https://earthengine.google.com
3 GEOSS Portal https://www.geoportal.org
4 Open Street Map https://www.openstreetmap.org
5 Natural Earth Data http://www.naturalearthdata.com
6 ESRI Open Data Hub https://hub.arcgis.com
Applications Center (SEDAC) https://sedac.ciesin.columbia.edu
8 Open Topography http://www.opentopography.org
9 UNEP Environmental Data Explorer http://geodata.grid.unep.ch
10 NASA Earth Observations (NEO) http://neo.sci.gsfc.nasa.gov/
11 Sentinel Satellite Data https://scihub.copernicus.eu/dhus
12 Terra Populus https://www.terrapop.org/
13 FAO GeoNetwork http://www.fao.org/geonetwork
14 ISCGM Global Map https://globalmaps.github.io/
Earth Explorer được phát triển bởi Cục Khảo sát Địa chất Hoa Kỳ (United States Geological Survey – USGS) Đây là một trong những cổng thông tin trực tuyến chia sẻ dữ liệu địa lý được sử dụng rộng rãi nhất hiện nay Earth Explorer cung cấp các dịch vụ tìm kiếm, hiển thị và trích xuất dữ liệu GIS một cách nhanh chóng và tiện lợi Cổng thông tin trực tuyến này cung cấp nhiều loại dữ liệu không gian khác nhau nhưng chủ yếu được sử dụng để khai thác dữ liệu ảnh viễn thám vệ tinh và hàng không Một số CSDL trên Earth Explorer chỉ dành cho nước Mỹ và người dùng phải trả tiền cho một số loại dữ liệu nhất định
Google Earth Engine (GEE) là một nền tảng trực tuyến dựa trên công nghệ điện toán đám mây cung cấp miễn phí dữ liệu GIS cho người dùng GEE cung cấp các kho dữ liệu khổng lồ, đa dạng về thông tin và được cập nhật thường xuyên Các nhóm dữ liệu người dùng có thể tìm kiếm trên GEE bao gồm dữ liệu ảnh vệ tinh, khí hậu và thời tiết, sử dụng đất, địa hình Ngoài việc truy cập các nguồn dữ liệu gốc được cung cấp bởi các cơ quan đối tác của Google (như NASA), GEE cũng cho phép người dùng chia sẻ dữ liệu thứ cấp là sản phẩm của các nghiên cứu (như bản đồ thực phủ và sử dụng đất)
Người dùng có thể dễ dàng truy cập vào đám mây dữ liệu, đồng thời ứng dụng các hàm phân tích có sẵn để tạo ra kết quả mong muốn Điều này giải quyết được một vấn đề cực lớn cho các nhà khoa học, đó là làm thế nào để truy cập dễ dàng kho dữ liệu vệ tinh ngày càng nhiều cũng như cho phép họ dễ dàng tìm kiếm những bộ dữ liệu liên quan Hệ thống GEE sử dụng công nghệ điện toán đám mây cho phép đọc nhiều loại định dạng dữ liệu khác nhau, chia sẻ và tích hợp chúng lại Nhờ đó, GEE không chỉ tạo ra một cơ sở hạ tầng với quy mô Petabyte, mà cả các hàm API, ngôn ngữ lập trình JavaScript và Python, giúp xử lý khá nhiều dữ liệu khác nhau, ngay cả dữ liệu chiếu sáng đô thị về đêm chụp từ vệ tinh
Open Street Map (OSM) là một dịch vụ trực tuyến bản đồ thế giới với nội dung mở (miễn phí) OSM ra đời nhằm mục đích cung cấp dữ liệu địa lý do nhiều người cùng cộng tác với nhau trên hệ thống wiki Do đó, OSM còn được gọi là “Wikipedia của bản đồ” OSM được xây dựng với mục đích cung cấp một nguồn dữ liệu địa lý thay thế các nguồn từ các cơ quan chính phủ vốn kèm theo nhiều điều khoản sử dụng quá chặt chẽ
OSM cung cấp nguồn dữ liệu bản đồ mở, cho phép ai cũng có thể được truy cập, sửa đổi và chia sẻ Người dùng GIS trên toàn cầu đang khai thác OSM như một nguồn dữ liệu từ cộng đồng đông đảo người dùng khắp mọi nơi trên thế giới Với số lượng cộng tác viên đông đảo, kho dữ liệu này ngày càng trở nên chi tiết và cập nhật Tuy nhiên, mặt trái của bộ dữ liệu này là khi nó được mở ra cho cộng đồng thì độ chính xác của dữ liệu cũng rất khó kiểm soát Hầu hết người dùng GIS đánh giá dữ liệu của OSM là khá tốt và ngày càng được hoàn thiện hơn
ESRI Open Data Hub cung cấp một nguồn dữ liệu GIS quý giá Kho dữ liệu của hãng phần mềm GIS nổi tiếng thế giới cung cấp miễn phí gần 70.000 bộ dữ liệu mở từ hơn 4.000 tổ chức trên khắp thế giới Trong một số trường hợp, vì lý do dữ liệu quá lớn, người dùng cần phải chia nhỏ chúng ra rồi ghép nối lại sau khi tải về máy tính của mình Cổng thông tin trực tuyến ESRI Open Data Hub có giao diện thông minh và dễ dàng sử dụng, giúp người dùng nâng cao khả năng tìm được dữ liệu địa lý theo mong muốn
Chất lượng của dữ liệu GIS
Một trong những yêu cầu đầu tiên và quan trọng nhất của các ứng dụng GIS là chất lượng của dữ liệu Chất lượng dữ liệu đầu vào sẽ ảnh hưởng đến chất lượng của sản phẩm đầu ra Do đó, dữ liệu thường phải được chỉnh sửa, bổ sung và chuẩn hóa để đạt được chất lượng theo các yêu cầu trước khi ứng dụng trong một dự án GIS Để mô tả hay đánh giá chất lượng dữ liệu, người ta sử dụng một loạt các yếu tố chất lượng như độ chính xác về vị trí, quan hệ Topology, độ chính xác về thuộc tính, độ chính xác về thời gian, sự đầy đủ và độ phân giải, lịch sử và việc sử dụng dữ liệu
3.2.1 Độ chính xác về không gian
Dữ liệu không gian thu thập bằng các phương pháp số hóa và đo đạc thực địa thường có các sai số hoặc sai sót nhất định có thể phải được chỉnh sửa và bổ sung trước khi sử dụng Trong khi đó, các nguồn dữ liệu thứ cấp (xem mục 3.1.1) có thể đã quá cũ và không phản ánh đúng và đầy đủ thông tin theo yêu cầu Các dữ liệu GIS thứ cấp có thể được cập nhật, bổ sung bằng nhiều phương pháp khác nhau như sử dụng dữ liệu ảnh viễn thám hàng không và vệ tinh, công nghệ Mobile/Web GIS và GNSS Hiện nay, công nghệ Web GIS cho phép người dùng có thể thực hiện một số thao tác chỉnh sửa đơn giản như thêm, xóa hoặc chỉnh sửa đối tượng trên các nền tảng trực tuyến
Cấu trúc dữ liệu Raster ở dạng ô lưới hoặc pixel do đó không thể thực hiện chỉnh sửa dữ liệu trực tiếp đối với dữ liệu Raster Đối với cấu trúc Vector, dữ liệu có thể chứa sai số vị trí hoặc quan hệ Topology Sai số vị trí là độ lệch của vị trí địa lý và đặc điểm hình học của một đối tượng trên bản đồ so với vị trí, hình dạng thực của nó trên mặt đất Sai số vị trí có thể được khắc phục bằng các thao tác chỉnh sửa đối tượng cơ bản Trong khi đó, sai số Topology là sự thiếu chính xác trong các mối quan hệ logic giữa các đối tượng không gian Theo luật Topology trong GIS, các đa giác liền kề nhau phải có các ranh giới chung, các đường phải nối với nhau theo mạng logic, các đa giác phải được khép kín Sai số Topology có thể được khắc phục bằng cách sử dụng các bộ công cụ xử lý lỗi trong các phần mềm GIS Dữ liệu Vector lưu trữ dưới các định dạng SHP và CAD không bao gồm các mối quan hệ không gian giữa các đối tượng, do vậy chúng thường có các sai số Tologogy Sai số dữ liệu trong GIS có thể phải được xử lý cho nhiều lớp dữ liệu để đảm bảo sự đồng nhất Ví dụ, lớp đường ranh giới của xã A phải trùng khớp chính xác với lớp đường ranh giới của xã liền kề B Sự thiếu đồng bộ giữa các lớp dữ liệu sẽ gây ra các sai số thứ cấp khi thực hiện các bước xử lý như chồng xếp bản đồ Phạm vi chỉnh sửa dữ liệu còn phức tạp hơn đối với các CSDL địa lý do mối quan hệ Topology không chỉ được tạo ra cho các đối tượng trên cùng một lớp dữ liệu và còn được tạo ra giữa các lớp dữ liệu với nhau
3.2.2 Sai số về vị trí
Sai số vị trí trong GIS đề cập đến độ chính xác về mặt vị trí địa lý và hình dạng hình học của các đối tượng trên bản đồ so với vị trí, hình dạng thực của nó trên mặt đất Trong đo vẽ bản đồ thông thường, độ chính xác tỷ lệ thuận với tỷ lệ bản đồ Ví dụ, bản đồ tỷ lệ 1:500 sẽ chính xác hơn bản đồ tỷ lệ 1:2000
Sai số vị trí đối với dữ liệu số hóa
Nếu nguồn dữ liệu của GIS là dữ liệu thứ cấp hoặc dữ liệu tương tự như bản đồ giấy thì độ chính xác về vị trí có thể xác định bằng cách so sánh bản đồ số hóa với dữ liệu gốc Tuy nhiên, không có một tiêu chuẩn chung có thể áp dụng cho tất cả các trường hợp để lượng hóa độ chính xác của vị trí trên bản đồ số hóa Khi số hóa bản đồ, kỹ thuật viên có thể quyết định mức độ sai lệch về vị trí căn cứ vào các quy định, quy phạm thành lập bản đồ, các yếu tố chất lượng dữ liệu đầu vào và độ phân giải của bàn số hóa Ví dụ, nếu quy định sai số cho phép của đối tượng đường là 0,25 mm so với vị trí của nó trên bản đồ gốc thì sai số vị trí trên thực địa sẽ khoảng 6,25 m ở tỷ lệ bản đồ 1:25.000 Hình 3.7 minh họa một số ví dụ về sai số vị trí đối với đối tượng đường
Hình 3.7 M ộ t s ố ví d ụ v ề sai s ố v ị trí trong s ố hóa b ả n đồ Đường đậm là đối tượng số hóa, đường nhạt thể hiện các đối tượng trên bản đồ gốc
Mức độ sai số vị trí của các đối tượng trên bản đồ số hóa phụ thuộc vào nhiều yếu tố khác nhau Một số yếu tố chủ yếu bao gồm:
– Chất lượng của bản đồ gốc: Về mặt lý thuyết, độ chính xác cao nhất của bản đồ số hóa sẽ chỉ bằng độ chính xác của bản đồ gốc (tuy nhiên điều này rất khó đạt được) Độ chính xác của bản đồ gốc thường phụ thuộc và mức độ khái quát hóa, tức là tỷ lệ bản đồ
Tỷ lệ bản đồ càng nhỏ thì mức độ khái quát hóa càng lớn và độ chính xác càng thấp – Mật độ các điểm dùng để biểu diễn đối tượng: Khi số hóa các đường hay đa giác, độ chính xác tăng khi khoảng cách giữa các điểm được số hóa giảm (tức là số lượng điểm tăng)
– Lỗi do con người: sai sót do con người gây ra trong quá trình số hóa là điều khó tránh khỏi Mức độ sai sót do con người phụ thuộc vào kinh nghiệm và sự tập trung của kỹ thuật viên
– Sai sót từ phần mềm quét dữ liệu và số hóa đối tượng: Các phần mềm số hóa thường gặp lỗi khi các đối tượng trên bản đồ gốc phức tạp, như đối tượng đường và vùng nằm sát nhau, giao nhau Sai số vị trí gây ra do phần mềm số hóa có thể dẫn tới các lỗi như thiếu, thừa hoặc gộp đường (hình 3.7)
– Các yếu tố khác: Độ chính xác của dữ liệu số hóa cũng phụ thuộc vào số con số có nghĩa mà máy tính cho phép lưu trữ Các chuyển đổi dữ liệu từ Vector sang Raster và ngược lại cũng dẫn đến sự giảm độ chính xác về vị trí Chuyển đổi hệ tham chiếu không gian sau khi số hóa cũng là một trong những nguyên nhân phổ biến gây ra các sai số vị trí của đối tượng Để nâng cao độ chính xác về vị trí, chúng ta có thể sử dụng các phương pháp khác nhau như đo đạc độc lập, đánh giá chủ quan và điều chỉnh Trong đó, đo đạc độc lập là phương pháp thường được sử dụng nhất
Sai s ố v ị trí đố i v ớ i d ữ li ệ u vi ễ n thám và GNSS
Khác với dữ liệu số hóa, độ chính xác về vị trí của dữ liệu ảnh vệ tinh và GNSS phụ thuộc vào khả năng của thiết bị đo đạc hoặc thu thập thông tin không gian Đối với dữ liệu GNSS, độ chính xác về vị trí chủ yếu phụ thuộc vào loại thiết bị thu tín hiệu (như phân tích ở mục 3.1.2.2) và các yếu tố ngoại cảnh như địa hình, địa vật và điều kiện thời tiết Sai số vị trí của dữ liệu GNSS có thể từ vài mm đến hàng chục m Trong khi đó, dữ liệu viễn thám thường được thu nhận và lưu trữ dưới dạng Raster nên độ chính xác về vị trí của đối tượng phụ thuộc vào độ phân giải không gian dữ liệu Độ phân giải không gian của ảnh vệ tinh có thể trong khoảng 1 – 1000 m
3.2.3 Sai số quan hệ Tolology
Trong GIS, mối liên kết Topology trong dữ liệu phải thỏa mãn những yêu cầu đặt ra về các mối quan hệ giữa các đối tượng dựa trên các nhiệm vụ cần thực hiện Các đa giác liền kề nhau phải có các ranh giới chung, các đường phải nối với nhau theo mạng Topology, các đa giác phải được khép kín Sai số trong quan hệ Topology thường khó đo lường Trong bất kỳ trường hợp nào, chất lượng phụ thuộc vào việc sử dụng các chương trình kiểm tra khi dữ liệu được đưa vào
Các quan hệ Topology trong dữ liệu không gian rất quan trọng đối với người sử dụng GIS Người biên tập bản đồ có thể làm việc tốt với các dữ liệu Spaghetti, tuy nhiên, Topology kém chất lượng có thể sẽ làm phức tạp hoặc gây sai số trong nhiều chức năng GIS như chồng ghép hay phân tích mạng
Sai s ố Topology gi ữ a các đố i t ượ ng không gian
Hình 3.8 L ỗ i Topology th ườ ng g ặ p v ớ i đố i t ượ ng vùng
(a) Vùng không khép kín; (b) Vùng chồng lặp
Các lỗi Topology giữa các đối tượng không gian có thể phân loại theo điểm (nút), đường (cung) và vùng (bề mặt) Vùng là đối tượng hai chiều được tạo thành bởi một cung khép kín Các sai số Topology thường xảy ra với đối tượng dạng vùng bao gồm vùng không khép kín (un-closed boundary), chồng lặp (overlap), thiếu hụt (gaps) dữ liệu Lỗi chồng lặp vùng thường xảy ra khi một vùng được tạo ra/số hóa nhiều lần hoặc các vùng có một phần ranh giới chồng xếp lên nhau Đường là đối tượng một chiều với điểm (nút) khởi đầu và điểm kết thúc Các lỗi Topology phổ biến với đối tượng đường bao gồm đường bị đứt đoạn (dangling), nút giả (pseudo nodes) và đường chồng xếp lên nhau
QUẢN LÝ, PHÂN TÍCH VÀ KẾT XUẤT DỮ LIỆU GIS
Quản lý dữ liệu
4.1.1 Khái quát về quản lý dữ liệu
Về mặt chuyên môn, thuật ngữ “quản lý dữ liệu” bao gồm việc tổ chức, sắp xếp, tìm kiếm và bảo trì dữ liệu; thuật ngữ này còn bao hàm cả việc đảm bảo các thiết bị phần cứng, phần mềm và kiểm soát việc sử dụng các thiết bị này
Chức năng quản lý dữ liệu của GIS được trợ giúp bởi hệ quản trị CSDL; đó là một phần mềm cho phép một hoặc nhiều người làm việc với dữ liệu một cách có hiệu quả Các hợp phần căn bản của hệ phải cung cấp các phương tiện để xác định nội dung của CSDL, đưa vào dữ liệu mới, xóa dữ liệu cũ, hỏi về nội dung CSDL và thay đổi nội dung CSDL
Xác đị nh n ộ i dung t ổ ch ứ c d ữ li ệ u
Bước đầu tiên trong quản lý dữ liệu là việc xác định nội dung của CSDL với các thông tin cần thiết về khuôn dạng dữ liệu, nội dung dữ liệu và các hạn chế giá trị
+ Định nghĩa khuôn dạng dữ liệu đề cập đến kiểu dữ liệu như kiểu số, số nguyên, ký tự, số thập phân, ngày tháng, v.v và lượng bộ nhớ cần lưu trữ hay trình bày dữ liệu
+ Định nghĩa nội dung dữ liệu đề cập đến tên các trường hay các mục trong CSDL Nên sử dụng các tên cụ thể như: kinh độ, vĩ độ, độ pH, nồng độ oxy hòa tan, v.v
+ Các hạn chế giá trị đề cập đến việc người sử dụng đưa vào trong hệ thống các hạn chế về giá trị dữ liệu để kiểm chứng các giá trị mới đưa vào Ví dụ như các hạn chế về số tháng trong năm hay số phút trong một giờ hay kinh độ, vĩ độ của một vùng lãnh thổ Đồ ng b ộ , an toàn d ữ li ệ u
Hệ quản trị CSDL phải cung cấp các công cụ để đảm bảo sự an toàn, toàn vẹn, đồng bộ hóa, độc lập và giảm thiểu dư thừa dữ liệu
+ An toàn dữ liệu đề cập đến việc hạn chế các hình thức tiếp cận CSDL bởi người sử dụng dữ liệu, bảo vệ dữ liệu khỏi bị tiết lộ một cách tình cờ hay cố ý và bị thay đổi hay phá hoại bởi những người không được ủy quyền Như vậy, chỉ có những người có đầy đủ hiểu biết, thẩm quyền mới được phép thay đổi nội dung CSDL
+ Để đảm bảo sự toàn vẹn của CSDL, hệ quản trị CSDL kiểm tra các yếu tố được đưa vào để thực thi các ràng buộc cấu trúc cần thiết của dữ liệu bên trong như kiểm tra các giá trị cho phép trong các trường dữ liệu, ngăn ngừa việc xóa nút khi vẫn còn các cung được xác định dựa trên nút đó, v.v
+ Sự đồng bộ hóa đề cập đến các hình thức bảo vệ chống lại sự không nhất quán có thể phát sinh do nhiều người sử dụng đồng thời CSDL Một ví dụ minh họa là khi có hai người cùng tiếp cận một lớp dữ liệu về sử dụng đất trong CSDL, trong đó người thứ nhất thì cập nhật dữ liệu còn người thứ hai tìm cách phân tích dữ liệu và như vậy, kết quả phân tích sẽ thay đổi theo thời gian và làm thất vọng người thứ hai nếu như không có một cơ chế cảnh báo hay ngăn ngừa người thứ hai tiếp cận CSDL cho đến khi người thứ nhất hoàn tất thao tác của mình
+ Sự độc lập dữ liệu vật lý thể hiện ở chỗ sự lưu trữ dữ liệu và phần cứng điều khiển không được ảnh hưởng đến người sử dụng CSDL Nó cho phép ta thay đổi phần cứng khi cần thiết và khi công nghệ thay đổi thì không phải viết lại phần mềm điều khiển dữ liệu liên quan
+ Dư thừa dữ liệu là một điều hoàn toàn không mong muốn trong một CSDL Một ví dụ là trường hợp lưu dữ liệu Vector spaghetti biểu diễn các đối tượng vùng Sự dư thừa dữ liệu sẽ làm phức tạp việc cập nhật dữ liệu và giảm tốc độ xử lý Do vậy, tối thiểu hóa sự dư thừa dữ liệu là một mục tiêu đặt ra đối với một CSDL
Hiệu quả tìm kiếm dữ liệu nói chung phụ thuộc vào các yếu tố như khối lượng dữ liệu lưu trữ, phương pháp mã hóa dữ liệu, cấu trúc CSDL và tính phức tạp của yêu cầu đặt ra Khối lượng dữ liệu lưu trữ thể hiện ở số lượng các file và kích cỡ file dữ liệu trong CSDL Nó ảnh hưởng đến tốc độ tìm kiếm dữ liệu, đặc biệt là khi cần tìm kiếm hết cả CSDL
Phương pháp mã hóa dữ liệu bao gồm quyết định về các loại biến cần lưu trữ cũng như cách thức lưu trữ các giá trị
Cấu trúc CSDL liên quan đến các mô hình dữ liệu và cách thức tổ chức các file dữ liệu trong CSDL địa lý (xem thêm phần cấu trúc dữ liệu và CSDL) ảnh hưởng đến khối lượng dữ liệu và tốc độ tìm kiếm dữ liệu
Tính phức tạp của yêu cầu về CSDL thể hiện ở loại và lượng các yêu cầu đặt ra như tìm kiếm một đối tượng, một tập hợp các đối tượng hay toàn bộ các đối tượng thỏa mãn các điều kiện nào đó
Phân tích dữ liệu
4.2.1 Khái quát chức năng phân tích dữ liệu trong GIS
Một đặc điểm cơ bản để phân biệt GIS với các hệ thống thông tin khác đó là khả năng thực hiện phân tích không gian để giải đáp cho những câu hỏi và các vấn đề về không gian Một hệ thống thông tin địa lý cho phép thực hiện một cách đa dạng các kỹ thuật mô hình hóa và các chức năng trợ giúp người sử dụng GIS trong quá trình phân tích này Phân tích dữ liệu là rút ra những thông tin và kết luận từ việc nghiên cứu dữ liệu và là công việc của mỗi ngành nghề, mỗi nhà chuyên môn khi ứng dụng GIS Phân tích dữ liệu và mô hình hóa không gian được xem là phần cốt lõi, phần trọng tâm và là chức năng quan trọng nhất của GIS Phân tích dữ liệu không gian bao gồm việc sử dụng các phép toán để sắp xếp các dữ liệu đó cũng như các dữ liệu thuộc tính có liên quan Quá trình phân tích dữ liệu địa lý có thể được mô tả như sau:
Hình 4.5 Phân tích d ữ li ệ u đị a lý trong GIS
Các ứng dụng GIS được hình thành từ những câu hỏi thực tế đã được đặt ra đối với dữ liệu liên quan đến vị trí không gian Những câu hỏi phổ biến là:
– Có những gì ở một vị trí địa lý nhất định (phân tích vị trí)?
– Khi nào thì một số điều kiện về vị trí địa lý được thỏa mãn?
– Các vật thể và quá trình đã thay đổi như thế nào theo thời gian?
– Các dữ liệu không gian có dạng như thế nào?
– Điều gì sẽ xảy ra nếu ta thay đổi một số điều kiện?
Các phép toán không gian có thể được sử dụng liên tiếp nhau để giải quyết vấn đề nào đó Mỗi phép toán không gian sẽ tạo ra một sản phẩm đầu ra và sản phẩm đó có thể được sử dụng như dữ liệu đầu vào của các phép toán khác Một phần thách thức của việc phân tích dữ liệu không gian đó là việc lựa chọn các phép toán không gian thích hợp và ứng dụng chúng theo các trật tự thích hợp
Hình 4.6 Chu ỗ i các phép phân tích không gian liên t ụ c trong GIS
Việc phân tích dữ liệu không gian thường sử dụng dữ liệu từ một hay nhiều lớp dữ liệu để tạo ra dữ liệu đầu ra Phép phân tích có thể gồm có một phép toán đơn lẻ sử dụng cho một lớp dữ liệu hoặc nhiều phép toán có khả năng kết hợp dữ liệu đầu vào từ nhiều lớp dữ liệu để tạo ra dữ liệu đầu ra mong muốn
Trong các phép phân tích dữ liệu không gian, có thể có một hay nhiều dữ liệu đầu vào hay đầu ra Nhiều phép toán chỉ đòi hỏi một lớp dữ liệu đầu vào và tạo ra một lớp dữ liệu đầu ra; ví dụ như phép chuyển đổi dữ liệu Vector sang Raster Cũng có các phép toán tạo ra một vài lớp dữ liệu đầu ra từ một đầu vào hay đòi hỏi một số đầu vào để tạo ra một lớp dữ liệu đầu ra Các hàm phân tích địa hình có thể sử dụng lưới Raster về độ cao như là một lớp dữ liệu đầu vào và tạo ra cả dữ liệu độ dốc (mỗi pixel có độ dốc như thế nào?), dữ liệu về hướng địa hình (độ dốc ở một vị trí nào đó có hướng như thế nào?) Lớp dữ liệu trung bình là một ví dụ của việc sử dụng nhiều lớp dữ liệu đầu vào để tạo nên một lớp dữ liệu đầu ra
Hình 4.7 Phép phân tích không gian
Trong GIS, việc phân tích hay khai thác dữ liệu có thể được thực hiện ở các mức độ sau:
+ Dữ liệu thuộc tính trong các bảng được sắp xếp lại để trình bày trong các báo cáo hay sử dụng ở các hệ máy tính khác
+ Các thao tác được thực hiện trên các dữ liệu hình học hay ở chế độ tìm kiếm hay vì các mục đích tính toán
+ Các thao tác logic, số học và thống kê được thực hiện ở các bảng thuộc tính
+ Hình học và bảng thuộc tính được dùng chung để lập các bộ dữ liệu mới dựa trên các thuộc tính gốc và phát sinh; hay lập bộ dữ liệu mới dựa trên các mối quan hệ địa lý Nói cách khác, phân tích dữ liệu bằng GIS có thể được xếp thành ba nhóm:
+ Hỏi đáp cơ sở dữ liệu là đơn thuần lấy ra thông tin có sẵn trong cơ sở dữ liệu + Lập bản đồ phát sinh là quá trình tạo ra các lớp dữ liệu mới từ các lớp dữ liệu cũ bằng cách lấy thông tin có sẵn và thêm vào đó thông tin mới là sự hiểu biết về mối quan hệ giữa các yếu tố cơ sở dữ liệu Ví dụ như ta có thể tạo ra bản đồ nguy cơ xói mòn đất từ bản đồ đất, bản đồ độ cao địa hình và bản đồ chế độ lượng mưa nếu ta biết quan hệ giữa các nhân tố đó
+ Mô hình hóa quá trình là một lĩnh vực mới của GIS dựa trên khái niệm là cơ sở dữ liệu không chỉ biểu diễn môi trường thực mà chính nó cũng là một môi trường, do đó, cơ sở dữ liệu GIS đóng vai trò như một phòng thí nghiệm để tìm hiểu các quá trình
4.2.2 Các chức năng phân tích dữ liệu Vector
Phân loại là một phép toán dữ liệu không gian thường được sử dụng kết hợp với phép lựa chọn Phép phân loại còn được biết đến như là việc phân loại lại hay ghi lại với mục đích phân chia các đối tượng địa lý dựa vào một hay nhiều điều kiện nào đó
Phép phân loại có thể được sử dụng cho nhiều mục đích khác nhau Một trong những mục đích phổ biến đó là nhóm gộp các đối tượng để hiển thị hay xuất bản các bản đồ Các đối tượng này thường có một thuộc tính chung và mục đích cần đạt được là hiển thị chúng theo một màu sắc hay biểu tượng thống nhất, như vậy các đối tượng tương tự nhau sẽ được nhận biết theo nhóm Màu sắc hay hoa văn được hiển thị thường phụ thuộc vào giá trị của một hay nhiều thuộc tính Một dãy màu sắc biến chuyển đậm nhạt hay từ màu này sang màu khác sẽ được lựa chọn và các giá trị tương ứng cho mỗi thuộc tính cụ thể được xác định Sau đó, bản đồ sẽ được hiển thị dựa vào sự phân loại đó
Phép phân loại còn có thể được thực hiện đối với nhiều thuộc tính khác nhau của các đối tượng Việc phân loại ghép trên cơ sở hai hay nhiều thuộc tính cho phép ta có thể nhận biết được quan hệ giữa các loại thuộc tính này trên cùng một đối tượng cũng như nhiều đối tượng lân cận nhau Điều này có thể mang lại nhiều thông tin hơn cho người sử dụng
Ví dụ, tất cả các vùng có diện tích rừng lớn hơn 75,1 đến 155,1 ha được phân loại vào nhóm có diện tích lớn, diện tích từ 27,2 ha đến 75 ha được xếp vào nhóm có diện tích trung bình và từ 0 đến 27,1 km 2 được xếp vào nhóm có diện tích nhỏ Như vậy, kết quả phân loại được thể hiện trên hình 4.8
Hình 4.8 K ế t qu ả phân lo ạ i theo di ệ n tích đấ t
Phép lựa chọn bao gồm việc nhận biết các thực thể thỏa mãn một hay nhiều điều kiện hay tiêu chí nào đó Các thuộc tính hay đặc điểm hình học của các thực thể được kiểm tra dựa vào các tiêu chí và chỉ những gì thỏa mãn các tiêu chí mới được lựa chọn Các thực thể được lựa chọn đó có thể được ghi lại lên trên một lớp dữ liệu mới hoặc dữ liệu hình học hay thuộc tính của chúng được lưu lại theo một vài cách khác nhau
Hình 4.9 minh họa một ví dụ của phép lựa chọn bao gồm cả phần thuộc tính của một bộ dữ liệu không gian Hai điều kiện được sử dụng và các đối tượng thỏa mãn cả hai điều kiện đó được lựa chọn a Huyện A b Các huyện giáp Huyện A c Các huyện có diện tích lớn hơn 300 km 2 d Các huyện giáp huyện A có diện tích >
Hình 4.9 Phép truy v ấ n d ự a trên nhi ề u đ i ề u ki ệ n
Hình thức đơn giản nhất của việc lựa chọn là phép truy vấn trực quan trên màn hình Một lớp dữ liệu sẽ được hiển thị và các thuộc tính được lựa chọn thông qua một toán tử do người lập trình định nghĩa Toán tử đó sử dụng một thiết bị trỏ để định vị vị trí con trỏ chuột thông qua một đặc tính nào đó có liên quan (giả sử như động tác click chuột hay nhấn một phím nào đó trên bàn phím) và gửi đi một câu lệnh để tiến hành thao tác lựa chọn Phép truy vấn trực quan trên màn hình thường dùng để thu thập các thông tin về các đối tượng cụ thể cũng như tương tác, cập nhật cho các dữ liệu thuộc tính hay không gian Các phép truy vấn cũng có thể được xác định rõ bởi các điều kiện một cách đơn lẻ đối với các thành phần phi không gian Các phép lựa chọn này đa số thường dựa vào các bảng dữ liệu thuộc tính của một lớp hay nhiều lớp dữ liệu Các thuộc tính của mỗi đối tượng được so sánh với nhóm các điều kiện, nếu thuộc tính thỏa mãn điều kiện thì chúng được lựa chọn, còn nếu chúng không thỏa điều kiện thì được xếp vào nhóm không được lựa chọn Các dữ liệu được lựa chọn thường được sử dụng vào một hay nhiều mục đích nào đó và chúng được lưu trữ vào một file riêng biệt, được xóa và chỉnh sửa theo các cách khác nhau
Kết xuất dữ liệu
4.3.1 Giới thiệu chung về kết xuất dữ liệu
Với tư cách là một hệ thống, GIS có đầu vào và đầu ra Đầu ra của GIS được thể hiện thông qua việc hiển thị và xuất dữ liệu Đó chính là một chức năng của GIS Sau khi đã được nhập và phân tích, dữ liệu GIS có thể được hiển thị, xuất ra dưới hình thức này hay hình thức khác tùy thuộc vào yêu cầu công việc và khả năng của hệ thống
Dữ liệu của GIS có thể được trình bày ở đầu ra theo nhiều cách khác nhau:
– Hiển thị trên màn hình: Thông tin được biểu diễn trên màn hình bằng các màu sắc theo các tiêu chuẩn hiển thị của bản đồ Các công cụ quen thuộc sẽ giúp người dùng phóng to, thu nhỏ, nhìn toàn cảnh, xoay các góc khác nhau để hiển thị
– In ra giấy hoặc phim bằng các thiết bị in, thiết bị vẽ
– Chuyển đổi sang khuôn dạng khác hoặc đưa ra thành các tệp tin
Việc hiển thị và xuất dữ liệu bằng GIS được thực hiện với mục đích chính:
– Kiểm tra và biên tập dữ liệu
– Trình bày các kết quả phân tích và mô hình hóa để xem xét, lựa chọn và ra quyết định
Với sự trợ giúp của máy tính và các thiết bị ngoại vi, dữ liệu GIS bao gồm dữ liệu không gian và dữ liệu thuộc tính thường được hiển thị và xuất ra dưới hai hình thức: bản mềm và bản cứng
Thiết bị hiển thị và xuất dữ liệu GIS rất đa dạng và ngày càng được hiện đại hóa nhờ sự phát triển mạnh của công nghệ điện tử và công nghệ in
Dữ liệu địa lý được tổ chức trong một cơ sở dữ liệu địa lý và cơ sở dữ liệu đó có thể được coi như là một bộ sưu tập dữ liệu quy chiếu không gian đóng vai trò như một mô hình về thế giới thực Dữ liệu địa lý có hai hợp phần quan trọng là vị trí địa lý và các thuộc tính của nó Sự kết nối giữa dữ liệu không gian và thuộc tính là chìa khóa để có được thông tin đầy đủ về thế giới thực
Hi ể n th ị b ả n đồ và b ả ng thu ộ c tính
Hình 4.42 Hi ể n th ị b ả ng b ả n đồ và b ả ng thu ộ c tính
Trong GIS, việc hiển thị bản đồ và bảng hay hiển thị dữ liệu không gian và thuộc tính phụ thuộc vào từng phần mềm GIS cụ thể Trong môi trường cửa sổ, việc hiển thị dữ liệu địa lý được thực hiện một cách dễ dàng nhờ vào các thực đơn, thanh công cụ và các biểu tượng Có thể dễ dàng di chuyển, thay đổi kích thước, sắp xếp, nhìn gần, nhìn xa, cuốn ngang, cuốn dọc từng cửa sổ bảng, từng cửa sổ bản đồ để có thể biết rõ hơn về nội dung của bảng và bản đồ
Hi ể n th ị b ả n đồ Vector và Raster
Bản đồ Vector và Raster có thể được hiển thị trong cửa sổ Dùng chức năng tùy chọn quản lý lớp dữ liệu, có thể chọn các lớp cần hiển thị là các lớp mà từ đó cần thu thập thông tin hoặc có thể thay đổi các tùy chọn hiển thị lớp bản đồ cũng như có thể bổ sung hay loại bỏ các lớp bản đồ
Hình 4.43 Hi ể n th ị b ả n đồ trong GIS
Xuất dữ liệu là công việc cuối cùng của quá trình phân tích dữ liệu Chức năng xuất dữ liệu được hiểu là quá trình trình bày dữ liệu dưới dạng bản đồ hoặc bảng dữ liệu phân tích Đây chính là hình thức xuất dữ liệu dưới dạng bản cứng hoặc dưới các định dạng khác nhau được dùng phổ biến để trình bày các kết quả phân tích và mô hình hóa không gian GIS Chức năng xuất dữ liệu trong GIS gồm các dạng sau:
– In ấn bảng biểu và các đồ thị: Trong quá trình xử lý thông tin, các kết quả thống kê phân tích được lưu trữ cùng với các dữ liệu không gian Các dữ liệu này thường được lưu trữ dưới dạng các bảng số liệu
– In ấn các bản đồ: Đây chính là hình thức xuất dữ liệu dưới dạng bản cứng được dùng để trình bày các kết quả phân tích và mô hình hóa không gian GIS
– In báo cáo thống kê: Các phần mềm GIS thường có chức năng tổng hợp và xuất các dữ liệu phân tích dưới dạng các báo cáo thống kê Chức năng này có thể được thêm vào trong các modul của phần mềm GIS mã nguồn mở Ngoài ra, có thể sử dụng dữ liệu GIS để lập các báo cáo thống kê trong các phần mềm quản lý dữ liệu
– Xuất dữ liệu sang các định dạng khác: Các phần mềm GIS thường có các định dạng dữ liệu khác nhau Trong quá trình sử dụng có thể chuyển đổi và sử dụng dữ liệu liên thông giữa các phần mềm với nhau, thông qua chức năng xuất dữ liệu để chuyển đổi định dạng Đây cũng là chức năng mở của phần mềm GIS
CÂU HỎI THẢO LUẬN CHƯƠNG 4
1 Tổ chức và quản lý cơ sở dữ liệu địa lý Geodabase như thế nào?
2 Ứng dụng thực tiễn của chức năng phân loại dữ liệu (Symbology)
3 Ứng dụng thực tiễn của chức năng truy vấn dữ liệu (Selection)
4 Ứng dụng thực tiễn của chức năng phân lớp lại bản đồ (Reclassification)
5 Ứng dụng thực tiễn của chức năng tạo vùng đệm (Buffer)
6 Ứng dụng thực tiễn của chức năng đo đạc tính toán (Calculate Geometry)
7 Trình bày cụ thể một ứng dụng về phân tích thích hợp trong chồng ghép bản đồ Vector
8 Trình bày cụ thể một ứng dụng về phân tích thích hợp trong chồng ghép bản đồ Raster
9 Liệt kê và lấy ví dụ các sản phẩm của kết xuất dữ liệu GIS.
TÍCH HỢP CÔNG NGHỆ VÀ ỨNG DỤNG CỦA GIS
Tích hợp GIS và các công nghệ khác
Tích hợp (Integrate) có nghĩa là hợp thành một thể thống nhất, bổ sung thành một thể thống nhất, hợp nhất Như vậy, tích hợp GIS và các công nghệ khác là việc hợp nhất các ưu điểm của hai hay nhiều công nghệ khác nhau cùng với GIS thành một thể thống nhất, đồng thời tìm cách hạn chế các yếu điểm của sự tích hợp đó Phần này trình bày khái quát về sự tích hợp của GIS với các hệ thống không gian khác, bao gồm GNSS và viễn thám, GIS với Internet
5.1.1 Tích hợp GIS và GNSS
GNSS từ lâu đã được coi là một công nghệ rất tương thích các hoạt động của GIS và được cộng đồng các nhà khoa học GIS đánh giá cao Việc tích hợp công nghệ GNSS vào các dự án GIS có thể đạt được thông qua nhiều phương pháp khác nhau bao gồm việc thu thập, lưu trữ và chuyển dữ liệu từ hệ thống GNSS vào GIS, hỗ trợ cho việc xây dựng CSDL GIS mới Với sự phát triển nhanh của các máy tính thực địa (field laptop), việc tích hợp GNSS và GIS để tiến hành phân tích không gian trực tiếp tại thực địa ngày càng được quan tâm
Nhìn chung, có ba phương pháp cơ bản mà công nghệ GNSS có thể tương tác hoặc được tích hợp vào GIS Mức độ tích hợp của mỗi phương pháp là khác nhau từ rời rạc đến chặt chẽ Ở mức độ tích hợp rời rạc, dữ liệu được chuyển đổi qua lại giữa các hệ thống GNSS và GIS Ở mức tích hợp chặt chẽ, công nghệ GNSS hoàn toàn được nhúng trực tiếp trong phần mềm ứng dụng GIS Tích hợp GIS-GNSS có thể được phân loại thành ba cấp độ sau:
– Tích hợp về dữ liệu;
– Tích hợp về vị trí;
– Tích hợp về công nghệ
Sự phù hợp của mỗi phương pháp phụ thuộc vào yêu cầu của người dùng đối với các nhiệm vụ cụ thể, mức độ phụ thuộc của người dùng vào GNSS và sự sẵn có của một hệ thống hoàn chỉnh để đáp ứng các nhu cầu cụ thể mà người dùng có cho một hệ thống
Tích hợp về dữ liệu
Cho đến nay, phương pháp tích hợp GNSS vào GIS phổ biến nhất là thông qua dữ liệu Phương pháp tích hợp tập GIS-GNSS dữ liệu, như mô tả trong hình 5.1, sử dụng một hệ thống GNSS hoàn chỉnh và khép kín, có khả năng thu thập và lưu trữ dữ liệu tại hiện trường Dữ liệu GNSS được thu thập tại hiện trường sau đó sẽ được chuyển đến một máy tính với các phần mềm GIS để xử lý và sử dụng Trước đây, các hệ thống tích hợp dữ liệu thường tập trung vào luồng dữ liệu một chiều, theo đó dữ liệu được chuyển từ thiết bị định vị GNSS sang CSDL GIS Tuy nhiên, một số thiết bị GNSS hiện đại ngày nay cho phép nhập dữ liệu từ các CSDL GIS, nhờ đó, các dữ liệu GIS hiện có có thể được cập nhật và sửa chữa nhanh chóng và chính xác
Hình 5.1 Mô hình tích h ợ p GIS-GNSS theo d ữ li ệ u
Các hệ thống GNSS khép kín được sử dụng trong phương pháp này tự hoàn thiện và thường được phát triển bởi các tổ chức phát triển GNSS lớn Hệ thống bao gồm một máy thu GNSS, ăng ten GNSS và một thiết bị điều khiển có khả năng lưu trữ dữ liệu (hình 5.1)
Hệ thống GNSS thường rất chắc chắn và bền bỉ để phục vụ cho môi trường ngoài trời khắc nghiệt, với phần mềm khép kín được tối ưu hóa cho dung lượng lưu trữ hạn chế Các hệ thống GNSS này thường được thiết kế để đáp ứng nhu cầu của hầu hết các chuyên gia thu thập hoặc bảo trì dữ liệu Ưu điểm chính của phương pháp tích hợp dữ liệu GIS-GNSS là người dùng GNSS có thể vận hành hệ thống ngay lập tức mà không cần hoặc cần ít tùy chỉnh Đối với nhiều người dùng GNSS, một hệ thống có sẵn sẽ đáp ứng hầu hết các nhu cầu của họ về thu thập và bảo trì dữ liệu Chi phí liên quan đến một hệ thống GNSS hoàn chỉnh thường ít tốn kém hơn chi phí liên quan đến việc xây dựng một giải pháp tùy chỉnh và được giới hạn cho một số ứng dụng cụ thể Tuy nhiên, một nhược điểm dễ nhận thấy trong các hệ thống GNSS hoàn chỉnh là thường có nhiều chức năng hơn trong hệ thống so với yêu cầu
Một ví dụ về tích hợp dữ liệu GIS-GNSS là sử dụng hệ thống GeoExplorer 3 của Trimble Navigation để thu thập và cập nhật dữ liệu, với phần mềm Pathfinder Office, để truyền và xử lý dữ liệu, các sản phẩm ArcInfo hoặc ArcGIS của ESRI, để phân tích không gian, truy vấn và lưu trữ dữ liệu
Tích hợp về vị trí
Hình 5.2 thể hiện các thành phần liên quan đến mô hình tích hợp GIS-GNSS tập trung vào vị trí Tích hợp về vị trí về cơ bản sử dụng một hệ thống GNSS, có thể giống với hệ thống được sử dụng trong tích hợp về dữ liệu, để cung cấp dữ liệu trực tiếp vào một ứng dụng GIS đang chạy trên một thiết bị hiện trường Trên thực tế, hệ thống GNSS được ứng dụng trên thiết bị hiện trường coi như một cảm biến bên ngoài Thiết bị hiện trường thường sẽ cung cấp khả năng lưu trữ dữ liệu Dữ liệu từ thiết bị GIS hiện trường có thể được chuyển đến và từ GIS doanh nghiệp/văn phòng Tuy nhiên, điều này không bắt buộc, vì thiết bị thực địa là một hệ thống GIS độc lập theo đúng nghĩa của nó
Hình 5.2 Mô hình tích h ợ p GIS-GNSS trên cùng v ị trí (trên hi ệ n tr ườ ng)
Với những tiến bộ trong thiết bị thực địa cầm tay, việc tìm thấy cả ứng dụng điều khiển GNSS và ứng dụng GIS hiện trường hoạt động trên cùng một thiết bị ngày càng trở nên phổ biến hơn Điều quan trọng cần lưu ý là các ứng dụng vẫn được vận hành hoàn toàn riêng biệt với nhau Cụ thể, một ứng dụng được sử dụng để định cấu hình bộ thu GNSS và kiểm soát việc cung cấp dữ liệu liên quan đến vị trí, trong khi một ứng dụng khác được sử dụng để lưu trữ và sử dụng dữ liệu được gửi đến nó Điều quan trọng cần lưu ý là ứng dụng lưu trữ dữ liệu có rất ít hoặc không có quyền kiểm soát hoạt động của thiết bị GNSS
Tích hợp về công nghệ
Tích hợp về công nghệ là sự cải tiến của mô hình tích hợp về vị trí Như thể hiện ở hình 5.3, việc kiểm soát phần cứng GNSS được thực hiện trực tiếp từ ứng dụng của bên thứ ba, do đó loại bỏ nhu cầu về một ứng dụng hoặc thiết bị riêng để điều khiển bộ thu GNSS Sự phát triển của công nghệ phần mềm hiện nay đã tạo điều kiện cho phương pháp tiếp cận tích hợp công nghệ GIS-GNSS trở nên dễ dàng Giao tiếp giữa ứng dụng và bộ thu GNSS có luồng giao tiếp hai chiều – so với luồng một chiều được kết hợp với ứng dụng thứ cấp và hệ thống GNSS trong phương pháp tích hợp vị trí Cũng như tích hợp tập trung vào vị trí, việc truyền dữ liệu giữa thiết bị hiện trường và GIS doanh nghiệp/văn phòng là tùy chọn
Việc truyền dữ liệu phụ thuộc vào khả năng của ứng dụng trên thiết bị hiện trường Khả năng này giúp ứng dụng tùy chỉnh giao tiếp trực tiếp với bộ thu GNSS cho phép các công nghệ GNSS và GIS thực sự được tích hợp với nhau một cách liền mạch Trên thực tế, công nghệ GNSS có thể được nhúng hoàn toàn vào hệ thống ứng dụng GIS Do đó, việc làm cho một ứng dụng tập trung vào công nghệ rất giống với một hệ thống tập trung vào dữ liệu Tuy nhiên, ưu điểm là toàn bộ sức mạnh của GIS cũng có thể được đưa trực tiếp vào thực địa Giao diện người dùng và chức năng của ứng dụng có thể được thiết kế hoàn toàn theo nhu cầu của người dùng – dẫn đến hệ thống phân tích không gian mạnh mẽ, quen thuộc và dễ sử dụng đối với những người thường xuyên sử dụng nó nhất
Hình 5.3 Mô hình tích h ợ p GIS-GNSS trên cùng m ộ t thi ế t b ị
5.1.2 Tích hợp GIS – Viễn thám
Tư liệu ảnh viễn thám là nguồn cung cấp dữ liệu không gian quan trọng cho GIS Tư liệu ảnh viễn thám có thể cung cấp dữ liệu mô tả bề mặt mặt đất với phạm vi bao phủ địa lý lớn, độ phân giải cao và chi phí thấp Sự tích hợp tư liệu viễn thám GIS dựa trên tư liệu Raster rất khả thi vì cấu trúc dữ liệu giống nhau Hơn nữa có sự tương đồng giữa kỹ thuật xử lý ảnh viễn thám và GIS, cả hai kỹ thuật này đều xử lý dữ liệu không gian và có thể thành lập bản đồ số, đặc biệt là có cùng một số thuật toán xử lý dữ liệu không gian số Với sự phát triển của công nghệ thông tin thì các chức năng chuyển đổi dữ liệu Raster đã được cải thiện đáng kể, giúp cho việc đưa dữ liệu từ ảnh viễn thám sang một định dạng dữ liệu phù hợp trong hệ thống GIS trở nên dễ dàng và nhanh chóng, phục vụ phân tích và mô hình hóa trong nhiều ứng dụng Khi ảnh vệ tinh được xử lý và cung cấp dưới dạng tương thích với GIS, những chức năng phân tích của GIS có thể áp dụng hiệu quả đối với tư liệu viễn thám Do đó, công nghệ tích hợp tư liệu viễn thám và GIS không chỉ sử dụng ảnh viễn thám phối hợp với dữ liệu Vector của GIS (ranh giới, tọa độ, độ cao), phối hợp các chức năng sẵn có của hai công nghệ mà còn có thể khai thác tối đa dữ liệu thuộc tính nhằm đạt hiệu quả cao nhất trong việc cung cấp thông tin, đáp ứng nhanh các nhu cầu trong quy hoạch, theo dõi biến động sử dụng đất và thành lập bản đồ chuyên đề (hình 5.4)
Hình 5.4 Mô hình tích h ợ p vi ễ n thám và GIS
T ư li ệ u vi ễ n thám h ỗ tr ợ xây d ự ng và c ậ p nh ậ t CSDL GIS Ảnh số viễn thám sau khi được giải đoán hoặc phân tích, xử lý để tạo ra dữ liệu có tỷ lệ thích hợp theo yêu cầu ứng dụng, hoặc được sử dụng để xây dựng mô hình số độ cao (DEM), hay thành lập bản đồ hiện trạng sử dụng đất, v.v sẽ là nguồn cung cấp thông tin quan trọng trong xây dựng và cập nhật CSDL GIS (hình 5.5) Các chức năng chồng xếp các lớp dữ liệu trong GIS cho phép tích hợp và hiển thị đồng thời cả hai cấu trúc dữ liệu Vector và Raster, điều này cho phép cập nhật nhanh các lớp dữ liệu về giao thông, thủy hệ, thực phủ trong dữ liệu nền, cũng như các lớp dữ liệu chuyên đề của GIS Ảnh hàng không
Dữ liệu thực địa Địa lý – kinh tế – xã hội Ảnh số
Mô hình số độ cao Đo đạc vị trí điểm
Hình 5.5 Vai trò c ủ a vi ễ n thám trong xây d ự ng và c ậ p nh ậ t CSDL GIS
GIS giúp nâng cao độ chính xác khi giải đoán ảnh viễn thám
Giải đoán ảnh viễn thám là việc phân loại và sắp xếp các pixel trên ảnh thành những nhóm khác nhau dựa trên một số đặc điểm chung như về giá trị độ xám, sự đồng nhất, mật độ, tone ảnh Mặc dù tư liệu viễn thám có khả năng cung cấp thông tin chi tiết về các đối tượng trên bề mặt mặt đất (do độ phân giải không gian, độ phân giải thời gian và độ phân giải phổ lớn), song khi giải đoán chúng, đôi khi ta gặp phải trường hợp khó hoặc không thể giải đoán được Những trường hợp như vậy, nếu có tư liệu GIS hỗ trợ thì việc giải đoán thông tin từ ảnh viễn thám sẽ dễ dàng và chính xác hơn rất nhiều Ví dụ, khi giải đoán vùng trồng ngô và vùng trồng mía từ ảnh viễn thám: cả hai loại cây trồng này đều có điều kiện sinh trưởng, chiều cao cây, khả năng phản xạ phổ gần giống nhau nên rất khó phân biệt Thế nhưng nếu có các lớp dữ liệu GIS thông tin về sử dụng đất, sản xuất nông nghiệp, phong tục, tập quán canh tác của cư dân vùng đó thì sẽ có câu trả lời chính xác cho việc phân loại cây trồng ở vùng nói trên Trong rất nhiều bài toán phân loại ảnh viễn thám, GIS là công cụ hỗ trợ đắc lực cho các chuyên gia viễn thám trong việc cung cấp thông tin bổ trợ như ranh giới, độ cao, độ dốc