Danh sách mộtvài phần mềm GIS: ArcGis, ArcView 3.2, QGIS, SAGA GIS.Thành phần phần mềm: Công cụ GIS: Các công cụ chính hỗ trợ duyệt dữ liệu GIS RDBMS Relational Database Management S
Trang 1TRƯỜNG MỎ ĐỊA CHẤT KHOA CÔNG NGHỆ THÔNG TIN
Trang 2MỤC LỤC
I LÝ THUYẾT 1
1 Hệ thông tin địa lý và các thành phần cơ bản? Trong các thành phần vừa nêu, theo em thành phần nào là quan trọng nhất? Tại sao? 1
2 Nêu ý nghĩa của thông tin không gian và thông tin thuộc tính của đối tượng trong HTTĐL, cho ví dụ? Trong phần mềm ArcGis, chúng liên quan với nhau như thế nào? 1
3 Vai trò của Hệ thông tin địa lý trong quản lý thông tin và phát triển kinh tế đất nước 1
4 Quan hệ spaghetti (đặc điểm, cấu trúc, ưu nhược điểm, xây dựng mối quan hệ) 1
5 Quan hệ Topology (đặc điểm, cấu trúc, ưu nhược điểm, xây dựng mối quan hệ) 1
6 6.Cấu trúc dữ liệu Raster, ưu_ nhược điểm? cho ví dụ? Các phương pháp thu thập dữ liệu raster? 1
7 Cấu trúc dữ liệu Vertor, ưu_ nhược điểm? cho ví dụ? Các phương pháp thu thập dữ liệu vector? 1
8 Tổng quan về trực quan hóa dữ liệu không gian? 1
9 Tổng quan về khai phá dữ liệu không gian? 1
10 Khái niệm về hiện tượng tự tương quan và tự tương quan không gian? 1
11 Trình bày Global Moran’s I và Local Moran’s I? 1
12 Phương pháp số bình phương nhỏ nhất OLS (Ordinary Least Squares) 1
13 Hồi quy theo trọng số địa lý GWR (Geographically Weighted Regression)1 II TÌM HIỂU VÀ PHÂN TÍCH CÁC TRANG WEB ĐỂ LỰA CHỌN THU THẬP DỮ LIỆU ẢNH CHO KHU VỰC THỰC NGHIỆM PHÂN CÔNG 1
Trang 31 Natural Earth Data 1
2 ESRI ArcGIS Open Data 3
3 USGS Earth Explorer 4
4 OpenStreetMap 5
5 NASA SEDAC GIS data 6
6 Open Topography LiDAR GIS Data 6
7 UNEP Explorer free GIS Data 7
8 NASA Earth Observations 8
9 Công cụ tải ảnh Sentinel của ESA 10
10 Terra Populurs 11
III THỰC HÀNH 12
1 Phân tích dữ liệu và chạy mô hình tìm vị trí đóng quân cho trung đoàn (Khoảng cách 1446m) 12
2 Nghiên cứu mô hình Hydrological và ứng dụng cho khu vực Nghệ An 12
IV KẾT LUẬN 12
1 Tồn tại hạn chế, nguyên nhân 12
1.1 Hạn chế 12
1.2 Nguyên nhân 12
2 Kết luận 12
Trang 4- Các thành phần cơ bản gồm : phần cứng, phần mềm , dữ liệu, con người
và phương pháp
• Phần cứng :
Phần cứng là một máy tính chạy phần mềm GIS Hiện nay có nhiềuloại máy tính khác nhau, có thể là máy tính để bàn hoặc máy chủ.ArcGIS Server là một máy tính dựa trên máy chủ, nơi phần mềmGIS chạy trên máy tính kết nối mạng hoặc máy tính dựa trên đámmây
Để một chiếc máy tính chạy tốt thì tất cả các thành phần phần cứngđều phải có dung lượng cao Một số thành phần phần cứng là: Bomạch chủ, ổ cứng, bộ xử lý, card đồ họa, máy in, v.v Tất cả cácthành phần này hoạt động cùng nhau để chạy phần mềm GIS mộtcách trơn tru Các thành phần phần cứng chính:
Bo mạch chủ: Bo mạch chủ nơi các thành phần phần cứng chínhđược lắp đặt hoặc nơi kết nối tất cả các thành phần
Đĩa cứng: Hay còn gọi là ổ cứng, là nơi chứa dữ liệu
Bộ xử lý: Bộ xử lý là thành phần chính của máy tính, thực hiệncác phép tính Nó được gọi là đơn vị xử lý trung tâm (CPU)
RAM: Bộ nhớ truy cập ngẫu nhiên (RAM), trong đó tất cả cácchương trình đang chạy được tải tạm thời
Trang 5 Máy in: Là thiết bị đầu ra dùng để in hình ảnh, bản đồ hoặc tàiliệu Có nhiều loại máy in trên thị trường.
Đĩa ngoài: Đây là không gian lưu trữ di động, chẳng hạn như ổUSB, DVD, CD hoặc đĩa ngoài
Màn hình: Là màn hình hiển thị thông tin đầu ra Có nhiều loạimàn hình: CRT (Cathode Ray Tube), LCD (Liquid CrystalDisplay), LED (Light Emitting Diode), v.v
• Phần mềm
Thành phần tiếp theo là phần mềm GIS, cung cấp các công cụ đểchạy và chỉnh sửa thông tin không gian Nó giúp truy vấn, chỉnhsửa, chạy và hiển thị dữ liệu GIS Nó sử dụng RDBMS (Hệ thốngquản lý cơ sở dữ liệu quan hệ) để lưu trữ dữ liệu Danh sách mộtvài phần mềm GIS: ArcGis, ArcView 3.2, QGIS, SAGA GIS.Thành phần phần mềm:
Công cụ GIS: Các công cụ chính hỗ trợ duyệt dữ liệu GIS
RDBMS (Relational Database Management System): Hệquản trị cơ sở dữ liệu quan hệ, được sử dụng để lưu trữ dữliệu GIS Phần mềm GIS lấy từ RDBMS hoặc chèn dữ liệuvào RDBMS
Công cụ truy vấn: Một công cụ được sử dụng cùng với hệquản trị cơ sở dữ liệu để truy vấn, chèn, xóa và SQL khác(ngôn ngữ truy vấn chuẩn)
GUI (Graphical User Interface): Giao diện người dùng đồhọa để giúp người dùng tương tác tốt với phần mềm
Bố cục: Thiết kế một cửa sổ bố cục tốt cho bản đồ
• Dữ liệu
o Thành phần quan trọng và đắt tiền nhất của hệ thống thông tin địa
lý là dữ liệu, thường được coi là nguồn cung cấp năng lượng cho
Trang 6GIS Dữ liệu GIS là sự kết hợp của dữ liệu đồ họa và dữ liệu dạngbảng Đồ họa có thể là vector hoặc raster Cả hai loại dữ liệu nàyđều có thể được tạo nội bộ bằng phần mềm GIS hoặc có thể mua.
o Quá trình tạo dữ liệu GIS từ dữ liệu tương tự hoặc định dạng giấyđược gọi là số hóa Quá trình số hóa liên quan đến việc đăng kýhình ảnh raster với một số lượng nhỏ GCP (điểm kiểm soát mặt đất)hoặc tọa độ đã biết Quá trình này được gọi rộng rãi là tấm cao suhoặc khúc xạ địa lý Đa giác, đường thẳng và điểm được tạo rabằng cách số hóa hình ảnh raster
o Bản thân hình ảnh raster có thể được đăng ký với các tọa độ, đượcgọi rộng rãi là một hình ảnh đã được hiệu chỉnh Hầu hết các hìnhảnh đã đăng ký được xuất ở định dạng TIFF Như đã đề cập ở trên,
dữ liệu GIS có thể là raster hoặc vector Loại dữ liệu GIS:
Raster: Hình ảnh Raster lưu trữ thông tin trên cơ sở một đơn
vị Nó có thể là ảnh hàng không, ảnh vệ tinh, mô hình độ cao
kỹ thuật số (DEM) Hình ảnh Raster thường lưu trữ dữ liệu liên tục
Vectơ: Dữ liệu vectơ rời rạc Nó lưu trữ thông tin ở định dạng tọa độ x và y Dữ liệu vectơ được chia thành ba loại: Đường, điểm và diện tích
• Con người
Con người chính là người sử dụng hệ thống thông tin địa lý Họchạy phần mềm GIS Cả phần cứng và phần mềm đều được pháttriển, điều này giúp mọi người dễ dàng chạy phần mềm GIS Máytính cũng có giá cả phải chăng, người dùng có thể sử dụng các tác
vụ GIS Những công việc này có thể là tạo bản đồ đơn giản hoặcthực hiện phân tích GIS nâng cao Con người là thành phần chínhcủa một GIS thành công
• Phương pháp
Trang 7o Để vận hành GIS thành công, một kế hoạch được thiết kế tốt và cácquy tắc hoạt động kinh doanh là rất quan trọng Phương pháp có thểkhác nhau đối với các tổ chức khác nhau Tuy nhiên bất kỳ tổ chứcnào cũng cần ghi lại kế hoạch quy trình vận hành GIS của mình
o Các tài liệu này giải quyết các câu hỏi về các phương pháp GIS: Sốlượng chuyên gia GIS cần thiết, phần mềm và phần cứng GIS, quytrình lưu trữ dữ liệu, loại DBMS (hệ quản trị cơ sở dữ liệu), v.v.Một kế hoạch được thiết kế tốt sẽ giải quyết tất cả những vấn đềnày
o Ngày nay GIS ngày càng chứng tỏ tầm quan trọng và lợi ích củamình Trong tương lai hệ thống GIS sẽ được ứng dụng phổ biếnnhư một công cụ cấp thiết cho mọi tổ chức Từ những điều trên,ekMAP hy vọng đã giúp bạn hiểu được phần nào Hệ thống thôngtin địa lý GIS là gì cùng với lợi ích mà nó đem lại trong công tácquản lý các nguồn tài nguyên
- Trong các thành phần vừa nêu thành phần con người là quan trọng nhất
vì :
Con người chính là người sử dụng hệ thống thông tin địa lý Họchạy phần mềm GIS Cả phần cứng và phần mềm đều được pháttriển, điều này giúp mọi người dễ dàng chạy phần mềm GIS Máytính cũng có giá cả phải chăng, người dùng có thể sử dụng các tác
vụ GIS Những công việc này có thể là tạo bản đồ đơn giản hoặcthực hiện phân tích GIS nâng cao Con người là thành phần chínhcủa một GIS thành công
2 Nêu ý nghĩa của thông tin không gian và thông tin thuộc tính của đối tượng trong HTTĐL, cho ví dụ? Trong phần mềm ArcGis, chúng liên quan với nhau như thế nào?
Thông tin không gian:
Trang 8Dữ liệu là trung tâm của hệ thống GIS, hệ thống GIS chứa càng nhiều thìchúng càng có ý nghĩa Dữ liệu của hệ GIS được lưu trữ trong CSDL vàchúng được thu thập thông qua các mô hình thế giới thực Dữ liệu trong
hệ GIS còn được gọi là thông tin không gian Đặc trưng thông tin khônggian là có khả năng mô tả “vật thể ở đâu" nhờ vị trí tham chiếu, đơn vị đo
và quan hệ không gian Chúng còn khả năng mô tả “hình dạng hiệntượng" thông qua mô tả chất lượng, số lượng của hình dạng và cấu trúc.Cuối cùng, đặc trưng thông tin không gian mô tả “quan hệ và tương tác"giữa các hiện tượng tự nhiên Mô hình không gian đặc biệt quan trọng vìcách thức thông tin sẽ ảnh hưởng đến khả năng thực hiện phân tích dữliệu và khả năng hiển thị đồ hoạ của hệ thống
Dữ liệu không gian là bất kỳ loại dữ liệu nào tham chiếu trực tiếp hoặcgián tiếp đến một khu vực hoặc vị trí địa lý cụ thể Đôi khi được gọi
là liệu không gian địa lý hoặc thông tin địa lý, dữ liệu không gian cũngdữ
có thể biểu thị bằng số một đối tượng vật lý trong hệ tọa độ địa lý.Thông tin thuộc tính
Thông tin thuộc tính là thông tin được ánh xạ xung quanh một hìnhcầu Thông thường, hình cầu là hành tinh trái đất Dữ liệu địa lý làm nổibật các mối quan hệ kinh độ và vĩ độ đối với một đối tượng hoặc vị trí cụthể Một ví dụ quen thuộc về dữ liệu địa lý là hệ thống định vị toàn cầu
Ví dụ : Phân lớp được bản đồ
Trang 9o Từ thông tin thuộc tính và thông tin không gian kết hợp với ArcGisgiúp chúng ta xây dựng được bản đồ hoàn chỉnh có cả dữ liệukhông gian và dữ liệu thuộc tính.
o Trong phần mềm ArcGis, việc kết nối giữa các đối tượng trên bản
đồ và các bản ghi chứa các thông tương ứng trên cơ sở dữ liệu đượcthực hiện đơn giản trên cơ sở mối quan hệ 1-1 Điều kiện để thựchiện được thao tác kết nối dữ liệu không gian và dữ liệu phi khônggian là các dữ liệu không gian phải được nhập vào hệ thống và phảiđược tiền xử lý Điều này có nghĩa là các đặc tính địa lý (điểm,đường, vùng) phải được đặt đúng vị trí thực và được bổ sung vớiđầy đủ các thông tin cần thiết với các mẫu tin tương ứng trong bảngthuộc tỉnh Việc kết nối giữa các đối tượng trên bản đồ và các bảnghi chứa các thông tin mô tả tương ứng trên cơ sở dữ liệu đượcthực hiện đơn giản trên cơ sở mối quan hệ 1-1 giữa các đối tượngđịa lý trên bản đồ và các mẫu tin tương ứng mô tả thuộc tỉnh của
nó Số nhất để mối liên kết là mã (code) của đối tượng, gọi là sốliên kết Thông thường người ta sử dụng một chương trình phầnmềm để thực hiện công việc kết nối này Đối với các thực thếkhông gian, người dùng sẽ phải nhập các mã khóa một cách trựctiếp cho từng thể tỉnh thi người dùng nhập ma khóa vào CSDLquan hệ thông sẽ dùng chương trình mềm kết nối để khai báo choGIS
3 Vai trò của Hệ thông tin địa lý trong quản lý thông tin và phát triển kinh tế đất nước.
Hệ thống thông tin địa lý GIS hỗ trợ quốc gia, các nhà khoa họctrong việc phân tích những sự vật, hiện tượng thực đang xảy ra trên
bề mặt Trái Đất thông qua nguồn dữ liệu không gian về mặt địa lý
Từ đó hoạch định các chiến lược cũng như các kế hoạch cải tạo địachất, môi trường và tài nguyên một cách hiệu quả
Trang 10 Các bản đồ: giao diện trực tuyến với dữ liệu địa lý để tra cứu, trìnhbày kết quả và sử dụng như là một nền thao tác với thế giới thực
Các tập thông tin địa lý: thông tin địa lý dạng file và dạng cơ sở dữliệu gồm các yếu tố, mạng lưới, topology, địa hình, thuộc tính
Các mô hình xử lý: tập hợp các quy trình xử lý để phân tích tự động
Các mô hình dữ liệu: GIS cung cấp công cụ mạnh hơn là một cơ sở
dữ liệu thông thường bao gồm quy tắc và sự toàn vẹn giống như các
hệ thông tin khác Lược đồ, quy tắc và sự toàn vẹn của dữ liệu địa
tế - xã hội và an ninh quốc phòng của nước ta và đang có nhiềutriển vọng phát triển nhanh trong thời gian sắp tới
Hệ thống thông tin địa lý GIS lưu giữ các thông tin dưới dạngchuyên đề và liên kết với nhau nhờ những đặc điểm về địa lý.Chính vì vậy, hệ thống này là một phương tiện hữu ích trong việcthiết lập và vẽ bản đồ, vẽ các tuyến đường giao thông hay môphỏng sự lưu thông của tầng khí quyển
4 Quan hệ spaghetti (đặc điểm, cấu trúc, ưu nhược điểm, xây dựng mối quan hệ)
Đặc điểm :
o Mô hình dữ liệu Spaghetti có cấu trúc đơn giản, mỗi đối tượng địa
lý được lưu trữ độc lập, vì vậy, một cặp toạ độ có thể xuất hiện haihay nhiều lần để lưu hai hay nhiều đối tượng liền kề nhau Khôngthể hiện mối quan hệ giữa các đối tượng Phần tử cơ bản của cấu
Trang 11trúc dữ liệu spaghetti là điểm, đường, vùng Mỗi nhóm đối tượngđiểm, đường, vùng và đa giác được lưu thành các tệp riêng biệt
Cấu trúc
o Trong cấu trúc dữ liệu Spaghetti, đơn vị cơ sở là các cặp tọa độ trênmột không gian địa lý xác định Do đó, mỗi đối tượng điểm đượcxác định bằng một cặp tọa độ (x, y); mỗi đối tượng đường đượcbiểu diễn bằng một chuỗi những cặp tọa độ (xi, yi); mỗi đối tượngvùng được biểu diễn bằng một chuỗi những cặp toạ độ (xj, yj) vớiđiểm đầu và điểm cuối trùng nhau
o Thể hiện mối quan hệ không gian của các đối tượng
o Trong cấu trúc dữ liệu Topology một điểm chỉ được lưu trữ 1 lần
o Các phần từ không gian trong cấu trúc Topology được xác định dựatrên các đặc điểm sau :
Mỗi cung được xác định bởi 2 nút
Các phần tử ở giữa 2 nút là các điểm điều khiển(vertex), các điểm này xác định hình dạng của cung
Trang 12 Các cung giao nhau tại các nút, điểm bắt đầu và điểmkết thúc của một cung phải là một nút
Vùng là tập hợp các cung khép kín, trong trường hợpvùng trong vùng thì phải có sự phân biệt giữa cung bêntrong và bên ngoài
Cấu trúc
o Cấu trúc Topology còn được gọi là cấu trúc cung – nút (arc - node).Cấu trúc này được xây dựng trên mô hình cung – nút, trong đó cung làphần tử cơ sở Việc xác định các phần tử không gian dựa trên các địnhnghĩa sau:
o Mỗi cung được xác định bởi 2 nút, các phần tử ở giữa 2 nút là cácđiểm điều khiển (vertex), các điểm này xác định hình dạng của cung
o Các cung giao nhau tại các nút, kết thúc một cung là nút
o Vùng là tập hợp các cung khép kín, trong trường hợp vùng trong vùngthì phải có sự phân biệt giữa cung bên trong và cung bên ngoài
Xây dựng mối quan hệ
o Trong cấu trúc Topology, các đối tượng không gian được mô tả trongbốn bảng dữ liệu: bảng tọa độ cung, bảng topology cung, bảngtopology nút và bảng topology vùng Giữa các bảng này có quan hệvới nhau thông qua cung Từ đây, ta có thể phân tích các quan hệ củacác đối tượng không gian trên cùng một hệ tọa độ
ƯU ĐIỂM
o Dữ liệu được đầy đủ và chuẩn hóa hơn
o Loại bỏ đ ợc sự d thừa số liệuƣ ƣ
Trang 136 Cấu trúc dữ liệu Raster, ưu_ nhược điểm? cho ví dụ? Các phương pháp thu thập dữ liệu raster?
Raster là một cấu trúc dữ liệu biểu diễn một lưới hình chữ nhật màu củacác pixel(pel) Hình ảnh raster được tạo ra bởi các điểm ảnh với khácnhau, sắp xếp để hiển thị một hình ảnh Để đơn giản hơn, hãy hình dung 1hình ảnh raster giống như một bức tranh thêu chữ thập
Ưu điểm :
o Cấu trúc dữ liệu đơn giản
o Thao tác thực hiện bản đồ đơn giản
o Bài toán mô hình thực tế dễ dàng
o Thích hợp với việc xây dựng viễm thám
Trang 147 Cấu trúc dữ liệu Vertor, ưu_ nhược điểm? cho ví dụ? Các phương pháp thu thập dữ liệu vector?
Cấu trúc dữ liệu Vector hay còn gọi là mô hình dữ liệu Vector nhằm thể
hiện chính xác các đối tượng địa lý trên bề mặt Trái đất lên bản đồ số
bằng giá trị liên tục của các cặp tọa độ và xác định chính xác mối quan hệkhông gian của các đối tượng
8 Tổng quan về trực quan hóa dữ liệu không gian?
Trực quan hóa (Visualization) là kỹ thuật tạo ra những hình ảnh, biểu đồ,
đồ thị để diễn tả thông điệp, thông tin đến người dùng Trực quan hóanghiên cứu trình bày một cách trực quan khối dữ liệu trừu tượng để tăngcường nhận thức của con người
Trang 15Việc sử dụng trực quan hóa để biểu diễn dữ liệu không phải là hiện tượngmới Nó đã được sử dụng trong bản đồ, bản vẽ khoa học, những sơ đồ dữliệu từ hàng ngàn năm trước Đồ họa máy tính ngay từ khi ra đời đã được
sử dụng để nghiên cứu các vấn đề khoa học Tuy nhiên, trong những ngàyđầu sự thiếu năng lực đồ họa đã hạn chế lợi ích của chúng có thể manglại
Trực quan hóa dữ liệu là quá trình ánh xạ dữ liệu tới thị giác Nguyên tắcthủ công là khai thác dữ liệu và biểu diễn các giá trị của nó một cách trựcquan Ví dụ như một biểu đồ đơn giản được sinh ra từ quy luật đơn giảnnhư sau: Giá trị lớn hơn tương ứng với những cột cao hơn
Mục tiêu chính của trực quan hóa dữ liệu là truyền thông tin rõ ràng vàhiệu quả cho người sử dụng thông qua đồ họa được lựa chọn như bảngbiểu hoặc biểu đồ Bảng biểu thường được dùng khi xem xét hoặc đolường giá trị của một biến Các loại biểu đồ sẽ hiển thị kết quả hoặc liên
hệ với dữ liệu của một hay nhiều biến Nó khiến dữ liệu phức tạp trởthành dễ hiểu và dễ sử dụng hơn Người sử dụng có thể có những động tácphân tích đặc biệt như tạo phép so sánh dữ liệu Một ví dụ về trực quanhóa dữ liệu giá nhà ở California
9 Tổng quan về khai phá dữ liệu không gian?
Cơ sở dữ liệu không gian lưu trữ một khối lượng lớn các dữ liệu liên quanđến không gian như bản đồ, ảnh viễn thám, ảnh y học … Cơ sở dữ liệukhông gian có nhiều điểm khác với cơ sở dữ liệu quan hệ Chúng chứacác thông tin về photo và thông tin về khoảng cách Chúng thường có cấutrúc phức tạp, được lập chỉ mục không gian và được truy nhập bởi cácphương pháp truy nhập dữ liệu không gian riêng, với các công nghệ riêng.Khai phá dữ liệu không gian là quá trình trích rút tri thức, các quan hệkhông gian hoặc các mẫu hấp dẫn tiềm ẩn không được lưu trữ một cách rõràng trong cơ sở dữ liệu không gian Quá trình khai phá dữ liệu này đòi
Trang 16hỏi một sự hộp nhập của khai phá dữ liệu với các các công nghệ cơ sở dữliệu không gian Nó có thể được sử dụng để hiểu dữ liệu không gian , xâydựng cơ sở kiến thức không gian, tổ chức lại các CSDL không gian , vàtối ưu hóa các truy vấn không gian Dự kiến sẽ có ứng dụng rộng rãi trong
hệ thống thông tin địa lý, viễn thám, thăm dò CSDL hình ảnh, hình ảnh y
tế, điều hướng kiểm soát giao thông, nghiên cứu môi trường và nhiều lĩnhvực khác liên quan đến không gian Thách thức đối với khai phá dữ liệukhông gian trên tập hợp dữ liệu không gian rất đồ sộ và phức tạp cả vèkiểu dữ liệu lẫn các phương pháp truy nhập
10.Khái niệm về hiện tượng tự tương quan và tự tương quan không gian?
Khái niệm tự tương quan
- Thuật ngữ tự tương quan có thể hiểu là sự tương quan giữa các thành
phần của chuỗi các quan sát được sắp xếp theo thứ tự thời gian (trong các
số liệu chuỗi thời gian) hoặc không gian (trong số liệu chéo)
Khái niệm tự tương quan không gian
- Thuật ngữ tự tương quan không gian đề cập đến sự hiện diện của biến thểkhông gian hệ thống trong một biến được ánh xạ Khi các quan sát liền kề
có giá trị dữ liệu tương tự, bản đồ hiển thị tự tương quan không gian tíchcực Khi các quan sát liền kề có xu hướng có các giá trị rất tương phản thìbản đồ hiển thị tự tương quan không gian âm Có một số kỹ thuật thống
kê để phát hiện sự hiện diện của nó Sự hiện diện của tự tương quankhông gian là quan trọng, bởi vì nó thường được coi là chỉ ra rằng cóđiều gì đó đáng quan tâm trong việc phân phối các giá trị bản đồ đòi hỏiphải điều tra thêm để hiểu lý do đằng sau sự thay đổi không gian quan sátđược, và bởi vì sự hiện diện của tự tương quan không gian ngụ ý dư thừathông tin và có ý nghĩa quan trọng đối với phương pháp phân tích dữ liệukhông gian Tự tương quan không gian có thể phát sinh từ bất kỳ mộttrong các tình huống sau: sự khác biệt giữa quy mô biến thiên (lớn) củamột hiện tượng và quy mô (nhỏ) của khung không gian được sử dụng để
Trang 17nắm bắt hoặc biểu thị biến thể đó; lỗi đo lường; khuếch tán khônggian,các quá trình lan tỏa , tương tác và phân tán; sự kế thừa của một biếnthông qua quan hệ nhân quả với một biến khác; và mô hình sai đặc điểm
kỹ thuật Sự hiện diện hoặc mặt khác của tự tương quan không gian tácđộng trực tiếp đến lấy mẫu không gian, nội suy bản đồ, phân tích dữ liệukhông gian khám phá, suy luận thống kê và lập mô hình thống kê sử dụng
dữ liệu không gian
- Tự tương quan không gian có thể được lập chỉ mục, định lượng bằng cáchđưa tham số tự hồi quy vào mô hình hồi quy hoặc lọc từ các biến Tựtương quan không gian có thể được định lượng bằng các chỉ số Phươngtrình (1) cung cấp chỉ số MC, chỉ số này cũng có thể được viết lại theo hệ
số hồi quy được liên kết với biểu đồ phân tán Moran
11 Trình bày Global Moran’s I và Local Moran’s I?
Phương pháp bình phương nhỏ nhất thông thường (OLS) là một kỹ thuậthồi quy tuyến tính được sử dụng để ước tính các tham số chưa biết trongmột mô hình Phương pháp này dựa vào việc giảm thiểu tổng bìnhphương phần dư giữa giá trị thực và giá trị dự đoán
Về mặt hình học, đây được coi là tổng bình phương khoảng cách, songsong với trục của biến phụ thuộc, giữa mỗi điểm dữ liệu trong tập hợp vàđiểm tương ứng trên bề mặt hồi quy—sự khác biệt càng nhỏ, mô hìnhcàng phù hợp với dữ liệu Công cụ ước tính kết quả có thể được biểu thịbằng một công thức đơn giản, đặc biệt là trong trường hợp hồi quy tuyếntính đơn giản , trong đó có một biến hồi quy duy nhất ở vế phải củaphương trình hồi quy
Công cụ ước tính OLS nhất quán cho các hiệu ứng cố định cấp một khicác biến giải thích là ngoại sinh và hình thành tính cộng tuyến hoàn hảo(điều kiện xếp hạng), nhất quán với ước tính phương sai của phần dư khicác biến giải thích có khoảnh khắc thứ tư hữu hạn và—bởi Gauss–Markov định lý - tối ưu trong lớp các công cụ ước lượng không thiên vị
Trang 18tuyến tính khi các lỗi là homoscedastic và không tương quanhuyết thanh Trong những điều kiện này, phương pháp OLS cung cấp ướclượng trung bình phương sai tối thiểu khi sai số có phương sai hữuhạn Theo giả định bổ sung rằng các lỗi là thường được phân phối với giátrị trung bình bằng 0, OLS là công cụ ước tính khả năng tối đa vượt trộihơn bất kỳ công cụ ước tính không thiên vị phi tuyến tính nào.
12.Phương pháp số bình phương nhỏ nhất OLS (Ordinary Least Squares)
Global Moran’s I
- Công cụ Tự tương quan không gian (Global Moran's I) đo lường tự tương
quan không gian dựa trên đồng thời cả vị trí đối tượng và giá trị đốitượng Đưa ra một tập hợp các tính năng và một thuộc tính được liên kết,
nó đánh giá xem mẫu được biểu thị là nhóm, phân tán hay ngẫunhiên Công cụ tính toán giá trị Chỉ mục I của Moran và cả điểm z và giátrị p để đánh giá tầm quan trọng của Chỉ mục đó Giá trị P là giá trị xấp xỉbằng số của diện tích dưới đường cong đối với phân bố đã biết, bị giớihạn bởi thống kê thử nghiệm
- Phép toán đằng sau thống kê Global Moran's I được trình bày ở
trên Công cụ này tính toán giá trị trung bình và phương sai cho thuộc tínhđang được đánh giá Sau đó, đối với mỗi giá trị tính năng, nó sẽ trừ đi giátrị trung bình, tạo ra độ lệch so với giá trị trung bình Các giá trị độ lệchcho tất cả các tính năng lân cận (ví dụ: các tính năng trong dải khoảngcách đã chỉ định) được nhân với nhau để tạo ra một tích chéo Lưu ý rằng
tử số cho thống kê Global Moran's I bao gồm các tích chéo được tính tổngnày
- Công cụ Tự tương quan không gian (Global Moran's I) là một thống kê
suy luận, có nghĩa là kết quả phân tích luôn được diễn giải trong bối cảnhgiả thuyết không của nó Đối với thống kê Global Moran's I, giả thuyếtkhông nói rằng thuộc tính đang được phân tích được phân phối ngẫunhiên giữa các đối tượng địa lý trong khu vực nghiên cứu của bạn; nói
Trang 19cách khác, các quá trình không gian thúc đẩy mô hình giá trị được quansát là cơ hội ngẫu nhiên Hãy tưởng tượng rằng bạn có thể chọn các giá trịcho thuộc tính mà bạn đang phân tích và ném chúng xuống các tính năngcủa bạn, để mỗi giá trị rơi vào nơi có thể Quá trình này (nhặt lên và némxuống các giá trị) là một ví dụ về quá trình ngẫu nhiên trong không gian.
- Công cụ Tự tương quan không gian trả về năm giá trị: Chỉ số Moran's I,
Chỉ số kỳ vọng, Phương sai, điểm z và giá trị p Các giá trị này được viếtdưới dạng thông báo ở cuối ngăn Xử lý địa lý trong quá trình thực thicông cụ và được chuyển dưới dạng giá trị đầu ra dẫn xuất để sử dụng tiềmnăng trong các mô hình hoặc tập lệnh Bạn có thể truy cập thư bằng cách
di chuột qua thanh tiến trình, nhấp vào nút bật ra hoặc mở rộng phần thưtrong ngăn Xử lý địa lý Bạn cũng có thể truy cập các thông báo cho mộtcông cụ đã chạy trước đó qua Lịch sử xử lý địa lý Theo tùy chọn, công cụnày sẽ tạo tệp báo cáo HTML với bản tóm tắt kết quả bằng đồ họa Đườngdẫn đến báo cáo sẽ kèm theo các thông báo tóm tắt các thông số thực thicông cụ Nhấp vào đường dẫn đó sẽ bật mở tệp báo cáo
Local Moran’s I
- Đưa ra một tập hợp các tính năng ( Lớp tính năng đầu vào ) và một trường
phân tích ( Trường đầu vào ), công cụ Phân tích cụm và ngoại lệ xác địnhcác cụm tính năng không gian có giá trị cao hoặc thấp Công cụ này cũngxác định các ngoại lệ không gian Để thực hiện việc này, công cụ sẽ tínhtoán giá trị I của Moran cục bộ, điểm số z, giá trị p giả và mã đại diện choloại cụm cho từng đối tượng địa lý có ý nghĩa thống kê Điểm số z và giátrị p giả thể hiện ý nghĩa thống kê của các giá trị chỉ số được tính toán
- Công cụ này tạo một lớp tính năng đầu ra mới với các thuộc tính sau cho
mỗi tính năng trong lớp tính năng đầu vào: chỉ số I của Moran cục bộ,điểm z, giá trị p và COType
Trang 2013.Hồi quy theo trọng số địa lý GWR (Geographically Weighted Regression)
Hồi quy trọng số địa lý (GWR) là một trong một số kỹ thuật hồi quykhông gian được sử dụng trong địa lý và các ngành khác GWR đánh giámột mô hình cục bộ của biến hoặc quy trình mà bạn đang cố gắng hiểuhoặc dự đoán bằng cách điều chỉnh phương trình hồi quy cho mọi tínhnăng trong tập dữ liệu GWR xây dựng các phương trình riêng biệt nàybằng cách kết hợp các biến phụ thuộc và biến giải thích của các đối tượngđịa lý nằm trong vùng lân cận của từng đối tượng mục tiêu Hình dạng vàphạm vi của từng vùng lân cận được phân tích dựa trên các tham số Loạivùng lân cận và Phương pháp lựa chọn vùng lân cận GWR nên được ápdụng cho các bộ dữ liệu có hàng trăm tính năng Nó không phải là mộtphương pháp thích hợp cho các tập dữ liệu nhỏ và không hoạt động với
dữ liệu đa điểm
Công cụ hồi quy theo trọng số địa lý đa cấp có thể được sử dụng để thựchiện GWR trên dữ liệu với các thang đo mối quan hệ khác nhau giữa cácbiến phụ thuộc và biến giải thích
Để chạy công cụ GWR, hãy cung cấp tham số Tính năng đầu vào với mộttrường đại diện cho Biến phụ thuộc và một hoặc nhiều trường đại diệncho các) Biến giải thích Các trường này phải là số và có nhiều giá(
trị Các tính năng chứa các giá trị bị thiếu trong biến phụ thuộc hoặc biếngiải thích sẽ bị loại khỏi phân tích; tuy nhiên, bạn có thể sử dụng công
cụ Điền giá trị còn thiếu để hoàn thành tập dữ liệu trước khi chạyGWR Tiếp theo, bạn phải chọn Loại mô hình dựa trên dữ liệu bạn đangphân tích Điều quan trọng là sử dụng một mô hình thích hợp cho dữ liệucủa bạn Dưới đây là mô tả về các loại mô hình và cách xác định loại phùhợp cho dữ liệu của bạn
Công cụ hồi quy theo trọng số địa lý tạo ra nhiều kết quả đầu ra khácnhau Tóm tắt mô hình GWR và tóm tắt thống kê có sẵn dưới dạng thôngbáo ở cuối ngăn Xử lý địa lý trong quá trình thực thi công cụ Để truy cậpthư , hãy di con trỏ qua thanh tiến trình, nhấp vào nút bật ra hoặc mở rộng
Trang 21phần thư trong ngăn Xử lý địa lý Bạn cũng có thể truy cập các thông báocủa công cụ Hồi quy theo trọng số địa lý đã chạy trước đó thông qua lịch
sử xử lý địa lý Công cụ này cũng tạo ra các Tính năng Đầu ra , biểu đồ
và các Tính năng Dự đoán Đầu ra tùy chọn và bề mặt raster hệ
số CácTính năng đầu ra và các biểu đồ liên quan được tự động thêm vàongăn Nội dung với sơ đồ hiển thị nóng và lạnh được áp dụng cho phần dưcủa mô hình Chẩn đoán và biểu đồ được tạo tùy thuộc vào Loại kiểumáy của Tính năng đầu vào và được mô tả bên dưới
II TÌM HIỂU VÀ PHÂN TÍCH CÁC TRANG WEB ĐỂ LỰA CHỌN THU THẬP DỮ LIỆU ẢNH CHO KHU VỰC THỰC NGHIỆM PHÂN CÔNG
1 Natural Earth Data
Natural Earth là bộ dữ liệu bản đồ phạm vi công cộng có sẵn ở các tỷ lệ1:10m, 1:50m và 1:110 triệu Với dữ liệu vectơ và dữ liệu raster được tíchhợp chặt chẽ, với Natural Earth, bạn có thể tạo nhiều loại bản đồ đượcthiết kế đẹp mắt, trực quan bằng phần mềm bản đồ hoặc phần mềm GIS.Natural Earth được thông qua sự hợp tác của nhiều tình nguyện viên vàđược hỗ trợ bởi NACIS (hiệp hội thông tin bản đồ Bắc Mỹ ) và được sửdụng miễn phí trong bất kỳ dự án nào
2 ESRI ArcGIS Open Data
ArcGIS Hub là một nền tảng tương tác cộng đồng dễ cấu hình giúp tổchức mọi người, dữ liệu và công cụ thông qua các sáng kiến dựa trênthông tin Các tổ chức thuộc mọi loại hình và mọi quy mô, bao gồm các
cơ quan chính phủ, nhóm phi lợi nhuận và học viện, có thể tối đa hóa mức
độ tương tác, giao tiếp, cộng tác và chia sẻ dữ liệu bằng cách sử dụngphương pháp tiếp cận dựa trên sáng kiến của ArcGIS Hub Với ArcGISHub, các tổ chức có thể tận dụng dữ liệu và công nghệ hiện có của mình,đồng thời làm việc cùng với các bên liên quan bên trong và bên ngoài đểtheo dõi tiến độ, cải thiện kết quả và tạo ra các cộng đồng năng động
Trang 22ArcGIS Hub có sẵn ở hai cấp độ giấy phép: Cơ bản và Cao cấp ArcGISHub Basic được bao gồm trong ArcGIS Online và cung cấp khả năng chia
sẻ dữ liệu và tạo trang web, trong khi ArcGIS Hub Premium bao gồm cáctính năng và khả năng bổ sung để làm việc với các nhóm người (bao gồm
+/ Các trang web trung tâm đáng để kiểm tra
Các thành phố, tổ chức phi lợi nhuận và các tổ chức thuộc mọi loại hìnhđang sử dụng ArcGIS Hub để xuất bản và chia sẻ dữ liệu mở của họ nhằmthu hút cộng đồng của họ bằng các sáng kiến dựa trên dữ liệu Kiểm tracác trang web trung tâm thành công này để có ý tưởng và nguồn cảmhứng
3 USGS Earth Explorer
USGS Earth Explorer cung cấp khoa học về các mối nguy hiểm tự nhiên
đe dọa cuộc sống và sinh kế, nước, năng lượng, khoáng chất và các tàinguyên thiên nhiên khác mà chúng ta dựa vào, sức khỏe của hệ sinh thái
và môi trường cũng như tác động của biến đổi khí hậu và sử dụngđất Các nhà khoa học của chúng tôi phát triển các phương pháp và công
cụ mới để cung cấp thông tin kịp thời, phù hợp và hữu ích về Trái đất vàcác quá trình của nó
Được thành lập theo một đạo luật của Quốc hội vào năm 1879, Cục Khảosát Địa chất Hoa Kỳ đã phát triển qua nhiều thập kỷ, kết hợp tài năng vàkiến thức của mình với sự tiến bộ của khoa học và công nghệ USGS là cơ
Trang 23quan khoa học duy nhất của Bộ Nội vụ Nó được hàng nghìn đối tác vàkhách hàng tìm kiếm nhờ chuyên môn về khoa học tự nhiên cũng như kho
dữ liệu sinh học và trái đất rộng lớn của nó
USGS giám sát, phân tích và dự đoán các tương tác hiện tại và đang pháttriển của hệ thống Trái đất, đồng thời cung cấp thông tin có thể hành động
ở quy mô và khung thời gian phù hợp với những người ra quyếtđịnh USGS cung cấp kiến thức khoa học về các hiểm họa tự nhiên, tàinguyên thiên nhiên, hệ sinh thái và sức khỏe môi trường cũng như tácđộng của biến đổi khí hậu và sử dụng đất
4 OpenStreetMap
OpenStreetMap giống như Wikipedia về bản đồ Đó là cộng đồngnhững người lập bản đồ lớn nhất trên thế giới, những người liên tục chỉnhsửa địa lý của hành tinh đang thay đổi của chúng ta
Hãy xem, vấn đề với dữ liệu Google Maps là dữ liệu đó thuộc sở hữu độcquyền và cực kỳ khó lấy Và thường thì các loại dữ liệu chi tiết khác cógiá rất cao
Vì vậy, chúng tôi cần một cái gì đó mở để thế giới chỉnh sửa Và giải pháp
đó là OpenStreetMap đã thúc đẩy những người đóng góp chỉnh sửa “bản
đồ mở” này hàng ngày
Vì “mở” là triết lý chính của OpenStreetMap nên điều này cũng đúng với
dữ liệu “mở” Vì vậy, đây là hướng dẫn về cách bạn có thể tải xuống dữ liệu OSM (tất nhiên là miễn phí).
5 NASA SEDAC GIS data
Nhiệm vụ của UWG
Nhóm làm việc cho người dùng SEDAC (UWG) cung cấp lờikhuyên và hướng dẫn liên tục về các hoạt động và kế hoạch củaSEDAC Trách nhiệm của nó bao gồm xem xét tiến độ và hiệu suấtcủa SEDAC, thể hiện quan điểm của cộng đồng người dùng trongviệc phát triển các sản phẩm và dịch vụ của SEDAC, đề xuất cácsản phẩm và dịch vụ dữ liệu cụ thể cho NASA và SEDAC, đồng
Trang 24thời cung cấp hướng dẫn chiến lược cho NASA và SEDAC về cácmục tiêu, ưu tiên, mục tiêu cộng đồng người dùng, cách tiếp cậntriển khai và các vấn đề khác Các thành viên của UWG đại diệncho nhiều lĩnh vực khoa học tự nhiên và xã hội cũng như các nhómngười dùng khác từ khu vực công và tư nhân Một nhà khoa họccủa dự án SEDAC làm thư ký điều hành cho UWG.
6 Open Topography LiDAR GIS Data
Nhiệm vụ của OpenTopography Facility là:
Dân chủ hóa quyền truy cập trực tuyến vào dữ liệu địa hình, độphân giải cao (tỷ lệ từ mét đến mét), định hướng khoa học Trái đấtthu được bằng công nghệ lidar và các công nghệ khác
Khai thác cơ sở hạ tầng mạng tiên tiến để cung cấp các khả năngtruy cập, xử lý và phân tích dữ liệu dựa trên dịch vụ Web có khảnăng mở rộng, mở rộng và đổi mới
Thúc đẩy khám phá dữ liệu và công cụ phần mềm thông qua cácdanh mục siêu dữ liệu do cộng đồng điền vào
Hợp tác với chủ sở hữu dữ liệu miền công cộng để tận dụng cơ sở
hạ tầng OpenTopography để khám phá, lưu trữ và xử lý dữ liệu
Cung cấp đào tạo chuyên nghiệp và hướng dẫn chuyên gia trongquản lý, xử lý và phân tích dữ liệu
Thúc đẩy sự tương tác và trao đổi kiến thức trong cộng đồng ngườidùng khoahọc trái đất
7 UNEP Explorer free GIS Data
Cơ sở dữ liệu thông tin tài nguyên toàn cầu - Geneva (GRID-Geneva), là
sự hợp tác giữa Chương trình Môi trường Liên hợp quốc (UNEP), Vănphòng Môi trường Liên bang Thụy Sĩ (FOEN) và Đại học Geneva(UniGe) Với đội ngũ gồm 20 Nhà khoa học dữ liệu môi trường, vai tròchính của GRID-Geneva là chuyển đổi dữ liệu thành thông tin và kiến
Trang 25thức để hỗ trợ quá trình ra quyết định liên quan đến các vấn đề môitrường.
Các nhà khoa học của GRID-Geneva có thể xử lý hình ảnh vệ tinh bằngphần mềm viễn thám, tạo mô hình từ dữ liệu không gian địa lý bằng Hệthống thông tin địa lý (GIS), tạo bản đồ và đồ thị tương tác để cập nhật tựđộng
GRID-Geneva cũng chuyên thiết kế và bảo trì các nền tảng dữ liệu để hỗtrợ UNEP (ví dụ: với Phòng Tình hình Môi trường Thế giới), Ramsar vànhiều tổ chức và công ước môi trường khác Các nhà khoa học của GRID-Geneva cũng đang tổ chức các hội nghị, nâng cao năng lực và giảng dạy
về các vấn đề/giải pháp môi trường hoặc về Khoa học dữ liệu
Quan hệ đối tác GRID-Geneva mang đến một giao diện Chính sách khoa học mạnh mẽ: với Đại học Geneva về khoa học vững chắc, các cơ sở tính toán lớn và chính phủ Thụy Sĩ để tư vấn và hỗ trợ các chính sách, cung cấp hỗ trợ mạnh mẽ cho Chương trình Môi trường của Liên hợp
quốc UNEP/GRID-Geneva được hợp nhất trong Chi nhánh Dữ liệu lớn, thuộc Ban Khoa học của Chương trình Môi trường Liên hợp quốc Nó cũng là một phần của Quan hệ đối tác toàn cầu, bao gồm hơn 15 trung tâm trên toàn thế giới, làm việc cùng nhau để giữ cho môi trường được xem xét và hỗ trợ UNEP xử lý dữ liệu
8 NASA Earth Observations
Trung tâm truy cập mở Copernicus (trước đây gọi là Trung tâm dữ liệukhoa học Sentinels) cung cấp quyền truy cập mở, miễn phí và đầy đủ tớicác sản phẩm người dùng Sentinel-1 Sentinel-2 Sentinel-3 , , và Sentinel-5P , bắt đầu từ Đánh giá vận hành trong quỹ đạo (IOCR )
Dữ liệu Sentinel cũng có sẵn thông qua Dịch vụ truy cập thông tin và dữliệu Copernicus (DIAS) thông qua một số nền tảng
Trang 269 Công cụ tải ảnh Sentinel của ESA
IPUMS cung cấp dữ liệu điều tra dân số và khảo sát từ khắp nơi trên thế giới được tích hợp theo thời gian và không gian Tài liệu và tích hợp IPUMS giúp
dễ dàng nghiên cứu sự thay đổi, tiến hành nghiên cứu so sánh, hợp nhất thông tin giữa các loại dữ liệu và phân tích các cá nhân trong bối cảnh gia đình và cộng đồng Dữ liệu và dịch vụ có sẵn miễn phí
10.Terra Populurs
- Tổng điều tra, khảo sát dân số
- Dữ liệu che phủ đất được phân loại từ hình ảnh vệ tinh
- Nhiệt độ, lượng mưa và dữ liệu khí hậu liên quan dựa trên các phép đo của trạm thời tiết
- Dữ liệu sử dụng đất thu được từ các cuộc điều tra dân số và khảo sát kết hợp với dữ liệu viễn thám
- Dữ liệu có thể tương tác qua thời gian, không gian và lĩnh vực khoa học cho phép các nhà nghiên cứu hiểu được sự biến đổi mạnh mẽ của cư dân trên trái đất và môi trường của họ TerraPop tích hợp dữ liệu trên các miền thông quacác chuyển đổi dựa trên vị trí giữa ba cấu trúc dữ liệu chính: raster, cấp độ khu vực và vi dữ liệu Sự tích hợp này cho phép các nhà nghiên cứu khám phá và sử dụng các bộ dữ liệu từ các ngành khác mà nếu không họ sẽ không quen thuộc hoặc thấy khó sử dụng Với khả năng truy cập dữ liệu dễ dàng từ nhiều miền, các nhà nghiên cứu được trao quyền để tiến hành nghiên cứu liên ngành tiên tiếnnhằm giải quyết các vấn đề phức tạp tại điểm giao nhau giữa hệ thống con người
Trang 27- Chạy các mô hình TIN cho kết quả yếu tố cao độ và độ dốc.
- Tính khoảng cách cho các thuộc tính
- Tính điểm chung cuộc
- Đánh giá các kết quả đạt được
Trang 28Hình 1 Các lớp dữ liệu 1.2 Quá trình chạy mô hình
1.2.1 Xây dựng mô hình số độ cao dưới dạng TIN
- Trên thanh công cụ của ArcToolbox chọn 3D Analyst, tiếp theo chọn DataManagement, tiếp đến là TIN cuối cùng chọn Create TIN → Hộp thoại Create TIN sẽ xuất hiện
Trang 29Hình 2 ArcToolbox
- Hộp thoại Create TIN hiện ra (hình dưới) chọn Input Feature Class là
Hình 3 Hộp thoại Create TIN
- Bấm nút OK, ArcMap sẽ tạo ra lớp mới là TIN
Trang 30Hình 4 TIN 1.2.2 Mô hình số độ cao
- Trên thanh công cụ ArcToolbox chọn 3D Analyst chọn Conversion → From TIN chọn TIN to Raster hộp thoại hiện ra trong đó Input TIN chọn file:
Hình 5 TIN to Raster