Các mô hình dữ liệu địa lý

Một phần của tài liệu Phát triển hệ thống tìm kiếm du lịch tại hà nội dựa trên công nghệ web GIS (Trang 26 - 34)

Mô hình dữ liệu địa lý là sự hình dung thế giới thực được sử dụng trong GIS để tạo các bản đồ, trình diễn các tra vấn giữa người và máy, và thực hiện các phép xử lý-phân tích. Hai mô hình dữ liệu địa lý phổ biến nhất trong một Hệ thống thông tin địa lý là dữ liệu vector dữ liệu raster.

2.1.1.4.1. Mô hình dữ liệu Vector a). Giới thiệu mô hình dữ liệu Vector

Mô hình dữ liệu vector coi hiện tượng là tập các thực thể không gian cơ sở và tổ hợp giữa chúng. Các đối tượng không gian khi biểu diễn ở cấu trúc dữ liệu vector được tổ chức dưới dạng điểm (point), đường (line) và vùng (polygon) và được biểu diễn trên một hệ thống tọa độ nào đó.

- Điểm: điểm là hình thức cơ bản nhất của dữ liệu vector. Điểm (thực thể địa lý) được thể hiện như một vector có độ dài bằng không (không có kích

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

thước), và vị trí của nó được xác định bởi một cặp tọa độ (x,y) duy nhất. Ngoài ra thì các dữ liệu mô tả điểm đó như ký hiệu, tên gọi…cũng được lưu trữ cùng với cặp tọa độ.

Điểm biểu diễn các feature (tính năng) không có miền bao hay độ dài. Nhiều khi nó biểu diễn các tính năng có kích thước quá nhỏ so với tỷ lệ của bản đồ. Ví dụ như vị trí các cột đèn, vị trí xảy ra tai nạn, các trung tâm (địa chỉ, chủ sở hữu)…

- Đường: Thực thể đường (line entity): được định nghĩa như là tập hợp các thực thể địa lý được xác định bằng những đoạn thẳng có ít nhất hai hay nhiều cặp tọa độ. Đường đơn giản nhất là đường nối giữa hai điểm bất kỳ có toạ độ (Xi, Yi) và (Xj Yj) và có thể kèm theo dữ liệu ký hiệu thể hiện nó trên bản đồ. Điểm xuất phát và điểm kết thúc của đường gọi là nút (node) và các điểm tạo nên đường gọi là đỉnh (Vertices). Đường dùng để biểu diễn các feature có chiều dài xác định nhưng không có miền bao hay những feature rất hẹp so với tỷ lệ bản đồ. Ví dụ như: Đường phố, sông suối, hệ thống nước…

- Vùng Polygons là đối tượng hai chiều, có vị trí, có chiều dài, và có cả chiều rộng (hay có diện tích) khép kín bởi các đường. Vậy vùng là tổ hợp của đường khép kín nên toạ độ của vùng tại ranh giới vùng chính là toạ độ của các điểm (nút hoặc vertex) nằm trong các đường hình thành nên vùng. Khi có bất kỳ toạ độ nào nằm trong vùng mà không được ghi nhận trong cơ sở dữ liệu vùng, GIS có thể cho phép đưa ra toạ độ của chúng bằng các modul nội suy một cách nhanh chóng và chính xác. Vùng được dùng để biểu diễn các tính năng có miền bao xác định: ruộng đất, ao, hồ, vùng lũ lụt….

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

b) Cấu trúc trong dữ liệu Vector

1. Cấu trúc Spaghetti:

Theo cấu trúc dữ liệu Spaghetti mỗi điểm được xác định bằng cặp tọa độ (x,y), mỗi đường được biểu diễn bằng một chuỗi những cặp tọa độ (xi,yi) này, và mỗi vùng cũng được xác định bằng một chuỗi các cặp tọa độ (xi,yi) nhưng có tọa độ điểm đầu và tọa độ điểm cuối trùng nhau. Cấu trúc Spaghetti không lưu trữ các đặc trưng giống nhau của các đối tượng không gian trên cùng hệ tọa độ, nghĩa là tại đường chung của hai vùng kề nhau thì có hai đường độc lập.

Ví dụ cho hai vùng : Vùng 1 và vùng 2 có cung AB chung, cấu trúc Spaghetti biểu diễn hai vùng như sau:

B(XB,YB ), 1 2 A(XA,YA ), Đặc trưng Vị trí Điểm A A(XA,YA ), Cung AB (XA,YA), Vùng 1 (X1A ,Y1A), Vùng 2 (X2A ,Y2A), Bảng 2.1. Cấu trúc Spaghetti

Cấu trúc Spaghetti thường được sử dụng để lập bản đồ số, nhưng không thích hợp cho bài toán phân tích GIS vì không mô tả được các quan hệ không gian.

2. Cấu trúc Topology

Để giải quyết vấn đề quan hệ không gian thì cấu trúc Topology là một phương án khả thi. Trong hệ thống thông tin địa lý, cấu trúc Topology còn gọi là cấu trúc cung- nút (arc-node). Cấu trúc Topology được xây dựng trên mô hình dữ liệu cung-nút với cung là phần tử cơ sở. Việc xác định các đối tượng không gian dựa trên các định nghĩa sau:

Vùng là tập hợp các cung nối liền và khép kính, những cung này chính là đường biên của vùng. Một vùng có thể được giới hạn bởi hai đường cong khép kín lòng vào nhau và không cắt nhau.

Trong cấu trúc Topology, các đối tượng không gian được mô tả trong bốn bảng dữ liệu: bảng tọa độ cung, bảng topology cung, bảng topology nút và bảng topology vùng. Giữa các bảng này có quan hệ với nhau thông qua cung. Từ đây, ta có thể phân tích các quan hệ của các đối tượng không gian trên cùng một hệ tọa độ.

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ Hình 2.10. Dữ liệu topology vector

Topology vùng Vùng Cung A AB,AaB B AB,AbB Vùng ngoài a và b Ngoài Bảng 2.2. Bảng Topology vùng Topology cung

Cung Nút đầu Nút cuối Vùng trái Vùng phải

AB A B A B AaB A B Vùng ngoài A Aba A B b Vùng ngoài Bảng 2.3. Bảng Topology cung Topology nút Nút Cung A AB,AaB B AB,AbB Bảng 2.4. Bảng Topology nút

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

Dữ liệu tọa độ cung

AB A B

AaB A a1, a2, a3, a4, a5 B

AbB A b1, b2, b3 B

Bảng 2.5. Bảng dữ liệu tọa độ cung

- Bảng Topology vùng xác định những cung làm đường biên của vùng, phần bên ngoài bản đồ cũng được xem như một vùng không xác định cung đường biên.

- Bảng Topology nút xác định mỗi nút thuộc những cung nào. - Bảng Topology cung xác định quan hệ của nút và vùng với cung.

Từ ba bảng này, ta có thể phân tích các quan hệ của các phần tử trong bản đồ. Bảng thứ tư lưu trữ tọa độ của các cung bằng cách lưu trữ tọa độ của các nút và các đỉnh của cung, để từ đó vị trí của mỗi phần tử trên bản đồ được liên hệ với thế giới thực.

2.1.1.4.2. Mô hình dữ liệu Raster a) Giới thiệu mô hình dữ liệu Raster

Cấu trúc raster là một trong những cấu trúc dữ liệu đơn giản nhất trong GIS. Nó còn được gọi là “tổ chức theo ô vuông của dữ liệu không gian” (cellular organization of spatial data). Nó biểu diễn các đặc trưng địa lý bằng các điểm ảnh (pixel). Pixel là phần tử cơ sở của cấu trúc dữ liệu Raster để biểu diễn một đặc trưng địa lý f(x,y) nào đó, giá trị của pixel chỉ tính chất của đối tượng không gian. Giá trị số của pixel chính là mã được gắn cho đối tượng không gian (tức là mỗi đối tượng không gian có một mã nhất định). Giá trị bằng không thường là những pixel chỉ vùng ngoài khu vực nghiên cứu. Dữ liệu Raster gắn liền với dữ liệu dạng ảnh hoặc dữ liệu có tính liên tục cao. Dữ liệu Raster có thể biễu diễn được rất nhiều các đối tượng từ hình ảnh bề mặt đất đến ảnh chụp từ vệ tinh, ảnh quét và ảnh chụp. Định dạng dữ liệu Raster rất đơn giản nhưng hỗ trợ rất nhiều kiễu dữ liệu khác nhau. Có thể sử dụng số nguyên, số thực, ký tự hay tổ hợp chúng để làm giá trị. Mỗi đặc tính giống nhau sẽ có cùng giá trị số. Độ chính xác của mô hình raster phụ thuộc vào kích thước hay độ phân giải của các pixel. Một điểm có thể là là một điểm ảnh, một đường là vài điểm ảnh liền kề nhau, một vùng là tập hợp nhiều điểm ảnh.

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ Hình 2.11. Biểu đồ dữ liệu raster (Nguồn: Đặng Văn Đức, 2001)

b)Đặc điểm dữ liệu raster

Raster được tạo nên bởi một mảng hai chiều các điểm ảnh hay cell. Cell là một đơn vị đồng nhất biểu diễn một vùng xác định trên trái đất. Các cell có cùng kích thước. Góc tọa độ của hệ được đặt tại cell nằm tại đỉnh góc trái. Mỗi cell được xác định bởi chỉ số dòng và chỉ số cột, đồng thời nó chứa một số nguyên ( hoặc số thực) biểu diễn kiểu hay giá trị thuộc tính xuất hiện trên bản đồ.

Kích thước của cell trong raster phụ thuộc nhiều vào độ phân giải dữ liệu. Cell phải có kích thước đủ nhỏ để có thể thu thập chi tiết dữ liệu, nhưng cũng phải có kích thước đủ lớn để có thể phân tích dữ liệu một cách thuận tiện.

Trong cấu trúc dữ liệu raster, điểm, đường và vùng có thể được biểu diễn như sau.

Điểm có thể được biểu diễn bằng một cell, đường được biểu diễn bằng một tập các cell có hướng xác định, độ rộng của đường bằng chiều rộng của một cell. Vùng được biểu diễn bởi một dãy các cell nằm kề nhau.

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ Hình 2.12. Biểu diễn các đối tượng cơ sở trong raster

Các nguồn dữ liệu xây dựng nên dữ liệu raster có thể bao gồm: - Ảnh chụp từ vệ tinh, chụp từ máy bay, ảnh viễn thám

- Chuyển từ dữ liệu vector sang - Lưu trữ dữ liệu dạng raster

- Nén theo hàng (Run lengh coding)

- Nén theo chia nhỏ thành từng phần (Quadtree) - Nén theo ngữ cảnh (Fractal)

2.1.1.4.3. Chuyển đổi cơ sở dữ liệu dạng vector và raster

Tùy theo yêu cầu của người dùng hoặc yêu cầu của hệ thống máy tính mà có thể chọn cấu trúc dữ liệu dạng vector hoặc raster. Một số công cụ phân tích GIS phụ thuộc chặt chẽ vào mô hình dữ liệu raster, do vậy nó đòi quá trình biến đổi mô hình dữ liệu vector sang dữ liệu raster, hay có thể gọi là raster hóa. Hoặc ngược lại, biến đổi từ raster sang mô hình vector, hay còn gọi là vector hóa. Raster hóa là tiến trình chia đường hay vùng thành các ô vuông (pixcel). Vector hóa là tập hợp các pixcel để tạo thành đường hay vùng.

Hình 2.13. Sự chuyển đổi giữa hai mô hình vector và raster

Để chuyển đổi dữ liệu raster sang vector thường dựa vào sự khác biệt màu sắc từ 0 đến 256 byte của màu. Đối với đường thì việc chuyển đổi như sau: Vector đường sẽ gắn mã theo mức độ xám hay theo giá trị số màu của đường

Vector Raster

Hoá Hoá

RASTER VECTOR RASTER

Đường

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

trong raster. Đối với điểm cấu trúc vector được tạo nên bằng hệ tọa độ (x,y) của pixel và có giá trị thuộc tính hình học bằng giá trị bảng màu từ ảnh raster. Để chuyển một vùng từ raster sang vector trước hết nhận dạng đường biên của vùng bằng sự khác biệt các mã màu hoặc mức xám của các pixel trong vùng, sau đó chuyển đường biên đó sang dạng vector như là một đường.

Nhiệm vụ biến đổi vector sang raster là tìm tập hợp các pixel trong không gian raster trùng khớp với vị trí của điểm, đường, đường cong hay đa giác trong biểu diễn vector. Tổng quát, tiến trình biến đổi là tiến trình xấp xỉ vì với vùng không gian cho trước thì mô hình raster sẽ chỉ có khả năng địa chỉ hoá các vị trí toạ độ nguyên. Trong mô hình vector, độ chính xác của điểm cuối vector được giới hạn bởi mật độ hệ thống toạ độ bản đồ còn vị trí khác của đoạn thẳng được xác định bởi hàm toán học.

Hình 2.14. Chuyển đổi cấu trúc dữ liệu (Nguồn: Tor Bernhardsen, 1992)

2.1.1.4.4. So sánh ưu và nhược điểm của dữ liệu raster và vector

Dữ liệu raster có những ưu điểm sau:

- Trong mô hình raster toàn bộ dữ liệu hình thành bản đồ được lưu trong bộ nhớmáy tính. Do vậy, các thao tác kiểu như so sánh được thực hiện dễ dàng.

- Cấu trúc dữ liệu đơn giản, quá trình tính toán đơn giản hơn và dễ dàng hơn dữ liệu vector.

- Thuận lợi cho hiển thị không gian, thống nhất với dữ liệu ảnh, tự động thu nhận dữ liệu. Nhược điểm:

- Khó khăn trong việc lưu trữ dữ liệu. Bởi vì bản đồ thường được chia làm nhiều lớp, mỗi lớp gồm hàng triệu tế bào biểu diễn một đặc trưng địa lý nào

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

đó, cho nên số lương lưu trữ dữ liệu là khổng lồ, điều này dẫn đến khó khăn cho hệ thống thông tin.

- Kích thước ô định rõ sự quyết định ở phương pháp đại diện. Điều này đặc biệt khó để cân xứng với sự hiện diện đặc tính thuộc về đường thẳng.

- Kém chính xác về vị trí không gian của đối tượng. Khi độ phân giải càng thấp (kích thước pixel lớn ) thì sự sai lệch này càng tăng.

Dữ liệu vector có những ưu điểm sau:

- Vị trí của các đối tượng được định vị chính xác (nhất là các đối tượng điểm, đường và đường bao).

- Dễ lưu trữ dữ liệu hơn hệ thống dữ liệu raster nhờ dung lượng dữ liệu nhỏ, truy cập nhanh, chuyển đổi nhanh.

- Bản đồ gốc có thể được hiển diện ở sự phân giải gốc của nó. Điều này giúp cho người sử dụng đễ dàng biên tập bản đồ, chỉnh sửa, in ấn.

Nhược điểm:

- Khi thực hiện các phép chồng xếp và cập nhật bản đồ thì rất phức tạp.

- Vị trí của điểm đỉnh cần được lưu trữ một cách rõ ràng. Mối quan hệ của những điểm này phải được định dạng trong một cấu trúc thuộc về địa hình học, mà nó rất khó để hiểu và điều khiển.

- Giá thành thu thập dữ liệu đắt.

Một phần của tài liệu Phát triển hệ thống tìm kiếm du lịch tại hà nội dựa trên công nghệ web GIS (Trang 26 - 34)

Tải bản đầy đủ (PDF)

(84 trang)