1. Trang chủ
  2. » Khoa Học Tự Nhiên

Chương 3 cơ sở dữ liệu và cấu trúc dữ diệu bản đồ

75 737 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 75
Dung lượng 4,66 MB

Nội dung

CÁC ĐƠN VỊ BẢN ĐỒBản đồ là tập hợp các điểm, các đường, các miền vùng được định nghĩa cho cả vị trí của chúng trong không gian và cho cả các thuộc tính phi không gian.. Cơ sở dữ liệu khô

Trang 1

Please purchase a personal

license.

Trang 2

CHƯƠNG 3: CƠ SỞ DỮ LIỆU VÀ CẤU TRÚC

- Cơ sở dữ liệu không gian

- Cơ sở dữ liệu thuộc tính 3.2

Cấu trúc cơ sở dữ liệu

- Khái niệm cấu trúc cơ sở dữ liệu

- Cấu trúc dữ liệu Raste

- Cấu trúc dữ liệu Vector

- Chuyển đổi giữa các kiểu cấu trúc DL

3.3

Trang 3

3.1 CÁC ĐƠN VỊ

BẢN ĐỒ

Trang 4

KHÁI NIỆM VỀ HÌNH HỌC TOPO (TOPOLOGY)

Topology là m ột thủ tục toán học nhằm xác định

m ối liên hệ không gian giữa các đối tượng bản đồ.

Tập hợp dữ liệu số miêu tả rõ ràng các đối tượng

lin k ề, cha trong nhautính liên tc giữa các đối tượng bản đồ mà có thể lưu trữ và thao tác trên máy tính.

Trang 5

CÁC ĐƠN VỊ BẢN ĐỒ

Bản đồ là tập hợp các điểm, các đường, các miền (vùng) được định nghĩa cho cả vị trí của chúng trong không gian và cho cả các thuộc tính phi không gian.

Mọi dữ liệu địa lý cần phải quy về ba khái niệm hình học cơ bản là:

- Điểm

- Đường

- Vùng

Trang 6

CÁC ĐƠN VỊ BẢN ĐỒ

 Điểm: Là đối tượng không có kích thước được đặc trưng

bằng vị trí điểm.

Ví dụ: Chùa, cột điện, cây độc lập

 Đường: Là đối tượng một chiều, có vị trí, có chiều dài.

Ví dụ: Sông, suối, đường ranh giới, đường giao thông

 Vùng: Là đối tượng hai chiều, có chiều dài và chiều rộng

(hay có diện tích).

Ví dụ: Thửa đất, sông, hồ

Trang 7

Một số hình dạng không gian cơ bản

Trang 8

3.2 CƠ SỞ DỮ LIỆU

BẢN ĐỒ

Trang 9

Qua phần mềm điều hành có thể tạo ra hình ảnh bản đồ cụ thể.

Qua phần mềm điều hành của GIS có thể tạo

ra hình ảnh bản đồ trên màn hình hoặc in ra giấy.

Trang 11

 Cơ sở dữ liệu không gian

Cơ sơ dữ liệu không gian là: Loại dữ liệu thể hiện chính xác vị trí trong không gian thực của đối tượng và quan hệ giữa các đối tượng qua mô tả hình học, mô tả bản đồ và mô tả topology.

Đối tượng không gian của BĐ số gồm: Các điểm khống chế tọa độ, địa giới hành chính, các thửa đất, các lô đất, các công trình xây dựng, hệ thống giao thông, thuỷ văn và các yếu tố khác có liên quan.

Các dữ liệu không gian thể hiện các đối tượng

b ản đồ qua ba yếu tố hình học cơ bản là điểm, đường và vùng.

Trang 12

 Cơ sở dữ liệu không gian

Thông tin vị trí các đối tượng bản đồ luôn phải kèm theo các thông tin về quan hệ không gian (Topology), nó được thể hiện qua ba kiểu quan hệ: Liên thông nhau, kề nhau, nằm trong hay bao nhau.

Ví dụ: Dữ liệu không gian của thửa đất chính

là toạ độ các góc thửa (điểm), ranh giới thửa (đường khép kín) và miền nằm trong ranh giới.

Chúng được mô tả bằng ký hiệu bản đồ dạng đường.

Trang 13

 Cơ sở dữ liệu thuộc tính

CSDL thuộc tính (CSDL phi không gian): Là những diễn tả đặc tính, số lượng, mối quan hệ của các hình ảnh bản đồ với vị trí địa lý của chúng.

C ần phân biệt hai loại thuộc tính sau đây:

- Thu ộc tính định lượng: Kích th ước, diện tích

- Thuộc tính định tính: Màu sắc, tên, tính chất… Thông thường các dữ liệu thuộc tính được thể

hi ện bằng các mã và lưu trữ trong các bảng hai chiều.

Tuỳ theo đ ặc điểm chuyên đề và thuộc tính của

nó mà các đối tượng được xếp vào các lớp khác nhau.

Trang 14

 Cơ sở dữ liệu thuộc tính

Ví dụ 1: Thông tin thuộc tính của dữ liệu cơ sở hạtầng gồm: Các loại đường, hệ thống thủy lợi, thủy văn, mạng lưới điện, mạng lưới cấp thoát nước, các công trình cơ sở hạ tầng

Ví dụ 2: Thông tin thuộc tính của dữ liệu địa chính gồm: Số hiệu thửa đất, diện tích, chủ sử dụng đất, địa chỉ, địa danh, phân loại đất, phân hạng đất, giá đất, mức thuế và thông tin pháp lý

Ví dụ 3: Thông tin thuộc tính của dữ liệu về hiện trạng rừng gồm: Số hiệu các lô rừng, tên lô, diện tích

lô, trạng thái, loài cây, trữ lượng

Trang 17

Courtesy Village of Garden City

Liên k ế t các thuc tính và đồ ha

Trang 18

3.3 CẤU TRÚC

CƠ SỞ DỮ LIỆU

Trang 19

3.3 CẤU TRÚC CƠ SỞ DỮ LIỆU

 Khái niệm cấu trúc cơ sở dữ liệu

Một cơ sở dữ liệu bao gồm nhiều tệp dữ liệu.

Cấu trúc cơ sở dữ liệu là: Cách

bố trí, tổ chức cơ sở dữ liệu để có thể truy nhập dữ liệu từ một hay nhiều tệp một cách dễ dàng.

Trang 20

3.3 CẤU TRÚC CƠ SỞ DỮ LIỆU

 Cấu trúc cơ sở dữ liệu THUỘC TÍNH

Có 3 lo ại mô hình cấu trúc cơ sở dữ liệu

thuộc tính đó là:

- Cấu trúc phân cấp (dạng cây)

- Cấu trúc mạng (dạng lưới)

- Cấu trúc quan hệ

Trang 21

MÔ HÌNH PHÂN CẤP (DẠNG CÂY)

- Phức tạp, ít linh hoạt

Trang 23

MÔ HÌNH QUAN HỆ

- Mô hình CSDL hệ là hệ thống CSDL quan hệ.

- Hệ thống CSDL quan hệ là một tập hợp các bảng dữ liệu Mỗi bảng là 1 ma trận gồm 1 chuỗi các hàng và cột giao nhau.

- Mối quan hệ giữa các bảng: Cột dữ liệu chung giữa 2 bảng, cột dữ liệu chung này được gọi là

“khóa liên kết” để nối dữ liệu từ bảng này sang bản kia.

Trang 24

- Công việc thiết kế CSDL đòi hỏi kỹ năng chuyên môn cao.

Trang 25

3.3 CẤU TRÚC CƠ SỞ DỮ LIỆU

DỮ LIỆU RASTER 1

DỮ LIỆU VECTOR 2

Dữ liệu trong hệ GIS còn được gọi là thông tin không gian Dạng dữ liệu này bao gồm các thông tin cótính đồ họa chỉ rõ hình dạng, phạm vi không gian, vị trí địa lý của một thực thể trong thế giới thực được khái quát hóa thành các đặc tính địa lý như điểm, đường hay vùng trên bản đồ dưới dạng raster hoặc vector

Như vậy có hai cách cơ bản nhất cho việc biểu diễn dữ liệu KHÔNG GIAN:

Trang 26

CU TRÚC DLIU KHÔNG GIAN

RASTER

VECTOR

TG THỰC

Trang 27

CẤU TRÚC

DỮ LIỆU RASTER

Trang 28

 Dữ liệu Raster (ma trận)

Mô hình dữ liệu dạng raster phản ánh toàn

bộ vùng nghiên cứu dưới dạng một lưới các ô vuông (cell) hay điểm ảnh (pixcel).

Dữ liệu trong mô hình Raster được tổ chức thành ma trận các cell (ô) hay pixcel.

Điểm: Được thể hiện bằng một pixel.

Đường: Được thể hiện bằng một chuỗi các pixel

Vùng: Được thể hiện bằng 1 nhóm các pixel

Trang 30

Trên hình A là một thể hiện bản đồ đất, mỗi vùng được đánh dấu bằng các ô theo các giá trị khác nhau Ta có được một lưới các ô có giá trị khác nhau

Trên hình B nếu gán nước giá trị 1, rừng giá trị 2, đất nông nghiệp giá trị 3 ta sẽ có một mảng số liệu từ các giá trị 1,2,3.

Biểu diễn dữ liệu Raster theo lưới điểm

CÁCH BIỂU DIỄN DỮ LIỆU RASTER

Trang 31

CÁCH BIỂU DIỄN DỮ LIỆU RASTER

Dữ liệu Raster có thể có một hoặc nhiều nhãn Giá trị của mỗi ô có thể mang các giá trị khác nhau Có hai cách để hiển thị raster với giá trị của ô.

- Hiển thị nhãn đơn (single-band)

- Hiển thị nhãn bội (multi-band)

Trang 32

Hiển thị nhãn đơn

Hiển thị nhãn bội

Trang 33

 Tổ chức dữ liệu Raster trong GIS

* Mục đích: Là để tối ưu hóa việc nhập dữ liệu, giảm bớt sự lưu trữ và các yêu cầu về xử lý dữ liệu

* Cách tổ chức:

- Các đặc tính địa lý được tổ chức thành các tầng (lớp) dữ liệu

- Tổ chức lớp theo kiểu các đặc tính (điểm, đường, vùng) vàtheo nhóm chuyên đề Được lưu trữ trong các lớp riêng biệt

- Các đặc tính có thể tổ chức theo chuyên đề mà nó đại diện

- Chúng tổ chức thành các tầng (lớp) dữ liệu khác nhau nhưng phải cùng chung một vùng quan trắc địa

Trang 34

 Các nguồn xây dựng dữ liệu Raster

Các nguồn DL xd nên DL raster có thể bao gồm:

- Quét ảnh

- Ảnh máy bay, ảnh viễn thám

- Chuyển từ dữ liệu vector sang

- Lưu trữ dữ liệu dạng raster

- Nén theo hàng

- Nén theo chia nhỏ thành từng phần

- Nén theo ngữ cảnh

Trang 35

 Các đặc điểm của dữ liệu Raster

Mô hình dữ liệu raster có các đặc điểm:

- Các điểm được xếp liên tiếp từ trái qua phải và từ trên xuống dưới.

- Mỗi 1 điểm ảnh (pixcel) chứa một giá trị

- Một tập các ma trận điểm và các giá trị tương ứng tạo thành một lớp (layer).

- Trong cơ sở dữ liệu có thể có nhiều lớp.

- Dung lượng dữ liệu lớn

Trang 36

CÁC PHƯƠNG PHÁP NÉN DỮ LIỆU

RASTER

Mục đích: Giảm kích thước lưu trữ

Các phương pháp nén dữ liệu Raster:

- Phương pháp nén theo đường biên vùng (Chain Code)

- Phương pháp nén theo hàng cột (Run-length code)

- Phương pháp nén theo khối (Block code)

- Phương pháp nén cây tứ phân (Quadtree code)

Trang 37

 Phương pháp nén theo đường biên vùng (Chain Code)

Các đường biên của các vùng được thể hiện bằng hàng liên tục các vector đơn vị theo hướng 4 phương, được qui ước bằng các số: hướng Đông = 0, Bắc = 1, Tây = 2, Nam = 3.

Ví dụ trên nếu ta bắt đầu từ cell của hàng 0 theo chiều kim đồng hồ ta sẽ có dãy giá trị sau thể hiện đối tượng:

1

1

1 1 1 1

1

1 1 1

1

1 1 1 1

1 1 1

1 1 1

Trang 38

ƯU NHƯỢC ĐIỂM

Phương pháp nén theo đường biên vùng (Chain Code)

 Ưu điểm:

 Là phương pháp nén dữ liệu raster hiệu quả.

 Dễ dàng tiến hành tính chu vi và diện tích, nhận biết lồi lõm, thay đổi hướng đột ngột.

 Nhược điểm:

 Khó khăn trong phân tích chồng xếp.

 Dư thừa dữ liệu vì đường biên lưu trữ hai lần.

Trang 39

 Phương pháp nén theo hàng cột (Run-length code)

Các điểm trên mỗi đơn

vị bản đồ được lưu trữ theo

hàng từ trái qua phải từ

cell đầu đến cell cuối.

đã giảm đáng kể bộ nhớ

Trang 40

ƯU NHƯỢC ĐIỂM

Phương pháp nén theo hàng cột (Run-length code)

Trang 41

 Phương pháp nén theo khối (Block code)

Ví dụ: Trên có thể viết dưới dạng nén block code 2n x 2n như sau:

- 7 block 1 đơn vị ô vuông

- 7 block 4 đơn vị ô vuông

Phương pháp này có hiệu quả với các vùng có diện tích lớn và hình dạng các đường biên đơn giản, có thể kiểm tra sự

co giãn về hình dạng của vùng.

Là phương pháp sử dụng cho các dữ liệu 2N x 2N khối các

đơn vị ô vuông, (N là những số nguyên: N = 0, 1, 2 ) Khi N = 0 thì khối ô vuông có số đơn vị ô vuông là 1 (là khối lượng ô vuông nhỏ nhất trong một khối).

Trang 42

 Phương pháp nén cây tứ phân (Quadtree code)

Đây là phương pháp nén thểhiện sự chia liên tục của dạng ma trận 2N x 2N thành cây ¼

Giới hạn thấp nhất của phép chia là một ô vuông, ma trận được chia làm 4 nhánh và cứ thế chia cho đến khi đạt được các đơn vị ô vuông đồng nhất

Trang 43

ƯU NHƯỢC ĐIỂM

Phương pháp nén cây tứ phân (Quadtree code)

- Khó khăn cho việc chọn các mô hình, giải pháp

- Một vùng có thể chia thành rất nhiều phần gây khó khăn cho việc truy nhập DL

Trang 44

Nhận xét:

Tóm lại khi bản đồ bao gồm n x n ô vuông (cell) mỗi

ô chứa một giá trị thông số thuộc tính khác nhau thì ý định giảm lượng bộ nhớ lưu trữ sẽ rất khó thực hiện được

Hạn chế của cấu trúc dữ liệu loại raster chủ yếu do nótạo nên khối lượng lưu trữ lớn Tuy vậy khi tồn tại những đồng nhất về giá trị thông số thuộc tính thì ta có thể sửdụng một trong bốn phương pháp lưu trữ nén đã trình bày ở trên

Phương pháp run - length code có hiệu quả nhất trong việc hiển thị và lưu trữ các vùng có kích cỡ pixel lớn Khi độ phân giải lớn, số lượng pixel trong một vùng tăng lên thì nên sử dụng phương pháp nén Block hay Quadtree sẽ có hiệu quả hơn

Trang 45

CẤU TRÚC

DỮ LIỆU VECTOR

Trang 46

Theo quan niệm toán học thì vector bao gồm 1 điểm (v ới cặp

t ọa độ x, y trong KG phẳng hay x, y, z trong KG 3 chiều), một khoảng cách và 1 chỉ số hướng

Như vậy: C ấu trúc DL vector là các thể hể hiện chính xác

các c ặp tọa độ và xác định MQH không gian của các đối tượng.

Cấu trúc vector coi vật thể tự nhiên là tập hợp các thực thể không gian cơ sở (Điểm, Đường, Vùng) và tổ hợp các thực thểnày Các thực thể này được thành lập trên cơ sở các cặp tọa độ (x, y) của các điểm trong 1 hệ tọa độ nhất định

Trang 47

 ĐIỂM

Điểm được xem như là đại diện bao trùm hầu hết tất

cả các thực thể địa lý và đồ hoạ Điểm được xác định bởi cặp giá trị điểm Các đối tượng kiểu điểm có đặc điểm:

- Là toạ độ đơn (x,y)

- Không thể hiện chiều dài và diện tích

Trang 48

CÁC CT ĐÈN

Trang 49

 ĐƯỜNG (ĐOẠN THẲNG)

Đường được xác định như một tập hợp dãy của các điểm Mô

tả các đối tượng đlý dạng tuyến, có các đặc điểm sau:

- Là một dãy các cặp toạ độ (X, Y)

- Một ĐƯỜNG bắt đầu và kết thúc bởi node

- Các ĐƯỜNG nối với nhau và cắt nhau tại node

- Hình dạng của ĐƯỜNG được ĐN bởi các điểm

- Độ dài chính xác bằng các cặp toạ độ

Trang 51

ĐƯỜ NG PH

Trang 52

 VÙNG (DIỆN TÍCH)

Vùng được xác định bởi ranh giới các đường thẳng Các đối tượng địa lý có diện tích và đóng kín bởi một đường được gọi là đối tượng vùng polygons, có các đặc điểm sau:

- Polygons được mô tả bằng tập các đường và điểm nhãn

- Một hoặc nhiều đường định nghĩa đường bao của vùng

- Một điểm nhãn nằm trong vùng để mô tả, xđ cho mỗi 1 vùng

Trang 55

KiÓu VÞ trÝ ĐiÓm 3,2

Đ−êng 1,5; 3,5; 5,7; 8,8; 11,7 Vïng 5,3; 6,5; 7,4; 9,5; 11,3; 8,2; 5,3

Điểm: Được thể hiện bằng một cặp toạ độ

Đường: Được thể hiện bằng một chuỗi các cặp toạ độ

Vùng: Được thể hiện bằng một chuỗi các cặp toạ độ và cặp

toạ độ đầu và cặp toạ độ cuối trùng nhau

SỰ THỂ HIỆN DỮ LIỆU DẠNG VECTOR

Trang 56

Tính liên tục: Các đường nối với nhau tại các điểm nút (node).

Tính kề nhau: Các đường tham gia

ĐN vùng ở cả hai bên: phải và trái.

Đầu, cuối giao của đường

Tính tạo vùng: Các đường nối với nhau tạo thành đường bao của vùng.

QUAN HỆ TRONG CẤU TRÚC MẠNG VECTOR (VECTOR TOPOLOGY)

Trang 57

- Các đường ranh giới thửa không được phép giao nhau,

ph ải luôn cắt nhau tại đầu hoặc cuối đường (tại điểm nút NODE)

Áp dụng mô hình topology khi XD CSDL không gian

- Đường ranh giới tạo thành đường bao thửa đất luôn đảm

b ảo tính khép kín tuyệt đối về toạ độ.

Mô hình dữ liệu Vector Topology

Trang 58

DỮ LIỆU KHÔNG GIAN CHUẨN

C ơ sở dữ liệu chuẩn là dữ liệu không còn lỗi như:

bt quá, bt chưa ti, vùng chưa khép….

Trang 59

CÁC NGUỒN XD DỮ LIỆU VECTOR

- Từ số liệu đo: Sử dụng các lệnh (công cụ vẽ)

- Từ bản đồ sẵn có: Số hóa bản đồ

- Chuyển từ dữ liệu Raster: Vector hóa

+ Bằng tay: Số hóa trên ảnh Raster

+ Sử dụng công cụ (tự động)

- Chuyển đổi từ các dạng (phần mềm) khác

(Sử dụng chức năng chuyển đổi của phần mềm)

Trang 60

Các bn đồ điệ n t ử ở hai đị nh dng Raster và Vector

Trang 61

Các mô hình dliu Raster và Vector

Miêu tả Vector

X-AXIS

500 400 300 200 100

600 500

400 300 200 100

B G G

BK

B B B

G G

G G G

Trang 62

DỮ LIỆU VECTOR

DỮ LIỆU RASTER

SO SÁNH ĐÁNH GIÁ ƯU NHƯỢC ĐIỂM

DỮ LIỆU RASTER VÀ DỮ LIỆU VECTOR

SO SÁNH, ĐÁNH GIÁ

Trang 63

SO SÁNH DL RASTER VÀ DL VECTOR

Do cấu trúc DL khác nhau nên việc lưu trữ hai loại DL này là hoàn toàn khác nhau nhưng việc so sánh sẽ giải thích được phần nào cho các khả năng ứng dụng của 2 loại DL này.

Các chỉ số so sánh cơ bản dựa trên:

- Khối lượng bộ nhớ để lưu trữ (hiệu suất lưu trữ dữ liệu)

- Tốc độ truy cập, độ ổn định

- Hiệu suất xử lý và phân tích dữ liệu

- Độ chính xác khi hiển thị dữ liệu

Trang 64

ƯU NHƯỢC ĐIỂM DỮ LIỆU RASTER

- Có cấu trúc dữ liệu đơn giản

- Dễ dàng sử dụng các phép toán chồng xếp và các phép toán xử lý ảnh viễn thám

- Dễ dàng thực hiện nhiều phép toán PT khác nhau

- Các bài toán mô phỏng có thể thực hiện được do đơn vị không gian giống nhau (ô đơn vị)

- Kỹ thuật xử lý đơn giản, công nghệ rẻ

 Nhược điểm:

- Dung lượng dữ liệu lớn

- Độ chính xác có thể giảm nếu sử dụng không hợp lý kích thước các ô đơn vị

- Bản đồ hiển thị không đẹp

- Có thể mất thông tin ở những vùng giao nhau

- Khối lượng tính toán để chuyển đổi tọa độ là rất lớn

Trang 65

ƯU NHƯỢC ĐIỂM DỮ LIỆU VECTOR

 Ưu điểm:

- Biểu diễn tốt dữ liệu địa lý

- Dữ liệu nhỏ gọn

- Các quan hệ Topo được xác định bằng mạng kết nối

- Chính xác về hình học, chất lượng không thay đổi khi phóng to

- Khả năng sửa chữa, bổ sung, thay đổi các dữ liệu hình học cung như thuộc tính nhanh, tiện lợi

Trang 66

BẢNG SO SÁNH DL RASTER VÀ DL VECTOR

NhanhChậm

Tốc độ truy cập

10

Đơn giảnPhức tạp

Lưu trữ

9

Phức tạpĐơn giản

Khả năng tạo lập bản đồ

8

KémTốt

Khả năng phối hợp các dữ liệu

7

KémTốt

Khả năng phân tích vùng

6

CaoThấp

Độ chính xác hình học

5

Phức tạpĐơn giản

Cấu trúc dữ liệu

4

TốtTrung bình

Chất lượng đồ hoạ

3

NhỏLớn

Khối lượng dữ liệu

2

ChậmNhanh

Nhập dữ liệu

1

Vector Raster

Chỉ tiêu STT

Ngày đăng: 06/12/2015, 22:06

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w