Cấu trúc dữ liệu raster

Một phần của tài liệu Xay dung co so du lieu dia hinh tu nen ban dodia hinh (Trang 25 - 34)

Đây là cấu trúc dữ liệu mà trong đó dữ liệu đ−ợc thể hiện thành một mảng gồm các pixel và mỗi pixel đều mang giá trị của thông số đặc tr−ng cho đối tượng. Một khu vực trên bản đồ được biểu thị ở dạng số bằng cách lưu giữ vị trí (toạ độ tâm điểm của chúng hoặc toạ độ góc trái dưới), kích thước và tính tương ứng của mỗi pixel.

Đôi khi ng−ời ta áp dụng hình thức biểu thị với kích th−ớc pixel có hình dạng và kích thước đồng đều. Hình vuông là hình dạng pixel phổ biến nhất sau

đó là hình chữ nhật

Lưu ý rằng các đối tượng có kích thước lớn hơn 1/ 2 pixel sẽ được mã hoá

thành 1 pixel, còn các đối tượng có kích thước nhỏ hơn 1/ 2 pixel sẽ không được ghi lại. Từ đó ta nhận thấy kích thước pixel càng nhỏ thì việc thể hiện các đối t−ợng càng chi tiết và chính xác.

Nếu nhiều pixel kế tiếp nhau có cùng thuộc tính thì có khả năng nén không gian lưu trữ bằng cách mỗi thuộc tính được ghi kèm con số chỉ số lượng, những pixel có cùng thuộc tính nằm kề bên kế tiếp nhau khi đó sẽ tránh đ−ợc việc ghi lặp

những thông tin thuộc tính giống nhau nằm kế tiếp nhau .

Một cách khác để giảm ô nhớ là mã hoá theo dạng hình cây. Ta có thể bắt

Nguyễn Văn Thuỳ Lớp trắc địa B-K43

26

đầu từ hinh vuông, hình vuông này sau đó sẽ đ−ợc chia thành 4 hình vuông nhỏ hơn. Cứ tiếp tục phân chia hình vuông cho đến khi tất cả các pixel trong hình vuông có cùng một thuộc tính. Mức độ chia nhỏ phụ thuộc kích thước hình vuông. ở mức 0, mỗi hình vuông chỉ bao gồm một pixel đơn, ở mức 1 bao gồm 4 pixel kề nhau, ở mức n sẽ bao gồm toàn miền (ở ví dụ trên toàn miền có 64 pixel, n = 3 ). Địa chỉ của mỗi hình vuông có thể đ−ợc qui định bởi số hàng và số cột của pixel nằm ở hàng cuối phía trái, có thể tổ chức lưu trữ bởi 3 giá trị: địa chỉ, mức, thuộc tính .

Nh− vậy trong cấu trúc dữ liệu raster các yếu tố cơ bản đ−ợc biểu diễn nh−

sau:

YÕu tè ®iÓm

Điểm đ−ợc xác định nh− một pixel độc lập bao bởi các pixel có thuộc tính khác với nó.

YÕu tè ®êng

Đường được coi là tập hợp các pixel kế tiếp nhau theo một hướng nào đó cùng thuộc tính.

Yếu tố vùng

Vùng đ−ợc xác định bởi một tập hợp các đơn giản các pixel kế tiếp nhau cùng thuộc tính.

Thông thường khi lưu trữ cũng như biểu diễn thông tin theo dạng cấu trúc raster đa phần đều sử dụng thuật toán mã nhị phân. Những thông tin biểu diễn (hiển thị lên màn hình) đều đ−ợc gán mã là một, còn phần trống (không chứa thông tin) sẽ đ−ợc gán mã là 0 hoặc ng−ợc lại. Hình 2-1 mô tả việc gán mã nhị phân cho bản đồ.

Nguyễn Văn Thuỳ Lớp trắc địa B-K43

27

1 0 0 0 0 1 1 0

1 0 1 0 1 1 1 0

1 0 0 0 1 1 1 0

1 1 0 0 1 1 1 0

0 1 0 1 1 1 1 0

0 1 0 1 1 1 1 0

0 1 0 0 1 1 1 0

0 1 0 0 0 0 0 0

2. Cấu trúc dữ liệu vector

Cấu trúc vector là cấu trúc dữ liệu dựa trên các điểm có toạ độ để biểu diễn các đối tượng thông qua ba yếu tố cơ bản điểm, đường, vùng. Cấu trúc dữ liệu vector cho phép mô tả chính xác vị trí và mối quan hệ không gian của các đối t−ợng và hiện t−ợng. Sau đây là sự biểu diễn các yếu tố thông tin cơ bản trong cấu trúc dữ liệu vector.

YÕu tè ®iÓm

Điểm trong cấu trúc dữ liệu vector đ−ợc mô tả bởi cặp toạ độ X,Y trong một hệ thống toạ độ nhất định. Đi kèm theo giá trị toạ độ X,Y của điểm còn có chỉ số cụ thể để miêu tả đặc tính của điểm (điểm đơn giản, điểm kí tự, điểm nút,

độ sâu …)

Để nhận biết rõ cấu trúc của một yếu tố điểm theo kiểu vector ta xét sơ đồ biểu diễn cấu trúc vector của một điểm (Hình 2-2)

Nguyễn Văn Thuỳ Lớp trắc địa B-K43

28 YÕu tè ®−êng

§iÓm

Sù nhËn biÕt duy nhÊt

Dạng điểm Đơn giản Các loại số

§iÓm gèc §iÓm giao nhau

toạ độ X,Y

các thuộc tính phi địa hình đ−ợc kết hợp để hiển thị,trình bày và tạo dựng các điểm liên kết cơ sở dữ liệu.

Nếu điểm đơn

Ký hiệu tỷ lệ

Định h−ớng

NÕu ®iÓm gèc

Tỷ lệ các đặc tr−ng

Định h−ớng Dạng

Sự sắp xếp NÕu giao ®iÓm

Ký hiệu

Các điểm thuộc đ−ờng Gãc giao nhau

Các thuộc tính phi địa hình kết hợp

H×nh 2-2

Nguyễn Văn Thuỳ Lớp trắc địa B-K43

29

Về mặt lý thuyết đ−ờng là tập hợp vô số các điểm. Trong cấu trúc dữ liệu vector th−ờng mô tả đ−ờng là tập hợp các cung (ARC ), mỗi cung là tập hợp của các đoạn thẳng nhỏ nối giữa các điểm kề nhau đã đ−ợc chọn. Các đoạn thẳng này

đủ nhỏ để đảm bảo không bị lệch khỏi đoạn thực một khoảng v−ợt quá sai số cho phÐp.

X

Y Hình 2-3: Biểu diễn thông tin dạng đ−ờng theo cấu trúc Vector

Số liệu định vị của các yếu tố đường được lưu trong máy tính dưới dạng tập hợp các cặp toạ độ, trong đó các cặp toạ độ đặc trưng cho điểm thuộc đường đó.

Với một đường thẳng ta có thể lưu trữ toạ độ của hai điểm đầu và cuối, nhưng với một đường cong số lượng điểm lưu trữ rất lớn. Muốn giảm bớt số lượng ô nhớ khi lưu trữ đường cong thì đoạn thẳng giữa các điểm lưu trữ có thể sắp đặt lại thành các dạng của cung cong. Như vậy quá trình cấu tạo đường đẳng sâu, các điểm

được lưu trữ không phải là những điểm nối giữa các đoạn thẳng mà là các điểm tạo cung tròn hoặc parabol. Khi đó phải chỉ ra cách tạo dựng đường cùng các

điểm được lưu trữ phải chỉ rõ các kiểu đường (kiểu nội suy) đối với từng yếu tố

Nguyễn Văn Thuỳ Lớp trắc địa B-K43

30

đường. Đối với từng yếu tố đường có nhiều nét chung giống nhau cần đặt ra những quy tắc lưu trữ hợp lý.

Việc nén không gian lưu trữ còn có thể thực hiện bằng cách lưu trữ số chênh toạ độ giữa các điểm ngoặt mà không lưu trữ toạ độ tuyệt đối của từng

®iÓm.

Các điểm của đường được chọn để lưu trữ thường là các điểm ngoặt (điểm

đặc trưng) phản ánh đúng hình thái của đường một cách đơn giản nhất .

Tuy nhiên một đ−ờng cũng có thể đ−ợc chia nhỏ ra thành nhiều đoạn,từng

đoạn có thể lưu trữ tách riêng với nhau. Trong trường hợp này cần cung cấp địa chỉ lưu trữ của mỗi đoạn kế tiếp sau kèm theo đoạn đó.

Yếu tố vùng

Vùng (hay còn gọi là diện) có thể coi là tập hợp vô số điểm đ−ợc giới hạn bởi một đường khép kín. Số liệu định vị của yếu tố vùng được xác định bởi đường bao của chúng.

Nói chung, không có sự khác biệt giữa việc lưu trữ số liệu định vị của yếu tố đường và số liệu định vị của yêú tố vùng, cả hai đều lưu trữ dưới dạng tập hợp các điểm của một đ−ờng. Nh−ng nó có thể nhận biết rõ ràng nếu chỉ ra số liệu

định vị kèm theo kiểu yếu tố được hiển thị (điểm, đường, vùng). Ngoài ra cũng có khả năng ngầm hiểu, ví dụ nh− rừng th−ờng là yếu tố vùng, đ−ờng sắt là yếu tố đ−ờng ….Đ−ờng bao của một vùng khép kín (tức là điểm đầu và điểm cuối trùng nhau). Ng−ợc lại một đ−ờng khép kín không phải trong tr−ờng hợp nào cũng phản ánh một vùng (đường bình độ không phải là yếu tố vùng).

Trong thực tế các yếu tố vùng nằm kề nhau (có bờ ngăn cách chung). Để giảm việc lãng phí bộ nhớ do lưu trữ các cạnh chung hai lần, người ta chỉ tiến hành lưu trữ mỗi cạnh chỉ một lần, đồng thời cung cấp cho từng vùng những thông tin về cạnh của nó.

Tương tự như vậy với trường hợp các điểm chung có thể lưu trữ toạ độ mỗi

Nguyễn Văn Thuỳ Lớp trắc địa B-K43

31

điểm một lần và cung cấp cho đ−ờng những thông tin về các điểm thuộc đ−ờng . Có thể minh hoạ cách tổ chức dữ liệu này thông qua ví dụ sau: Hai vùng I và II có chung cạnh c và hai điểm 3 và 4. Từ đó ta có sơ đồ về việc liên kết thông tin. Sự tiết kiệm bộ nhớ này chỉ thực sự có giá trị khi số l−ợng cạnh chung khá

lớn Tuy nhiên điều đáng kể ở đây là cách tổ chức dữ liệu nh− trên cho phép thao tác với số liệu thuận lợi hơn .

3

b e 5 2

a I c II h

I

d 4 g 6

3. Ưu nh−ợc điểm của cấu trúc dữ liệu kiểu raster và kiểu vector

Qua quá trình nghiên cứu và thực nghiệm người ta đã so sánh và rút ra những −u nh−ợc điểm của hai loại cấu trúc dữ liệu trên nh− sau:

Cấu trúc dữ liệu Raster

*¦u ®iÓm

- Cấu trúc dữ liệu đơn giản

- Dễ dàng chồng xếp,thu nạp thông tin giữa các bản đồ, giữa các bản đồ và thôngtin viễn thám .

- Dễ xây dựng các mô hình khai thác theo không gian - Lưu trữ,mô tả chi tiết và dày đặc thông tin

- Gía thành sản phẩm rẻ

* Nh−ợc điểm

Nguyễn Văn Thuỳ Lớp trắc địa B-K43

32 - Dung l−ợng thông tin lớn

- Dung lượng thông tin giảm khi kích thước pixel lớn và khi đó các thông tin dễ bị sai lệch

- Các bản đồ có hình ảnh thô và đơn điệu

- Khó khăn khi chồng xếp và phân tích các dữ liệu bản đồ có kích thước pixel khác nhau

- Khó khăn trong việc thiết lập hệ thống mạng liên kết ngân hàng dữ liệu theo không gian

Cấu trúc dữ liệu Vector

* ¦u ®iÓm

- Miêu tả và xử lý tốt các thuộc tính không gian hình học (tính nối tiếp, tÝnh l©n cËn)

- Dữ liệu cô đọng hiện thực

- Cho phép thực hiện tốt các mô tả và tính toán về các quan hệ không gian hình học, cho khả năng xác lập mối quan hệ không gian giữa các sản phẩm rời rạc

- Thông tin đồ hoạ nhanh,đẹp

* Nh−ợc điểm

- Cấu trúc dữ liệu phải đồng nhất

- Khó khăn khi chồng xếp một số bản đồ

Raster và vector là hai ph−ơng pháp mô tả các thông tin không gian khác nhau nh−ng chúng có thể chuyển hoá đ−ợc với nhau. Việc chuyển hoá từ cấu trúc dữ liệu vector sang cấu trúc dữ liệu raster khá đơn giản và đ−ợc sử dụng nhiều trong quá trình chồng xếp và phân tích bản đồ.

Việc chuyển đổi ng−ợc lại từ cấu trúc dữ liệu raster sang cấu trúc dữ liệu vector đ−ợc thực hiện thông qua quá trình số hoá.

Nguyễn Văn Thuỳ Lớp trắc địa B-K43

33

II. Cấu trúc dữ liệu phi không gian

Cùng với dữ liệu không gian,các dữ liệu phi không gian của cùng yếu tố cũng được lưu và đều được liên kết với dữ liệu không gian của chính đối tượng

đó. Mối liên kết dữ liệu phi không gian và dữ liệu không gian có thể đ−ợc thực hiện bằng cách đặt dữ liệu phi không gian vào đúng vị trí của dữ liệu không gian. Cách thứ hai để thực hiện mối liên kết này là sắp xếp các dữ liệu không gian và dữ liệu thuộc tính theo cùng một trình tự sau đó gán mã duy nhất cho cả

hai loại dữ liệu.

Dữ liệu phi không gian có thể đ−ợc đ−a vào trực tiếp từ các bảng dữ liệu, các tệp văn bản hoặc thu nhận từ các phần mềm khác nhau.

Dữ liệu phi không gian hay còn gọi là dữ liệu thuộc tính bao gồm dữ liệu thuộc tính định tính và dữ liệu thuộc tính định l−ợng và đ−ợc cấu trúc theo dạng bảng gồm các hàng, cột. Mỗi hàng bao gồm nhiều loại thông tin về một đối t−ợng nào đó nh− tên, diện tích …. Mỗi loại thông tin khác nhau này gọi là một tr−ờng, mỗi tr−ờng đ−ợc sắp xếp t−ơng ứng với một cột. Việc sắp xếp dữ liệu phi không gian thành bảng gồm các hàng, các cột nh− trên rất thuận lợi cho quá trình tìm kiếm, cập nhật, sắp xếp dữ liệu phi không gian. Ngoài những đặc điểm nh− đã nêu trên, dữ liệu phi không gian có thể bao gồm các hình thức trình bày chuẩn bị của mỗi yếu tố (màu sắc, lực nét, kiểu đ−ờng …) nhằm giúp cho trong quá trình sử dụng các kí hiệu và dụng cụ vẽ đ−ợc thuận tiện. Điều này đặc biệt có lợi để biểu thị dữ liệu đồ hoạ có hiệu quả và nhanh chóng.

III.Mối liên kết dữ liệu

Mối liên kết dữ liệu phản ánh mối quan hệ mật thiết giữa hai loại thông tin. Mối liên kết đảm bảo cho mỗi đối t−ợng bản đồ đều đ−ợc gán với các thông tin thuộc tính, phản ánh đúng hiện trạng và các điểm riêng biệt của đối t−ợng.

Đồng thời qua đó, người sử dụng dễ dàng tra cứu, tìm kiếm và chọn lọc các đối t−ợng theo yêu cầu thông qua bộ xác định hay chỉ số Index .

Nguyễn Văn Thuỳ Lớp trắc địa B-K43

34

Hệ thống bản đồ và thông tin đ−ợc liên kết trong cơ sở dữ liệu, nó cho phép tìm ra các lớp thông tin đã nhập vào máy.

Sự liên kết giữa các thành phần dữ liệu đ−ợc thể hiện nh− sau:

1 ID Thuéc tÝnh I Thuéc tÝnh II 2

1 2

3 3 4 …

Dữ liệu không gian Dữ liệu thuộc tính

II.3. Thu thập dữ liệu vμ cập nhật dữ liệu

Thu thập dữ liệu và cập nhật dữ liệu là ph−ơng thức và quan hệ trong cơ sở dữ liệu và quan trọng hơn là các ph−ơng thức và các quan hệ trở thành một phần trong quá trình tổ chức xây dựng cơ sở dữ liệu trong hệ thống thông tin địa lý.

Điều đó có nghĩa là việc phát triển các ứng dụng trở nên đơn giản và có đầu t− ít hơn.

Dữ liệu không gian

I. Nguồn dữ liệu trong cơ sở dữ liệu không gian

Cơ sở dữ liệu không gian đ−ợc thu thập từ nhiều nguồn khác nhau nh− sơ

đồ hình 2-4.

Một phần của tài liệu Xay dung co so du lieu dia hinh tu nen ban dodia hinh (Trang 25 - 34)

Tải bản đầy đủ (PDF)

(61 trang)