CÁC ĐƠN VỊ BẢN ĐỒBản đồ là tập hợp các điểm, các đường, các miền vùng được định nghĩa cho cả vị trí của chúng trong không gian và cho cả các thuộc tính phi không gian.. Cơ sở dữ liệu khô
Trang 1Please purchase a personal
license.
Trang 2CHƯƠNG 3: CƠ SỞ DỮ LIỆU VÀ CẤU TRÚC
- Cơ sở dữ liệu không gian
- Cơ sở dữ liệu thuộc tính 3.2
Cấu trúc cơ sở dữ liệu
- Khái niệm cấu trúc cơ sở dữ liệu
- Cấu trúc dữ liệu Raste
- Cấu trúc dữ liệu Vector
- Chuyển đổi giữa các kiểu cấu trúc DL
3.3
Trang 33.1 CÁC ĐƠN VỊ
BẢN ĐỒ
Trang 4KHÁI NIỆM VỀ HÌNH HỌC TOPO (TOPOLOGY)
Topology là m ột thủ tục toán học nhằm xác định
m ối liên hệ không gian giữa các đối tượng bản đồ.
Tập hợp dữ liệu số miêu tả rõ ràng các đối tượng
li ề n k ề, ch ứ a trong nhau và tính liên t ụ c giữa các đối tượng bản đồ mà có thể lưu trữ và thao tác trên máy tính.
Trang 5CÁC ĐƠN VỊ BẢN ĐỒ
Bản đồ là tập hợp các điểm, các đường, các miền (vùng) được định nghĩa cho cả vị trí của chúng trong không gian và cho cả các thuộc tính phi không gian.
Mọi dữ liệu địa lý cần phải quy về ba khái niệm hình học cơ bản là:
- Điểm
- Đường
- Vùng
Trang 6CÁC ĐƠN VỊ BẢN ĐỒ
Điểm: Là đối tượng không có kích thước được đặc trưng
bằng vị trí điểm.
Ví dụ: Chùa, cột điện, cây độc lập
Đường: Là đối tượng một chiều, có vị trí, có chiều dài.
Ví dụ: Sông, suối, đường ranh giới, đường giao thông
Vùng: Là đối tượng hai chiều, có chiều dài và chiều rộng
(hay có diện tích).
Ví dụ: Thửa đất, sông, hồ
Trang 7Một số hình dạng không gian cơ bản
Trang 83.2 CƠ SỞ DỮ LIỆU
BẢN ĐỒ
Trang 9Qua phần mềm điều hành có thể tạo ra hình ảnh bản đồ cụ thể.
Qua phần mềm điều hành của GIS có thể tạo
ra hình ảnh bản đồ trên màn hình hoặc in ra giấy.
Trang 11Cơ sở dữ liệu không gian
Cơ sơ dữ liệu không gian là: Loại dữ liệu thể hiện chính xác vị trí trong không gian thực của đối tượng và quan hệ giữa các đối tượng qua mô tả hình học, mô tả bản đồ và mô tả topology.
Đối tượng không gian của BĐ số gồm: Các điểm khống chế tọa độ, địa giới hành chính, các thửa đất, các lô đất, các công trình xây dựng, hệ thống giao thông, thuỷ văn và các yếu tố khác có liên quan.
Các dữ liệu không gian thể hiện các đối tượng
b ản đồ qua ba yếu tố hình học cơ bản là điểm, đường và vùng.
Trang 12Cơ sở dữ liệu không gian
Thông tin vị trí các đối tượng bản đồ luôn phải kèm theo các thông tin về quan hệ không gian (Topology), nó được thể hiện qua ba kiểu quan hệ: Liên thông nhau, kề nhau, nằm trong hay bao nhau.
Ví dụ: Dữ liệu không gian của thửa đất chính
là toạ độ các góc thửa (điểm), ranh giới thửa (đường khép kín) và miền nằm trong ranh giới.
Chúng được mô tả bằng ký hiệu bản đồ dạng đường.
Trang 13Cơ sở dữ liệu thuộc tính
CSDL thuộc tính (CSDL phi không gian): Là những diễn tả đặc tính, số lượng, mối quan hệ của các hình ảnh bản đồ với vị trí địa lý của chúng.
C ần phân biệt hai loại thuộc tính sau đây:
- Thu ộc tính định lượng: Kích th ước, diện tích
- Thuộc tính định tính: Màu sắc, tên, tính chất… Thông thường các dữ liệu thuộc tính được thể
hi ện bằng các mã và lưu trữ trong các bảng hai chiều.
Tuỳ theo đ ặc điểm chuyên đề và thuộc tính của
nó mà các đối tượng được xếp vào các lớp khác nhau.
Trang 14Cơ sở dữ liệu thuộc tính
Ví dụ 1: Thông tin thuộc tính của dữ liệu cơ sở hạtầng gồm: Các loại đường, hệ thống thủy lợi, thủy văn, mạng lưới điện, mạng lưới cấp thoát nước, các công trình cơ sở hạ tầng
Ví dụ 2: Thông tin thuộc tính của dữ liệu địa chính gồm: Số hiệu thửa đất, diện tích, chủ sử dụng đất, địa chỉ, địa danh, phân loại đất, phân hạng đất, giá đất, mức thuế và thông tin pháp lý
Ví dụ 3: Thông tin thuộc tính của dữ liệu về hiện trạng rừng gồm: Số hiệu các lô rừng, tên lô, diện tích
lô, trạng thái, loài cây, trữ lượng
Trang 17Courtesy Village of Garden City
Liên k ế t các thu ộ c tính và đồ h ọ a
Trang 183.3 CẤU TRÚC
CƠ SỞ DỮ LIỆU
Trang 193.3 CẤU TRÚC CƠ SỞ DỮ LIỆU
Khái niệm cấu trúc cơ sở dữ liệu
Một cơ sở dữ liệu bao gồm nhiều tệp dữ liệu.
Cấu trúc cơ sở dữ liệu là: Cách
bố trí, tổ chức cơ sở dữ liệu để có thể truy nhập dữ liệu từ một hay nhiều tệp một cách dễ dàng.
Trang 203.3 CẤU TRÚC CƠ SỞ DỮ LIỆU
Cấu trúc cơ sở dữ liệu THUỘC TÍNH
Có 3 lo ại mô hình cấu trúc cơ sở dữ liệu
thuộc tính đó là:
- Cấu trúc phân cấp (dạng cây)
- Cấu trúc mạng (dạng lưới)
- Cấu trúc quan hệ
Trang 21MÔ HÌNH PHÂN CẤP (DẠNG CÂY)
- Phức tạp, ít linh hoạt
Trang 23MÔ HÌNH QUAN HỆ
- Mô hình CSDL hệ là hệ thống CSDL quan hệ.
- Hệ thống CSDL quan hệ là một tập hợp các bảng dữ liệu Mỗi bảng là 1 ma trận gồm 1 chuỗi các hàng và cột giao nhau.
- Mối quan hệ giữa các bảng: Cột dữ liệu chung giữa 2 bảng, cột dữ liệu chung này được gọi là
“khóa liên kết” để nối dữ liệu từ bảng này sang bản kia.
Trang 24- Công việc thiết kế CSDL đòi hỏi kỹ năng chuyên môn cao.
Trang 253.3 CẤU TRÚC CƠ SỞ DỮ LIỆU
DỮ LIỆU RASTER 1
DỮ LIỆU VECTOR 2
Dữ liệu trong hệ GIS còn được gọi là thông tin không gian Dạng dữ liệu này bao gồm các thông tin cótính đồ họa chỉ rõ hình dạng, phạm vi không gian, vị trí địa lý của một thực thể trong thế giới thực được khái quát hóa thành các đặc tính địa lý như điểm, đường hay vùng trên bản đồ dưới dạng raster hoặc vector
Như vậy có hai cách cơ bản nhất cho việc biểu diễn dữ liệu KHÔNG GIAN:
Trang 26C Ấ U TRÚC D Ữ LI Ệ U KHÔNG GIAN
• RASTER
• VECTOR
• TG THỰC
Trang 27CẤU TRÚC
DỮ LIỆU RASTER
Trang 28Dữ liệu Raster (ma trận)
Mô hình dữ liệu dạng raster phản ánh toàn
bộ vùng nghiên cứu dưới dạng một lưới các ô vuông (cell) hay điểm ảnh (pixcel).
Dữ liệu trong mô hình Raster được tổ chức thành ma trận các cell (ô) hay pixcel.
Điểm: Được thể hiện bằng một pixel.
Đường: Được thể hiện bằng một chuỗi các pixel
Vùng: Được thể hiện bằng 1 nhóm các pixel
Trang 30Trên hình A là một thể hiện bản đồ đất, mỗi vùng được đánh dấu bằng các ô theo các giá trị khác nhau Ta có được một lưới các ô có giá trị khác nhau
Trên hình B nếu gán nước giá trị 1, rừng giá trị 2, đất nông nghiệp giá trị 3 ta sẽ có một mảng số liệu từ các giá trị 1,2,3.
Biểu diễn dữ liệu Raster theo lưới điểm
CÁCH BIỂU DIỄN DỮ LIỆU RASTER
Trang 31CÁCH BIỂU DIỄN DỮ LIỆU RASTER
Dữ liệu Raster có thể có một hoặc nhiều nhãn Giá trị của mỗi ô có thể mang các giá trị khác nhau Có hai cách để hiển thị raster với giá trị của ô.
- Hiển thị nhãn đơn (single-band)
- Hiển thị nhãn bội (multi-band)
Trang 32Hiển thị nhãn đơn
Hiển thị nhãn bội
Trang 33Tổ chức dữ liệu Raster trong GIS
* Mục đích: Là để tối ưu hóa việc nhập dữ liệu, giảm bớt sự lưu trữ và các yêu cầu về xử lý dữ liệu
* Cách tổ chức:
- Các đặc tính địa lý được tổ chức thành các tầng (lớp) dữ liệu
- Tổ chức lớp theo kiểu các đặc tính (điểm, đường, vùng) vàtheo nhóm chuyên đề Được lưu trữ trong các lớp riêng biệt
- Các đặc tính có thể tổ chức theo chuyên đề mà nó đại diện
- Chúng tổ chức thành các tầng (lớp) dữ liệu khác nhau nhưng phải cùng chung một vùng quan trắc địa
Trang 34Các nguồn xây dựng dữ liệu Raster
Các nguồn DL xd nên DL raster có thể bao gồm:
- Quét ảnh
- Ảnh máy bay, ảnh viễn thám
- Chuyển từ dữ liệu vector sang
- Lưu trữ dữ liệu dạng raster
- Nén theo hàng
- Nén theo chia nhỏ thành từng phần
- Nén theo ngữ cảnh
Trang 35Các đặc điểm của dữ liệu Raster
Mô hình dữ liệu raster có các đặc điểm:
- Các điểm được xếp liên tiếp từ trái qua phải và từ trên xuống dưới.
- Mỗi 1 điểm ảnh (pixcel) chứa một giá trị
- Một tập các ma trận điểm và các giá trị tương ứng tạo thành một lớp (layer).
- Trong cơ sở dữ liệu có thể có nhiều lớp.
- Dung lượng dữ liệu lớn
Trang 36CÁC PHƯƠNG PHÁP NÉN DỮ LIỆU
RASTER
• Mục đích: Giảm kích thước lưu trữ
• Các phương pháp nén dữ liệu Raster:
- Phương pháp nén theo đường biên vùng (Chain Code)
- Phương pháp nén theo hàng cột (Run-length code)
- Phương pháp nén theo khối (Block code)
- Phương pháp nén cây tứ phân (Quadtree code)
Trang 37Phương pháp nén theo đường biên vùng (Chain Code)
Các đường biên của các vùng được thể hiện bằng hàng liên tục các vector đơn vị theo hướng 4 phương, được qui ước bằng các số: hướng Đông = 0, Bắc = 1, Tây = 2, Nam = 3.
Ví dụ trên nếu ta bắt đầu từ cell của hàng 0 theo chiều kim đồng hồ ta sẽ có dãy giá trị sau thể hiện đối tượng:
1
1
1 1 1 1
1
1 1 1
1
1 1 1 1
1 1 1
1 1 1
Trang 38ƯU NHƯỢC ĐIỂM
Phương pháp nén theo đường biên vùng (Chain Code)
Ưu điểm:
Là phương pháp nén dữ liệu raster hiệu quả.
Dễ dàng tiến hành tính chu vi và diện tích, nhận biết lồi lõm, thay đổi hướng đột ngột.
Nhược điểm:
Khó khăn trong phân tích chồng xếp.
Dư thừa dữ liệu vì đường biên lưu trữ hai lần.
Trang 39Phương pháp nén theo hàng cột (Run-length code)
Các điểm trên mỗi đơn
vị bản đồ được lưu trữ theo
hàng từ trái qua phải từ
cell đầu đến cell cuối.
đã giảm đáng kể bộ nhớ
Trang 40ƯU NHƯỢC ĐIỂM
Phương pháp nén theo hàng cột (Run-length code)
Trang 41Phương pháp nén theo khối (Block code)
Ví dụ: Trên có thể viết dưới dạng nén block code 2n x 2n như sau:
- 7 block 1 đơn vị ô vuông
- 7 block 4 đơn vị ô vuông
Phương pháp này có hiệu quả với các vùng có diện tích lớn và hình dạng các đường biên đơn giản, có thể kiểm tra sự
co giãn về hình dạng của vùng.
Là phương pháp sử dụng cho các dữ liệu 2N x 2N khối các
đơn vị ô vuông, (N là những số nguyên: N = 0, 1, 2 ) Khi N = 0 thì khối ô vuông có số đơn vị ô vuông là 1 (là khối lượng ô vuông nhỏ nhất trong một khối).
Trang 42Phương pháp nén cây tứ phân (Quadtree code)
Đây là phương pháp nén thểhiện sự chia liên tục của dạng ma trận 2N x 2N thành cây ¼
Giới hạn thấp nhất của phép chia là một ô vuông, ma trận được chia làm 4 nhánh và cứ thế chia cho đến khi đạt được các đơn vị ô vuông đồng nhất
Trang 43ƯU NHƯỢC ĐIỂM
Phương pháp nén cây tứ phân (Quadtree code)
- Khó khăn cho việc chọn các mô hình, giải pháp
- Một vùng có thể chia thành rất nhiều phần gây khó khăn cho việc truy nhập DL
Trang 44Nhận xét:
Tóm lại khi bản đồ bao gồm n x n ô vuông (cell) mỗi
ô chứa một giá trị thông số thuộc tính khác nhau thì ý định giảm lượng bộ nhớ lưu trữ sẽ rất khó thực hiện được
Hạn chế của cấu trúc dữ liệu loại raster chủ yếu do nótạo nên khối lượng lưu trữ lớn Tuy vậy khi tồn tại những đồng nhất về giá trị thông số thuộc tính thì ta có thể sửdụng một trong bốn phương pháp lưu trữ nén đã trình bày ở trên
Phương pháp run - length code có hiệu quả nhất trong việc hiển thị và lưu trữ các vùng có kích cỡ pixel lớn Khi độ phân giải lớn, số lượng pixel trong một vùng tăng lên thì nên sử dụng phương pháp nén Block hay Quadtree sẽ có hiệu quả hơn
Trang 45CẤU TRÚC
DỮ LIỆU VECTOR
Trang 46Theo quan niệm toán học thì vector bao gồm 1 điểm (v ới cặp
t ọa độ x, y trong KG phẳng hay x, y, z trong KG 3 chiều), một khoảng cách và 1 chỉ số hướng
Như vậy: C ấu trúc DL vector là các thể hể hiện chính xác
các c ặp tọa độ và xác định MQH không gian của các đối tượng.
Cấu trúc vector coi vật thể tự nhiên là tập hợp các thực thể không gian cơ sở (Điểm, Đường, Vùng) và tổ hợp các thực thểnày Các thực thể này được thành lập trên cơ sở các cặp tọa độ (x, y) của các điểm trong 1 hệ tọa độ nhất định
Trang 47ĐIỂM
Điểm được xem như là đại diện bao trùm hầu hết tất
cả các thực thể địa lý và đồ hoạ Điểm được xác định bởi cặp giá trị điểm Các đối tượng kiểu điểm có đặc điểm:
- Là toạ độ đơn (x,y)
- Không thể hiện chiều dài và diện tích
Trang 48CÁC C Ộ T ĐÈN
Trang 49ĐƯỜNG (ĐOẠN THẲNG)
Đường được xác định như một tập hợp dãy của các điểm Mô
tả các đối tượng đlý dạng tuyến, có các đặc điểm sau:
- Là một dãy các cặp toạ độ (X, Y)
- Một ĐƯỜNG bắt đầu và kết thúc bởi node
- Các ĐƯỜNG nối với nhau và cắt nhau tại node
- Hình dạng của ĐƯỜNG được ĐN bởi các điểm
- Độ dài chính xác bằng các cặp toạ độ
Trang 51ĐƯỜ NG PH Ố
Trang 52VÙNG (DIỆN TÍCH)
Vùng được xác định bởi ranh giới các đường thẳng Các đối tượng địa lý có diện tích và đóng kín bởi một đường được gọi là đối tượng vùng polygons, có các đặc điểm sau:
- Polygons được mô tả bằng tập các đường và điểm nhãn
- Một hoặc nhiều đường định nghĩa đường bao của vùng
- Một điểm nhãn nằm trong vùng để mô tả, xđ cho mỗi 1 vùng
Trang 55KiÓu VÞ trÝ ĐiÓm 3,2
Đ−êng 1,5; 3,5; 5,7; 8,8; 11,7 Vïng 5,3; 6,5; 7,4; 9,5; 11,3; 8,2; 5,3
Điểm: Được thể hiện bằng một cặp toạ độ
Đường: Được thể hiện bằng một chuỗi các cặp toạ độ
Vùng: Được thể hiện bằng một chuỗi các cặp toạ độ và cặp
toạ độ đầu và cặp toạ độ cuối trùng nhau
SỰ THỂ HIỆN DỮ LIỆU DẠNG VECTOR
Trang 56Tính liên tục: Các đường nối với nhau tại các điểm nút (node).
Tính kề nhau: Các đường tham gia
ĐN vùng ở cả hai bên: phải và trái.
Đầu, cuối giao của đường
Tính tạo vùng: Các đường nối với nhau tạo thành đường bao của vùng.
QUAN HỆ TRONG CẤU TRÚC MẠNG VECTOR (VECTOR TOPOLOGY)
Trang 57- Các đường ranh giới thửa không được phép giao nhau,
ph ải luôn cắt nhau tại đầu hoặc cuối đường (tại điểm nút NODE)
Áp dụng mô hình topology khi XD CSDL không gian
- Đường ranh giới tạo thành đường bao thửa đất luôn đảm
b ảo tính khép kín tuyệt đối về toạ độ.
Mô hình dữ liệu Vector Topology
Trang 58DỮ LIỆU KHÔNG GIAN CHUẨN
C ơ sở dữ liệu chuẩn là dữ liệu không còn lỗi như:
bt quá, bt chưa ti, vùng chưa khép….
Trang 59CÁC NGUỒN XD DỮ LIỆU VECTOR
- Từ số liệu đo: Sử dụng các lệnh (công cụ vẽ)
- Từ bản đồ sẵn có: Số hóa bản đồ
- Chuyển từ dữ liệu Raster: Vector hóa
+ Bằng tay: Số hóa trên ảnh Raster
+ Sử dụng công cụ (tự động)
- Chuyển đổi từ các dạng (phần mềm) khác
(Sử dụng chức năng chuyển đổi của phần mềm)
Trang 60Các b ả n đồ điệ n t ử ở hai đị nh d ạ ng Raster và Vector
Trang 61Các mô hình d ữ li ệ u Raster và Vector
Miêu tả Vector
X-AXIS
500 400 300 200 100
600 500
400 300 200 100
B G G
BK
B B B
G G
G G G
Trang 62DỮ LIỆU VECTOR
DỮ LIỆU RASTER
SO SÁNH ĐÁNH GIÁ ƯU NHƯỢC ĐIỂM
DỮ LIỆU RASTER VÀ DỮ LIỆU VECTOR
SO SÁNH, ĐÁNH GIÁ
Trang 63SO SÁNH DL RASTER VÀ DL VECTOR
Do cấu trúc DL khác nhau nên việc lưu trữ hai loại DL này là hoàn toàn khác nhau nhưng việc so sánh sẽ giải thích được phần nào cho các khả năng ứng dụng của 2 loại DL này.
Các chỉ số so sánh cơ bản dựa trên:
- Khối lượng bộ nhớ để lưu trữ (hiệu suất lưu trữ dữ liệu)
- Tốc độ truy cập, độ ổn định
- Hiệu suất xử lý và phân tích dữ liệu
- Độ chính xác khi hiển thị dữ liệu
Trang 64ƯU NHƯỢC ĐIỂM DỮ LIỆU RASTER
- Có cấu trúc dữ liệu đơn giản
- Dễ dàng sử dụng các phép toán chồng xếp và các phép toán xử lý ảnh viễn thám
- Dễ dàng thực hiện nhiều phép toán PT khác nhau
- Các bài toán mô phỏng có thể thực hiện được do đơn vị không gian giống nhau (ô đơn vị)
- Kỹ thuật xử lý đơn giản, công nghệ rẻ
Nhược điểm:
- Dung lượng dữ liệu lớn
- Độ chính xác có thể giảm nếu sử dụng không hợp lý kích thước các ô đơn vị
- Bản đồ hiển thị không đẹp
- Có thể mất thông tin ở những vùng giao nhau
- Khối lượng tính toán để chuyển đổi tọa độ là rất lớn
Trang 65ƯU NHƯỢC ĐIỂM DỮ LIỆU VECTOR
Ưu điểm:
- Biểu diễn tốt dữ liệu địa lý
- Dữ liệu nhỏ gọn
- Các quan hệ Topo được xác định bằng mạng kết nối
- Chính xác về hình học, chất lượng không thay đổi khi phóng to
- Khả năng sửa chữa, bổ sung, thay đổi các dữ liệu hình học cung như thuộc tính nhanh, tiện lợi
Trang 66BẢNG SO SÁNH DL RASTER VÀ DL VECTOR
NhanhChậm
Tốc độ truy cập
10
Đơn giảnPhức tạp
Lưu trữ
9
Phức tạpĐơn giản
Khả năng tạo lập bản đồ
8
KémTốt
Khả năng phối hợp các dữ liệu
7
KémTốt
Khả năng phân tích vùng
6
CaoThấp
Độ chính xác hình học
5
Phức tạpĐơn giản
Cấu trúc dữ liệu
4
TốtTrung bình
Chất lượng đồ hoạ
3
NhỏLớn
Khối lượng dữ liệu
2
ChậmNhanh
Nhập dữ liệu
1
Vector Raster
Chỉ tiêu STT