Hệ cơ sở dữ liệu CSDL: đến một cơ quan, một tổ chức, một chuyên ngànhkhoa học tự nhiên, xã hội được lưu trữ trong máytính theo một quy định nào đó cho phép người sửdụng truy xuất hoặc sử
Trang 1Chương II: Tổng quan về cơ sở dữ
liệu trong hệ thống thông tin địa lý
liệu trong hệ thống thông tin địa lý
1/5/2013
Trang 2Các tập dữ liệu chứa các thông tin liên quanđến một cơ quan, một tổ chức, một chuyên ngành
II.1 Hệ cơ sở dữ liệu (CSDL):
đến một cơ quan, một tổ chức, một chuyên ngànhkhoa học tự nhiên, xã hội được lưu trữ trong máytính theo một quy định nào đó cho phép người sửdụng truy xuất hoặc sửa đổi tập tin ( data base)
Trang 3II.1.2.Hệ quản trị cơ sở dữ liệu
(HQTCSDL)
ĐN : Là phần chương trình để có thể xử lý, thay đổicác tập dữ liệu
Nhiệm vụ: Cung cấp cách lưu trữ, truy vấn thông
Nhiệm vụ: Cung cấp cách lưu trữ, truy vấn thôngtin trong cơ sở dữ liệu sao cho vừa thuận lợi vừahiệu quả
Một số hệ quản trị hiện nay: database, SQL server,micrsoft Access, posgis
Trang 5II.1.3.Mô hình CSDL
1 Mô hình phân cấp (hierarchical models)
Là sự kết hợp của nhiều cấp độ cơ bản có liênquan, trong thực tế nó là một cây theo thứ tự
quan, trong thực tế nó là một cây theo thứ tự
Nhược điểm:
Có nhiều dư thừa dữ liệu trong tập dữ liệunày sang một dữ liệu khác
Trang 6Hình Biểu diễn bản đồ A bằng mô hình phân cấp
Trang 7Khoa
Môn học Giảng viên Sinh viên
Trang 82.Mô hình mạng(Network model)
Là tập hợp các mức độ cơ bản đã được kết nối, loại cấu trúc này được xem như là cấu trúc phân cấp có nhiều mạng kết nối.
Ưu điểm : Tiết kiệm thời gian tìm kiếm
Ưu điểm : Tiết kiệm thời gian tìm kiếm
Nh ược: Quan hệ giữa các dữ liệu phức
tạp,cấu trúc thì không thể nhìn thấy rõ ràng
Dư thừa dữ liệu.
Trang 9Biểu diễn bản đồ A bằng mô hình lưới
Trang 10Bảng đăng ký
Trang 11Trong thực tế các dữ liệu thường không thể
mô tả chúng bằng mô hình phân cấp hoặc mô
hình mạng
3 Mô hình quan hệ
3 Mô hình quan hệ
Mô hình dữ liệu quan hệ dựa trên khái niệm
toán học với tên gọi (relation) và biểu diễn vật lý
là các bảng (table)
Trang 12Mô hình quan hệ dữ liệu gồm 3 thành phần sau:
Cấu trúc dữ liệu (data structure) : Dữ liệu cấutrúc theo dạng bảng bao gồm nhiều hàng và cột
Ví dụ: cho bảng có tên sau “Quản lý SV”
ID Họ tên Điểm hoc tập Điểm rèn luyện
Trang 13Thao tác dữ liệu ( data manipulation) : Sử dụng ngôn ngữ SQL để truy vấn dữ liệu chứa trong bảng.
VD: Tìm mã sinh viên, họ tên sinh
VD: Tìm mã sinh viên, họ tên sinh viên có điểm học tập ≥ 7.0 và điểm rèn luyện thuộc loại “tốt”
Trang 14ID Họ tên Điểm hoc tập Điểm rèn luyện
110070001 Nguyễn Trường
110070002 Phan Thoại
select ID, Họ tên from Quản lý SV
where Điểm học tập ≥ 7.0 and điểm rèn luyện = ‘tốt’
110070002 Phan Thoại
110070003 Lê Nguyễn Phương
Trang 15Toàn vẹn dữ liệu ( data integrity): Các phương tiện dùng
để đặc tả các quy tắc nghiệp vụ nhằm duy trì tính toàn vẹn của dữ liệu khi thao tác
liệu khi thao tác
Trang 16- Trong mô hình quan hệ thì CSDL được đặt trong các bảng có quan hệ với nhau,
- Hệ QTCSDL có khả năng kết nối dữ liệu từ nhiều bảng để tạo thành bảng duy
liệu từ nhiều bảng để tạo thành bảng duy nhất.
- Để phân biệt bảng ghi người ta chọn
ra một trường làm khóa chính ( khóa chính không được trùng nhau hoặc rỗng)
Trang 17Có 4 khả năng tồn tại giữa các bảng
- Quan hệ 1-1 :Khóa trường trong bảng là duy nhất,không có sự trùng lặp trong các trường khóa
- Quan hệ nhiều - 1: cho phép bảng mới có nhiều
- Quan hệ nhiều - 1: cho phép bảng mới có nhiềugiá trị trong trường khóa tương ứng của trường cóquan hệ của bảng hiện có
- Quan hệ 1 – nhiều: Đòi hỏi trường khóa chínhcủa bảng mới là duy nhất nhưng khóa ngoại củabảng mới có thể khớp với nhiều mục
- Quan hệ nhiều – nhiều : không có quan hệ tồn tạigiữa các trường khóa trong bảng
Trang 184 Mô hình quan hệ thực thể (entity relationship model )
Mô hình này dựa trên quan niệm
về thế giới đối tượng được gọi là thực thể, và mối quan hệ giữa chúng.Các
thể, và mối quan hệ giữa chúng.Các thực thể mô tả trong CSDL bởi một tập các thuộc tính
Ưu điểm: CSDL luôn nhất quán
Hỗ trợ thiết kế, tổ chức thông tin, tương thích với mô hình quan hệ
Trang 195 Mô hình hướng đối tượng
Dựa trên cơ sở các gói dữ liệu
mà mã liên quan đến đối tượng
Đây là mô hình hiện đại được nhiều nước sử dụng và có nhiều
nhiều nước sử dụng và có nhiều
ứng dụng trong ngôn ngữ lập trình
cũng như trong giải pháp về phần
cứng, phần mềm.
Trang 20II.2.Cấu trúc CSDL trong GIS
CSDL không gian
CSDL không gian CSDL thuộc tính
trúc hợp lý thuận lợi cho quản lý, lưu trữ, sửa đổi, khai thác theo mục đích sử dụng.
Trang 21K h o ân g
g ia n
CSDL trong gis
T h u o äc tín h
Trang 22II.2.1 CƠ SỞ DỮ LIỆU KHÔNG GIAN
CSDL không gian: là CSDL có chứa trong nó những thông tin về định
vị của đối tượng.
vị của đối tượng.
Dữ liệu không gian có 3 dạng:
+) Dạng điểm:
+) Dạng đường:
+) Dạng vùng:
Trang 23X,Y X,Y
X,Y
X,Y
• Cấu trúc Vector
Cấu trúc Raster
• Cấu trúc Raster
Dòng
Trang 24Để quy các dữ liệu không gian về
3 loại trên , cần xác định:
- Vị trí của đối tượng
- Đặc trưng của đối tượng
- Mối quan hệ giữa các đối tượng
Tất cả các yếu tố đối tượng trong HTTĐL đều
có thể được mô tả theo kiểu cấu trúc dữ liệuvector và raster
Trang 25A Cấu trúc dữ liệu vector:
-) điểm : được mô tả bởi cặp tọa độ (x,y) trong
một hệ thống tọa độ nhất định
một hệ thống tọa độ nhất định
Đặc điểm:
- Là toạ độ đơn (x,y)
- Không cần thể hiện chiều dài và diện tích
Trang 26Số liệu vector được biểu thị dưới dạng điểm (Point).
Trang 27-) Dạng đường: Đường được xác định như một tập
hợp dãy của các điểm
Đặc điểm:
• Là một dãy các cặp toạ độ
• Một arc bắt đầu và kết thúc bởi node
• Các arc nối với nhau và cắt nhau tại node
• Hình dạng của arc được định nghĩa bởi các điểm
vertices
• Độ dài chính xác bằng các cặp toạ độ
Trang 28Số liệu vector được biểu thị dưới dạng Arc
Trang 29Vùng được xác định bởi ranh giới các đường thẳng Các đối tượng địa lý có diện tích và đóng kín bởi một đường được gọi là đối tượng vùng polygons
Đặc điểm:
- Polygons được mô tả bằng tập các đường (arcs) và điểm nhãn (label points)
điểm nhãn (label points)
- Một hoặc nhiều arc định nghĩa đường bao của vùng
- Một điểm nhãn label points nằm trong vùng để mô
tả, xác định cho mỗi một vùng.
Trang 30B.Cấu trúc dữ liệu raster:
Mô hình dữ liệu dạng raster phản ánh toàn bộ vùng nghiên cứu dưới dạng một lưới các ô vuông hay điểm ảnh (pixcel).
Đặc điểm:
Mỗi một điểm ảnh (pixcel) chứa một giá trị.
Các điểm được xếp liên tiếp từ trái qua phải và từ trên xuống
Các điểm được xếp liên tiếp từ trái qua phải và từ trên xuống dưới.
Một tập các ma trận điểm và các giá trị tương ứng tạo thành một lớp (layer).
Trong cơ sở dữ liệu có thể có nhiều lớp.
Trang 31Mối liên hệ không gian giữa các đối
tượng trong mô hình topology
Điểm – điểmĐiểm - đườngĐiểm - vùng
Điểm - vùngĐường – đườngĐường - vùngVùng - vùng
Trang 32Vùng – vùng đường – đường Đường - vùng
Trang 34Nén ảnh là quá trình làm giảm lượng thông
tin dư thừa trong dữ liệu gốc
Có 2 phương pháp nén:
Có 2 phương pháp nén:
- Nén chính xác : Nén không mất thông tin,
phương pháp này cho ta chính xác dữ liệu gốc
sau khi nén
- Nén có mất thông tin : Với dữ liệu này ta sẽ
không thu được dữ liệu như bản gốc sau khi nén
Trang 35ĐN: CSDL thuộc tính (dữ liệu phi không gian) :
Là cơ sở phản ánh tính chất của các đối tượngkhác nhau
Trang 36+) Cấu trúc dữ liệu thuộc tính có dạng bảng:
Cột ( trường )
Giá trị Dòng
Giá trị thuộc tính
Trang 37+) Ngoài ra dữ liệu không gian còn bao gồm các hình thức trình bày chuẩn của mỗi yếu tố ( màu sắc, lực nét, kiểu đường…).
+) DL thuộc tính có thể nhập từ
+) DL thuộc tính có thể nhập từ các bảng dữ liệu, các tệp văn bản, hoặc từ các phần mềm khác.
Trang 38Với cùng một đối tượng , có thể liên kết dữ
liệu không gian và dữ liệu thuộc tính
Mối liên kết có thể được thực hiện bằng 2
Mối liên kết có thể được thực hiện bằng 2
Trang 39II.3.1 Thu thập dữ liệu
a Thu thập dữ liệu địa lý:
-Thu thập dữ liệu bằng đo đạc mặt đất
-Thu thập dữ liệu bằng đo đạc mặt đất
- Thu thập dữ liệu từ ảnh hàng không và ảnh vệ tinh
- Số hóa bản đồ đang có giá trị sử dụng
b Thu thập các dữ liệu thuộc tính
- Thu thập số liệu từ mạng lưới tổ chức ngành, cơ quan
điều tra cơ bản của ngành.
Trang 40Một CSDL nếu sẽ không có giá trị sử dụng nếu
không cập nhật thông tin
Việc cập nhật thường theo chu kỳ của các tư liệu Việc cập nhật thường theo chu kỳ của các tư liệu ảnh hàng không, ảnh vệ tinh, số liệu thống kê
Trang 412.4.1 Bảo toàn dữ liệu
1.An toàn dữ liệu
Trang 423 Mất dữ liệu
Mất dữ liệu thường do hỏng phần mềm hoặc
phần cứng của máy.
Thông thường dữ liệu thường phải được lưu
trong usb, đĩa CD, ổ cứng khác…
trong usb, đĩa CD, ổ cứng khác…
4 Bảo mật thông tin
Hệ thống dữ liệu cần có cơ chế bảo vệ khả
năng truy nhập dữ liệu
Trang 43Bài tập
Câu 1: So sánh cấu trúc raster và cấu trúc vector
(Nêu rõ ưu nhược điểm từng cấu trúc) ?
Câu 2 : Sử dụng cấu trúc vector, Rastor trong
những trường hợp nào ?
Trang 44Câu 3 : Cấu trúc dữ liệu dạng gì?
Trang 48Câu 4: Cho các thông số của con sông như sau,hãy chỉ ra dữ liệu không gian , dữ liệu thuộc tính( định tính , định lượng ) của con sông đó?
Hình dạng, chiều dài,chiều rộng, diện tích,tọa độ điểm dọc theo đường mép nước, tốc độdòng chảy, màu sắc, lực nét, kiểu đường,
dòng chảy, màu sắc, lực nét, kiểu đường,