Các khái niệmCơ sở dữ liệu phân tán là tập hợp nhiều cơ sở dữ liệu có liên quan luận lý với nhau được phân tán qua một mạng máy tính, còn hệ quản trị cơ sở dữ liệu phân tán là một phần m
Trang 1Các thành viên nhóm
Trang 2HỆ CƠ SỞ DỮ LIỆU
PHÂN TÁN
ĐỀ TÀI
Trang 3I Các khái niệm
Cơ sở dữ liệu phân tán là tập hợp nhiều cơ sở dữ liệu có liên quan luận lý với nhau được phân tán qua một mạng máy tính, còn hệ quản trị cơ sở dữ liệu phân tán là một phần mềm hệ thống quản lý cơ sở dữ liệu phân tán và
làm dữ liệu minh bạch, rõ ràng cho người dùng.
Cơ sở dữ liệu phân tán là tập hợp nhiều cơ sở dữ liệu có liên quan luận lý với nhau được phân tán qua một mạng máy tính, còn hệ quản trị cơ sở dữ liệu phân tán là một phần mềm hệ thống quản lý cơ sở dữ liệu phân tán và
làm dữ liệu minh bạch, rõ ràng cho người dùng.
Khái niệm CSDL
phân tán
Khái niệm CSDL
phân tán
Trang 4Sự kết nối các nút cơ sở dữ liệu
thông qua một mạng máy tính
Sự kết nối các nút cơ sở dữ liệu
thông qua một mạng máy tính
Sự tương quan luận lý của các
cơ sở dữ liệu kết nối
Sự tương quan luận lý của các
cơ sở dữ liệu kết nối
Không có sự đồng bộ bắt buộc
giữa các trạm kết nối với nhau
Không có sự đồng bộ bắt buộc
giữa các trạm kết nối với nhau
Sự khác nhau đối với hệ thống
đa xử lý
Sự khác nhau đối với hệ thống
đa xử lý
Trang 5Khái niệm “trong suốt” được mở rộng từ ý tưởng chung của việc che giấu chi tiết việc thực thi hoạt động khỏi người dùng cuối cùng.
Khái niệm “trong suốt” được mở rộng từ ý tưởng chung của việc che giấu chi tiết việc thực thi hoạt động khỏi người dùng cuối cùng.
Tính trong
suốt
Tính trong
suốt
Trang 6Các dạng trong suốt
Tổ chức dữ liệu trong suốt
Tổ chức
Trong suốt về nhân bản
Nhân bản
Trong suốt phân
đoạn Phân đoạn
Trang 7Sự tự quản quyết định mức độ các trạm độc lập hay cơ
sở dữ liệu trong kết nối với cơ sở dữ liệu phân tán có thể
tổ hoạt động một các độc lập Sự tự quản cấp cao giúp tăng sự linh hoạt và tùy chỉnh trong bảo trì một trạm
độc lập Sự tự quản có thể ứng dụng cho thiết kế, giao
tiếp và thực thi.
Sự tự quản quyết định mức độ các trạm độc lập hay cơ
sở dữ liệu trong kết nối với cơ sở dữ liệu phân tán có thể
tổ hoạt động một các độc lập Sự tự quản cấp cao giúp tăng sự linh hoạt và tùy chỉnh trong bảo trì một trạm
độc lập Sự tự quản có thể ứng dụng cho thiết kế, giao
tiếp và thực thi.
Sự tự quản
Sự tự quản
Trang 8Độ tin cậy và tính sẵn sàng là hai trong số ưu điểm tiềm năng phổ biết nhất của cơ sở dữ liệu phân tán Độ tin
cậy được định nghĩa là sự chắc chắn khi hệ thống hoạt động ở một thời điểm, trong khi tính sẵn sàng là sự chắc chắn khi hệ thống sẵn sàng trong một khoảng thời gian.
Độ tin cậy và tính sẵn sàng là hai trong số ưu điểm tiềm năng phổ biết nhất của cơ sở dữ liệu phân tán Độ tin
cậy được định nghĩa là sự chắc chắn khi hệ thống hoạt động ở một thời điểm, trong khi tính sẵn sàng là sự chắc chắn khi hệ thống sẵn sàng trong một khoảng thời gian.
Độ tin cậy và tính sẵn sàng
Độ tin cậy và tính sẵn sàng
Trang 10Keeping track of data distributeion
Distributed query processing Distributed transaction management Replicated data management
Distributed databse recovery Security
Distributed directory (catalog) management
Trang 11Các dạng CSDL phân tán
Hệ cơ sở dữ liệu tập trung truyền thống
Hệ cơ sở dữ liệu tập trung truyền thống
Hệ cơ sở dữ liệu phân tán thuần nhất
Hệ cơ sở dữ liệu phân tán thuần nhất
Hệ cơ sở dữ liệu liên
Trang 12Kiến trúc song song và kiến trúc
Trang 15liệu
Trang 16Mỗi phân mảnh chứa một số thuộc tính của
quan hệ
Có thể dùng phép chiếu trong ĐSQH
liệu
Trang 173 Phân mảnh hỗn hợp
Kết hợp 2 loại trên
Phân mảnh dữ
liệu Phân mảnh dữ
liệu
Trang 18Nhân bản
Nhân bản
Sao chép dữ liệu và lưu ở
nhiều trạm
Sao chép dữ liệu và lưu ở
nhiều trạm
Trang 19Nhân bản
Nhân bản
Giảm chi phí truyền dữ
liệu
Trang 20TRUY VẤN TRONG CSDL PHÂN TÁN
QUERY PROCESSING
OPTIMIZATION
IN DDBS
Trang 211 Xử lí truy vấn phân tán
Query mapping
Query mapping Localization
Global Query Optimizatio
n
Global Query Optimizatio
n
Local Query Optimizatio
n
Local Query Optimizatio
n
Trang 222 Chi phí truyền dữ liệu
Trang 23Chiến lược dùng JOIN
Di chuyển tất cả Chỉ lấy khi cần
Semijoins Bloomjoins
Cách nào tốt?
2 Chi phí truyền dữ liệu
Trang 24Di chuyển tất cả: truyền toàn bộ quan hệ
2 Chi phí truyền dữ liệu
Trang 25Xử lí tại R
Gửi yêu cầu tới node S Gửi yêu cầu đã nhận trở lại R
Chi phí: 2 tin, 18 giá trị
Gửi yêu cầu tới node R Gửi yêu cầu đã nhận trở lại S
Xử lí tại S
Chi phí: 2 tin, 14 giá trị
2 Chi phí truyền dữ liệu
Trang 26Cần gì lấy đó
Phép kết theta R và S
2 Chi phí truyền dữ liệu
Trang 27Xử lí tại R
Xử lí tại S
Gửi yêu cầu (tuple của R với B = 7) tới S Gửi dữ liệu sau khi xử lí (0 tuple của S có B = 7) tới R Gửi yêu cầu (tuple của R với B = 1) tới S
Gửi dữ liệu sau khi xử lí (1 tuple của S có B = 1) tới R
…
…
Gửi yêu cầu (tuple của S với B = 9) tới R Gửi dữ liệu sau khi xử lí (0 tuple của R có B = 9) tới S Gửi yêu cầu (tuple của S với B = 1) tới R
Gửi dữ liệu sau khi xử lí (1 tuple của R có B = 1) tới S
Chi phí: 7x2 = 14 tin, 7 + 2x3 = 13 giá trị
2 Chi phí truyền dữ liệu
Trang 28Mỗi site được lưu một phần bản sao dữ liệu của các site khác và không có gì đảm bảo bản sao đó phải
phần danh mục
Lặp lại một
phần danh mục
Lặp lại toàn bộ danh
mục
Lặp lại toàn bộ danh
mục
Danh mục tập trung
Danh mục tập trung
Trang 29Cloud Computing
Peer – to – peer
Datebase Systems
Peer – to – peer
Datebase Systems
Trang 30Cloud Computing
Cloud Computing
₋ Điện toán đám mây là một mô hình điện toán có khả
năng co giãn linh động
₋ Điện toán đám mây là một dạng hệ thống song song
phân tán gồm nhiều máy chủ ảo khác nhau
₋ Các tài nguyên thường được ảo hóa và được cung cấp
như một dịch vụ trên mạng Internet.
₋ Điện toán đám mây là một mô hình điện toán có khả
năng co giãn linh động
₋ Điện toán đám mây là một dạng hệ thống song song
phân tán gồm nhiều máy chủ ảo khác nhau
₋ Các tài nguyên thường được ảo hóa và được cung cấp
như một dịch vụ trên mạng Internet.
Trang 31Cloud Computing
Cloud Computing
- Các loại hình dịch vụ điện toán đám mây
+ IaaS ( Infrastructure as a Service )
+ PaaS ( Platform as a Service)
+ SaaS ( Software as a Service)
+ BPaaS ( Business Process as a Service)
Hybrid
- Các loại hình dịch vụ điện toán đám mây
+ IaaS ( Infrastructure as a Service )
+ PaaS ( Platform as a Service)
+ SaaS ( Software as a Service)
+ BPaaS ( Business Process as a Service)
Hybrid
Trang 32Cloud Computing
Cloud Computing
₋ Mặt tích cực
+ Tiết kiệm chi phí
+ Dung lượng lớn
+ Giảm thiểu rủi ro
+ Truy cập mọi lúc mọi
nơi
₋ Mặt tích cực
+ Tiết kiệm chi phí
+ Dung lượng lớn
+ Giảm thiểu rủi ro
+ Truy cập mọi lúc mọi
nơi
₋ Mặt hạn chế
+ An ninh bảo mật chưa tốt
+ Người dung bị phụ thuộc vào công nghệ và chất lượng
+ Chưa có giải pháp hiệu quả khi người dùn
₋ Mặt hạn chế
+ An ninh bảo mật chưa tốt
+ Người dung bị phụ thuộc vào công nghệ và chất lượng
+ Chưa có giải pháp hiệu quả khi người dùn
Trang 33Trong một kiến trúc không đồng nhất, có ít nhất 1 CSDL không phải là Oracle.
Trong một kiến trúc không đồng nhất, có ít nhất 1 CSDL không phải là Oracle.
Trong một kiến trúc đồng nhất, cần tối thiểu 2 cơ sở dữ liệu và được lưu trữ trên 1 hoặc nhiều máy
Trong một kiến trúc đồng nhất, cần tối thiểu 2 cơ sở dữ liệu và được lưu trữ trên 1 hoặc nhiều máy
1 máy chủ CSDL là 1 phần mềm Oracle dùng để quản lý CSDL,
và máy khách là ứng dụng yêu cầu lấy thông tin từ máy chủ.
1 máy chủ CSDL là 1 phần mềm Oracle dùng để quản lý CSDL,
và máy khách là ứng dụng yêu cầu lấy thông tin từ máy chủ.
Trang 34Kiến trúc đồng nhất
₋ Ẩn giấu vị trí và nền tản của CSDL, nhưng
vẫn cho biết CSDL này được lưu trữ trong mạng nội bộ hay từ những đối tượng nằm cách xa
₋ Sử dụng chung cú pháp
₋ Tưởng thích với nhiều phiên bản DBMSs
₋ Ẩn giấu vị trí và nền tản của CSDL, nhưng
vẫn cho biết CSDL này được lưu trữ trong mạng nội bộ hay từ những đối tượng nằm cách xa
₋ Sử dụng chung cú pháp
₋ Tưởng thích với nhiều phiên bản DBMSs
Trang 35Kiến trúc không đồng nhất
₋ Máy chủ CSDL Oracle truy cập vào CSDL
không phải Oracle bằng cách sử dụng
dịch vụ không đồng nhất (HS) liên kết với một tác nhân (agent)
₋ Người dùng truy cập tới CSDL không phải
Oracle bằng cách sử dụng cổng có tính
trong suốt của Oracle, sau đó agent là 1
ứng dụng cụ thể
₋ Máy chủ CSDL Oracle truy cập vào CSDL
không phải Oracle bằng cách sử dụng
dịch vụ không đồng nhất (HS) liên kết với một tác nhân (agent)
₋ Người dùng truy cập tới CSDL không phải
Oracle bằng cách sử dụng cổng có tính
trong suốt của Oracle, sau đó agent là 1
ứng dụng cụ thể
Trang 36Dịch vụ không đồng nhất
₋ HS cung cấp kiến trúc và cơ chế quản lý
chung cho các sản phẩm cổng cơ sở dữ
liệu Oracle và các thiết bị truy cập không đồng nhất khác
₋ HS cung cấp kiến trúc và cơ chế quản lý
chung cho các sản phẩm cổng cơ sở dữ
liệu Oracle và các thiết bị truy cập không đồng nhất khác
Trang 37Các tác nhân cổng vào trong suốt
₋ Với mỗi HTCSDL không phải Oracle mà ta
truy cập, HS có thể phải sử dụng 1 tác
nhân cổng vào trong suôt để kết hợp với
HTCSDL không phải Oracle đã được đinh
rõ
₋ Với mỗi HTCSDL không phải Oracle mà ta
truy cập, HS có thể phải sử dụng 1 tác
nhân cổng vào trong suôt để kết hợp với
HTCSDL không phải Oracle đã được đinh
rõ
Trang 38₋ Một máy khách có thể truy xuất trực tiếp
hoặc gián tiếp vào máy chủ CSDL:
₋ Trực tiếp: Máy khách kết nối với 1 máy
chủ và truy cập thông tin từ CSDL được chứa trong máy chủ đó
₋ Gián tiếp: Máy khách kết nối với 1 máy
chủ và truy cập thông tin từ CSDL được chứa trong một máy chủ khác
₋ Một máy khách có thể truy xuất trực tiếp
hoặc gián tiếp vào máy chủ CSDL:
₋ Trực tiếp: Máy khách kết nối với 1 máy
chủ và truy cập thông tin từ CSDL được chứa trong máy chủ đó
₋ Gián tiếp: Máy khách kết nối với 1 máy
chủ và truy cập thông tin từ CSDL được chứa trong một máy chủ khác
Trang 39₋ Mỗi CSDL trong CSDL phân tán là duy
nhất được xác định bởi tên CSDL toàn cục của nó Tên này có dạng tiền tố là tên
vùng mạng được xác định bởi tham số khởi tạo DB_DOMAIN trong việc tạo CSDL + với tên của CSDL được định nghĩa qua các tham số khởi tạo DB_NAME
₋ Mỗi CSDL trong CSDL phân tán là duy
nhất được xác định bởi tên CSDL toàn cục của nó Tên này có dạng tiền tố là tên
vùng mạng được xác định bởi tham số khởi tạo DB_DOMAIN trong việc tạo CSDL + với tên của CSDL được định nghĩa qua các tham số khởi tạo DB_NAME
Trang 40Tên của 1 CSDL được định dạng bắt đầu từ lá của
cây và theo các đường dẫn tới gốc.ví dụ, CSDL mfg
nằm trong nhánh ivision3 của acme_tools của vùng
mạng com.tên CSDL toàn cục cho mfg được tạo ra
Tên của 1 CSDL được định dạng bắt đầu từ lá của
cây và theo các đường dẫn tới gốc.ví dụ, CSDL mfg
nằm trong nhánh ivision3 của acme_tools của vùng
mạng com.tên CSDL toàn cục cho mfg được tạo ra
Trang 41CẢM ƠN CÔ VÀ CÁC
BẠN ĐÃ CHÚ Ý THEO
DÕI
HẾT