Một cơ sở dữ liệu (CSDL) phân tán là một tập hợp dữ liệu, mà về mặt logic tập hợp này thuộc cùng một hệ thống, nhưng về mặt vật lý dữ liệu đó được phân tán trên các vị trí khác nhau củ[r]
(1)CHƯƠNG TỔNG QUAN VỀ CSDL PHÂN TÁN
NỘI DUNG
1.1 Sơ lược mạng máy tính
1.2 Các hình thức tổ chức hệ thống phân tán 1.3 Các đặc trưng hệ thống phân tán 1.4 Cơ sở liệu phân tán
1.5 Các loại truy xuất CSDL phân tán
(2)Tại phải phân tán? - Phân tán gì?
• Nhu cầu dùng chung liệu hợp
• Các tổ chức kinh tế có nhiều trụ sở phân tán nhiều vị trí địa lý khác nhau
• Làm để quản lý luồng liệu sử dụng chung liệu, chương trình tổ chức
• Một hệ thống phân tán bao gồm hai phần: mạng
(3)1.1 SƠ LƯỢC VỀ MẠNG MÁY TÍNH
•Một mạng máy tính tập máy tính tự vận hành, kết nối lại có khả trao đổi thơng tin chúng
•Các máy tính mạng thường gọi nút hay trạm, chúng tạo phần cứng của mạng kết nối lại vói đường truyền
(4)Những loại mạng máy tính Mạng hình sao (star)
•Thường dùng tổ chức có nhiều chi nhánh nằm nhiều vùng khác
• Máy tính trung tâm đặt văn phịng trung tâm vùng
• Nhược điểm:
- độ tin cậy thấp
- giao tiếp hai máy tính phụ thuộc vào máy tính trung tâm
(5)Mạng vịng (circle)
• Các máy tính nối với theo vịng khép kín • Mỗi trạm đóng vai trị chuyển tiếp
• Truyền liệu quanh vịng thường theo chiều
• Việc điều khiển truyền tin mạng xoay vòng thường thực thẻ điều khiển
• Nhược điểm:
-nếu đường nối bị cắt đứt làm ngừng tồn hoạt động mạng -Lượng thông tin di chuyển
đường truyền lớn
(6)Mạng bus:
• Có kênh chung để chuyền liệu, máy tính thiết bị đầu cuối gắn vào
(7)Mạng hỗn hợp (hybrid):
•Các mạng truyền thơng thường có đường nối vơ định
•Các đường nối khơng có tính hệ thống khơng tn theo khn mẫu
•Có thể gặp nút nối với nút khác những nút nối với nhiều nút khác
•Các nối kết máy tính mạng Internet thuộc loại
(8)1.1 SƠ LƯỢC VỀ MẠNG MÁY TÍNH
Hub Hub
(9)Mạng thảm (Mesh):
•Mỗi nút nối kết với nút cịn lại
•Có độ tin cậy cao khả hoạt động tốt hơn cấu trúc nói
•Cấu trúc có chi phí cao
(10)1.2 Các hình thức tổ chức hệ thống phân tán
peer-to-peer
File server
(11)1.2 Các hình thức tổ chức hệ thống phân tán peer-to-peer (mơ hình nhóm làm việc):
Các máy tính cá nhân máy trạm sử dụng
như hệ thống độc lập trợ giúp ứng dụng địa phương
Mỗi thành viên mạng có vai trị ngang nhau, tự quản
lý tài ngun chia sẻ tài nguyên cho máy tính khác mạng
Mỗi máy tính mạng vừa đóng vai trị máy chủ
(Server), vừa đóng vai trò máy khách (Client)
Đây mơ hình mạng đơn giản, phù hợp với hệ thống
(12)(13)1.2 Các hình thức tổ chức hệ thống phân tán File server (máy dịch vụ file):
File server Một số máy dịch vụ file gán trực tiếp vào
mạng LAN
File server là thiết bị quản lý hoạt động file phục
vụ máy tính cá nhân kết nối mạng LAN
Mỗi máy cá nhân phân chia dung lượng cố định
trên ổ cứng File server, chương trình máy tính cá nhân tham chiếu đến file phần đĩa tương ứng đặc tả đường dẫn
Những hạn chế File server
(14)1.2 Các hình thức tổ chức hệ thống phân tán
Client/server (mơ hình khách/chủ)
Một số máy dịch vụ file gán trực tiếp vào mạng LAN
server có chức điều khiển, lưu trữ CSDL, xử lý
truy vấn quản lý việc khai thác tài nguyên mạng máy tính khác
Thuật ngữ client sử dụng để người khai thác tài
(15)15
1.3.1 Đặc trưng hệ thống File server kiến trúc Client/Server
1.3 Các đặc trưng hệ thống phân tán
Đặc trưng File Server Client/Server
Xử lý Chỉ máy khách Cả máy khách máy chủ Truy nhập liệu đồng
thời Thấp, máy khách th.hiện Cao, Server đảm nhiệm An toàn toàn vẹn
CSDL Thấp, máy khách quản lý Cao, Server đảm nhiệm Sử dụng mạng File lớn, chuyển file Truyền liệu nhiều mức Bảo trì phần mềm Thấp, máy Server Hỗn hợp số phần
mềm gửi đến máy khách
Phần cứng hệ thống Sự mềm dẽo phần mềm
Ghép nối máy khách
(16)1.3.2 Các chức kiến trúc client/server
1.3.2.1 Trình diễn thơng tin phân tán
Mục đích: làm ứng dụng máy khách để định dạng lại liệu server quản lý
1.3 Các đặc trưng hệ thống phân tán
Chức Client Server
Quản lý liệu Quản lý liệu
Phân tích liệu Phân tích liệu
Trình diễn liệu Dữ liệu trình diễn
(17)17
1.3.2.2 Trình diễn từ xa
Mục đích: giúp USERS thay đổi biểu mẫu, báo cáo nội dung cần bảo trì phần mềm máy khách
Kiểu trình diễn cài đặt chức trình diễn liệu clients, nên phần mềm client có khả trình diễn liệu định dạng theo ý client
1.3 Các đặc trưng hệ thống phân tán
Chức Client Server
Quản lý liệu Quản lý liệu
Phân tích
liệu Phân tích liệu
Trình diễn
(18)1.3.2.3 Quản lý liệu từ xa
Mục đích: giúp client phân tích liệu thơ lấy từ Server
1.3 Các đặc trưng hệ thống phân tán
Chức Client Server
Quản lý
liệu Quản lý liệu
Phân tích
(19)1.3.2.4 Phân tán chức năng
• Các chức phân tán đặt máy khách lẫn máy chủ
• Tồn chức trình diễn liệu đặt máy khách toàn chức quản lý liệu đặt máy chủ
1.3 Các đặc trưng hệ thống phân tán
Chức Client Server
Quản lý liệu Quản lý liệu
Phân tích
liệu Các liệu lấy phân tích từ server Các liệu lấy phân tích từ server sau truyền cho clients
Trình diễn
(20)1.3.3 Xử lý phân tán (Distributed Processing):
• Cho phép phối hợp tốt đặc trưng hệ phân tán liên kết liệu chương trình máy chủ để lại chức trình diễn máy khách
• Cho phép định vị cách mềm dẽo chức phân tích xử lý liệu nơi mà chúng hoạt động tốt
1.3 Các đặc trưng hệ thống phân tán
Chức Client Server
Quản lý liệu Quản lý liệu địa phương Chia sẻ quản lý liệu server
(21)1.4.1 Định nghĩa:
Một sở liệu (CSDL) phân tán tập hợp liệu, mà mặt logic tập hợp thuộc hệ thống, mặt vật lý liệu phân tán vị trí khác mạng máy tính
Có hai điểm quan trọng nêu định nghĩa:
Phân tán: Dữ liệu không cư trú vị trí mà phân bố rộng khắp nhiều máy tính đặt nhiều vị trí khác nhau, điểm phân biệt sở liệu phân tán với sở liệu tập
trung
Tương quan logic: Dữ liệu hệ phân tán có số thuộc tính ràng buộc chúng với Điều giúp phân biệt sở liệu phân tán với tập hợp sở liệu tập
trung, file liệu lưu trữ nhiều vị trí khác nhau, điều thường thấy ứng dụng mà hệ thống phân quyền truy nhập liệu mơi trường mạng
(22)Ví dụ:
Một ngân hàng có ba chi nhánh đặt vị trí khác Tại chi nhánh có máy tính điều khiển số máy kế tốn cuối (teller terminal) sở liệu thống kê chi nhánh
Mỗi máy tính với sở liệu thống kê địa phương chi nhánh đặt vị trí sở liệu phân tán Các máy tính nối với mạng truyền thông Các nút mạng phân tán mặt xử lý thơng tin vị trí mà quản lý, mặt khác tham gia vào việc xử lý yêu cầu thông tin cần truy cập qua nhiều địa điểm Ví dụ việc lên danh sách tất nhân viên
(23)1.4 Cơ sở liệu phân tán (Distributed Database) Server Database T T T T T Terminal Server
(24)1.4 Cơ sở liệu phân tán (Distributed Database)
Máy tính Máy tính
Máy tính
Mạng cục
Trung tâm máy tính
Chi nhánh
T T
T Cơ sở
dữ liệu
Cơ sở liệu
Cơ sở
Chi nhánh
T T T
Chi nhánh
(25)1.4 Cơ sở liệu phân tán (Distributed Database)
Hệ thống đa xử lý
Hệ thống đa xử lý (multiprocessor system)
Máy tính phía sau
Mạng cục
Máy tính ứng dụng (phía trước) Cơ sở
dữ liệu
Cơ sở liệu
Cơ sở liệu
Trung tâm máy tính
Máy tính phía sau
Máy tính phía sau
Chi nhánh
T T T
Chi nhánh
T T T
Chi nhánh
(26)1.4.2 Hệ quản trị sở liệu phân tán (DDBMSs)
DDBMS có chức hỗ trợ việc tạo bảo trì sở liệu phân tán, chúng có thành phần tương tự hệ quản trị sở liệu tập trung thành phần hỗ trợ việc chuyển tải liệu đến trạm ngược lại
Các thành phần sau địi hỏi DDBMSs thương mại phải có:
Quản trị liệu (Database management): DBDB Truyền thông liệu (Data Communication): DCDC
Từ điển liệu (Data Dictionary): DDDD dùng để mô tả thông tin
về phân tán liệu mạng
Cơ sở liệu phân tán (Distributed Database): DDBDDB
(27)1.4 Cơ sở liệu phân tán (Distributed Database)
Local
database 1 DB DC DDB
T
T T
Site 1 Site 2 Local
database 2 DB DC DDB
T
Các thành phần DDBMS thương mại
T T
(28)1.4.3 So sánh csdl phân tán csdl tập trung
Nhận xét: CSDL phân tán không đơn giản thực phân tán CSDL tập trung, chúng cho phép thiết kế đặc trưng khác với CSDL tập trung truyền thống
Các đặc điểm tiêu biểu CSDL truyền thống:
• điều khiển tập trung • độc lập liệu
• giảm dư thừa
(29)a Điều khiển tập trung
Trong CSDL tập trung: Khả điều khiển tập trung toàn nguồn tài nguyên thông tin tổ chức, xem động mạnh cho việc đời CSDL Chúng phát triển tiến hố hệ thống thơng tin, mà ứng dụng có tập tin riêng
Trong CSDL phân tán, ý niệm điều khiển tập trung nhấn mạnh Điều phụ thuộc vào kiến trúc CSDL phân tán Một cách tổng quát, CSDL phân tán điều khiển với cấu trúc phân lớp dựa vào hệ quản trị CSDL tồn cục (có trách nhiệm toàn CSDL phân tán) hệ quản trị CSDL địa phương (có trách nhiệm với CSDL địa phương riêng) Điều cho thấy hệ quản trị CSDL địa phương có mức tự trị cao Các CSDL phân tán khác mức độ tự trị: từ hồn tồn tự trị, khơng có hệ quản trị CSDL tập trung nào, đến hoàn toàn điều khiển tập trung
(30)b Độc lập liệu
Độc lập liệu động lực cho việc mở đầu tiếp cận liệu phân tán Thuận lợi độc lập liệu chương trình khơng bị ảnh hưởng thay đổi cấu trúc vật lý liệu Trong CSDL phân tán, độc lập liệu quan trọng giống CSDL truyền thống Tuy nhiên, khía cạnh thêm vào ý niệm độc lập liệu trong suốt phân tán Với suốt phân tán hiểu chương trình ứng dụng sử dụng CSDL khơng tổ chức phân tán Vì xác chương trình khơng
(31)31
c Giảm dư thừa liệu
Trong CSDL truyền thống, liệu dư thừa giảm đến mức tối thiểu hai lý do:
• Sự khơng tương thích nhiều tập liệu
• Tiết kiệm khơng gian lưu trữ cách loại bỏ dư thừa Việc giảm dư thừa liệu đạt cách chia sẻ liệu, cho phép nhiều ứng dụng truy cập tin ghi
Trong CSDL phân tán, việc giảm dư thừa phức tạp ngồi hai lý trên, cịn nhiều lý để giảm dư thừa như: • Hoạt động trình ứng dụng bị tăng lên
liệu lại tất vị trí, nơi trình ứng dụng cần • Tính thường trực hệ thống tăng lên, có lổi
xẩy trạm không dừng việc thực ứng dụng trạm khác liệu chép lại
(32)d Biệt lập bảo mật
Trong CSDL truyền thống, hệ quản trị CSDL tập trung bảo đảm truy cập đến liệu uỷ quyền
Trong CSDL phân tán, hệ quản trị liệu địa phương thực chất phải đương đầu với vấn đề giống hệ quản trị CSDL CSDL truyền thống
Tuy nhiên, hai khía cạnh đặc biệt sau CSDL phân tán cần phải xem xét:
• Trong CSDL phân tán với mức độ tự trị cao địa phương, người chủ liệu địa phương cảm giác bảo vệ tốt họ tự chủ thực bảo vệ thay phụ thuộc vào người quản trị CSDL trung tâm
(33)1.4.4 Ưu nhược điểm hệ phân tán
Ưu điểm
• Đáp ứng nhanh hầu hết ứng dụng sử dụng liệu trạm
• Tăng cường đơn thể ứng dụng CSDL mà không làm cản trở người sử dụng
• Kiểm sốt liệu địa phương theo hướng hồn thiện tích hợp quản trị liệu từ xa
• Tăng cường khả hệ thống liên quan đến dư thừa liệu
(34)1.4.4 Ưu nhược điểm hệ phân tán
Nhược điểm
• Phần mềm đắt phức tạp
• Phải xử lý thay đổi thơng báo địa điểm
• Khó kiểm sốt tính tồn vẹn liệu với nhiều liệu phân bố khắp nơi
• Đáp ứng chậm nhu cầu trạm trường hợp phần mềm ứng dụng không phân bố phù hợp với việc
(35)1.5.1 Truy xuất từ xa thông qua tác vụ b¶n:
ứng dụng phát yêu cầu truy xuất CSDL vị trí u cầu đ ợc hệ quản trị CSDL phân tán gửi đến vị trí chứa liệu Thực xong gửi kết
Tr×nh øng dơng
VÞ trÝ 1
VÞ trÝ 2 Các tác vụ
truy xuất CSDL
Kết gửi
DBMS1
Cơ sở d÷ liƯu
2
DBMS2
(36)1.5.2 Truy xuất từ xa thông qua ch ơng trình phơ trỵ
Một ứng dụng u cầu thực ch ơng trình phụ trợ đặt vị trí từ xa Ch ơng trình phụ trợ truy xuất CSDL từ xa trả lại kết cho ứng dụng yêu cầu
Tr×nh øng dơng
VÞ trÝ 1
VÞ trÝ 2
Yêu cầu thực hiện ch ơng trình phụ trợ
DBMS1
(37)Cơ sở liệu phân tán quan trọng kinh tế, tổ chức kỹ thuật với nhiều lý khác Chúng cài đăt mạng máy tính có phạm vi rộng lớn nhỏ bé
Hiện DDBMSs thương mại tích hợp các ứng dụng phân tán nên tiện cho người sử dụng
(38)1 Ưu nhược điểm lại mạng máy tính
2 Trong mơ hình client/Server, cho biết mục đích của: • Trình diễn thơng tin phân tán
• Trình diễn từ xa
• Quản lý liệu từ xa • Phân tán chức
3 Định nghĩa sở liệu phân tán Hệ quản trị CSDL phân tán Các thành phần yêu cầu DDBMSs thương mại Cho ví dụ CSDL phân tán
(39)HẾT CHƯƠNG 1