Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 54 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
54
Dung lượng
1,07 MB
Nội dung
CHƯƠNG NHỮNG NGUYÊN LÍ CƠ BẢN 1.1 Mở đầu 1.2 Cơ sở liệu quan hệ 1.3 Mạng máy tính 1.4 Cơ sở liệu phân tán 1.1 Mở đầu • Một công ty có chi nhánh Tính toán trả lương nào? Sử dụng sở liệu tập trung (tại London) Dữ liệu Employee : – EMP(ENO, NAME, TITLE, SALARY, …) Đặt liệu EMP đâu? Dữ liệu nhân viên quản lý văn phòng nơi nhân viên làm Ví dụ: Luơng, phụ cấp, tiền thuê Định kỳ, Công ty cần hợp truy xuất đến liệu nhân viên – Ví dụ: Tính tông số lương cần trả cho bảng cân đối lương – Ví dụ: Thưởng thêm hàng năm phụ thuộc lợi ích mạng toàn cục London-Trả lương NewYork-Trả lương EMP INTERNET Hong Kong-Trả lương Sử dụng sở liệu phân tán London-Trả lương London EMP NewYork-Trả lương NewYork EMP INTERNET HọngKong EMP • Chạy nhanh nhiều • Những vấn đề đòi hỏi: – Sự phân tán hỗ trợ việc xử lý song song (Chạy LD,NY,HK) – Việc lặp lại liệu làm tăng hiệu (dữ liệu HK NY) Hong Kong-Trả lương Tính không đồng tự tri 1.2 CƠ SỞ DỮ LIỆU QUAN HỆ A Cơ sở liệu quan hệ B Chuẩn hóa C Các ngôn ngữ liệu quan hệ A Cơ sở liệu quan hệ • Cơ sở liệu: Tập hợp có cấu trúc liệu liên quan đến tượng sống mà ta cố gắng mô hình hóa • Một CSDL quan hệ CSDL cấu trúc liệu dạng bảng Về hình thức, định nghĩa qua n tập hợp D1,D2 ,…, Dn tập n (d1,d2,…,dn) cho d1 ∈D1 , d2 ∈D2 …., dn ∈Dn B CHUẨN HÓA Xét sơ đồ quan hệ : EMP(ENO, ENAME, TITLE, SAL, PNO, RESP, DUR) PROJ(PNO,PNAME, BUDGET) Những vấn đề tồn sở liệu quan hệ Lặp lại bất thường: VD: tên người, chức vụ lương nhân viên lặp lại dựa án tham gialãng phí không gian lưu trữ Cập nhật bất thường: Hậu lặp lại bất thường VD: lương nhân viên thay đổi, kéo theo nhiều thay đổi Chèn bất thường: Khi đưa thêm nhân viên vào, thuộc tính liên quan quan hệ khác không thêm vào tương ứng (giá tri null) Xóa bất thường: Một biến đổi chèn bất thường VD: Xóa dự án quan hệ NHANVIEN xóa hết thông tin nhân viên CHUẨN HÓA(tiếp) Chuẩn hóa : Quan hệ chia thành hai hay nhiều dạng chuẩn hóa cao Quan hệ gọi chuẩn hóa thỏa mãn điều kiện liên kết đến dạng chuẩn hóa Codd định nghĩa 1NF, 2NF, and 3NF ( Về sau chuẩn Boyce-Codd-BCNF) : dạng chuẩn hóa phụ thuộc hàm 4NF (phụ thuộc đa trị) 5NF(phụ thuộc chiếu-kết nối ) Quá trình chuẩn hóa cho ta sơ đồ quan hệ: EMP(ENO, ENAME, TITLE) PAY(TITLE, SAL) PROJ(PNO, PNAME, BUDGET) ASG(ENO, PNO, RESP, DUR) MỘT CƠ SỞ DỮ LIỆU ĐÃ CHUẨN HÓA C CÁC NGÔN NGỮ DỮ LIỆU QUAN HỆ • Ngôn ngữ vận dụng quan hệ dùng cho mô hình quan hệ • Bao gồm đại số quan hệ tính toán quan hệ • Khác việc hình thành truy vấn người dùng • Chúng tương đương khả diễn đạt ĐẠI SỐ QUAN HỆ: - Tập phép tính thực quan hệ Có thể hay hai - phép tính bản: Chọn, chiếu, hợp, hiệu tích Đề cac - Các phép dẫn suất: Chèn, kết nối tự nhiên, bán kết nối chia, giao , kết nối θ - Mở rộng : Nhóm hay xếp kết quả, thực hàm đại số hay hợp hàm 10 Triển vọng csdl phân tán • Trong suốt tương tranh đảm bảo giao dịch phải vận hành độc lập quán logic( cho kết song song nối tiếp có thứ tự ) • Các nguyên lý tập trung có phức tạp hơn: – Phải đảm bảo giao dịch tổng thể cục không đụng độ – Phải đảm bảo tính quán giao dịch con, giao dịch tổng thể • Nhân làm cho tương tranh phức tạp – Nếu nhân cập nhật việc cập nhật phải lan truyền đến – Tùy chọn 1: Lan truyền thay đổi phần giao dịch khởi thủy, làm thao tác nguyên tử – Tùy chọn 2: Hạn chê việc cập nhật đến site sẵn sàng; Các site lại cập nhật chúng sẵn sàng – Tùy chọn 3: Cho phép cập nhật đến không đồng , sau cập nhật khởi thủy; giữ trễ việc lấy lại tính quán khoảng từ vài giây đến vài 40 Triển vọng csdl phân tán • Trong suốt cố : Hệ qtcsdl phân tán phải đảm bảo tính nguyên tử tính bền vững giao dịch tổng thể ( giao dịch chuyển giao hoàn toàn hay thoát) • Như hệ qtcsdl phân tán phải đồng giao dịch để đảm bảo giao dịch hoàn tất thành công trước ghi lệnh COMMIT cho giao dịch tổng thể • Giải pháp cần bền vững có cố site mạng 41 Triển vọng csdl phân tán • Trong suốt hiệu năng: Thực csdl trung tâm – Hệ qtcsdlpt không nên giảm hiệu kiến trúc phân tán – Hệ qtcsdlpt xác định chiến lược giá hiệu để vận hành truy vấn • Bộ xử lý truy vấn phân tán(DQP) ánh xạ yêu cầu liệu thành chuỗi thao tác csdl cục • DQP phải xem xét việc lược đồ phân mảnh, định vị nhân • DQP định : – Phân mảnh truy nhập – Bản phân mảnh sử dụng – Định vị sử dụng • DQP tạo nên chiến lược tối ưu nhằm đạt giá đảm bảo • Thông thường giá liên quan đến yêu cầu phân tán bao gồm: giá I/O, CPU, truyền thông 42 Các yếu tố gây khó khăn • Tính phức tạp • Giá thành • An ninh • Kiểm tra toàn vẹn khó khăn • Thiếu chuẩn • Thiếu kinh nghiệm • Thiết kế csdl phức tạp 43 MÔ HÌNH CSDL PHÂN TÁN • Mô hình chung • Các thành phần – Các nhiệm vụ – Các yêu cầu – Oracle 44 MÔ HÌNH THAM CHIẾU CSDL PHÂN TÁN Mở rộng mô hình mức CSDL tập trung ANSI/SPARK Người sử dụng Chương trình ứng dụng Chương trình ứng dụng Người sử dụng n Mô hình Mô hình Sơ đồ Sơ đồ Ánh xạ ngoài/quan niệm Mô hình liệu Sơ đồ quan niệm Ánh xạ Mô hình trong- mô hình vật lý Hệ quản trị CSDL Mô hình ngoài: Nội dung thông tin CSDL với khung nhìn người sử dụng Mô hình liệu (Mô hình quan niệm ): Cách nhìn liệu tổng quát người sử dụng Mô hình trong: Biểu diễn CSDL mức vật lý Cách biểu diễn liệu trừu tượng mức thấp 45 MÔ HÌNH THAM CHIẾU CSDL PHÂN TÁN( ) Lược đồ toàn cục Lược đồ phân mảnh Lược đồ cấp phát (định vị) Lược đồ ánh xạ cục Hệ QTCSDL site CSDL cục site Lược đồ ánh xạ cục Lược đồ ánh xạ cục n Hệ QTCSDL site Hệ QTCSDL site n CSDL cục site CSDL cục site n 46 MÔ HÌNH THAM CHIẾU CSDL PHÂN TÁN • Lược đồ toàn cục: Mô tả tổng thể thống tất liệu CSDL phân tán – Phản ánh tất cấu trúc liệu CSDL phân tán môi trường không phân tán – Tương thích với việc định nghĩa ánh xạ tới mức – Định nghĩa tập quan hệ toàn cục – Thông tin bao gồm : thực thể, phụ thuộc hàm, mối quan hệ thực thể (1-1,1-n,n-n) 47 MÔ HÌNH THAM CHIẾU CSDL PHÂN TÁN( ) • Lược đồ phân mảnh: – Các quan hệ tách biệt theo quan hệ ngữ nghĩa – Mối quan hệ môt-nhiều – Phân mảnh ngang, dọc hay kết hợp – Biểu thức ngôn ngữ quan hệ 48 MÔ HÌNH THAM CHIẾU CSDL PHÂN TÁN( ) • Lược đồ cấp phát: Những phần logic quan hệ toàn cục chứa hay nhiều site mạng – Rij : mô hình vật lý mảnh thứ i quan hệ R site thứ j – Có thể có 49 MÔ HÌNH THAM CHIẾU CSDL PHÂN TÁN( ) R1 Quan hệ toàn cục R R2 R11 R21 Site R12 R22 Site R3 R4 R23 R33 Site R43 Các phân mảnh mô hình vật lý cho quan hệ toàn cục 50 MÔ HÌNH THAM CHIẾU CSDL PHÂN TÁN( ) • Lược đồ ánh xạ cục bộ: Ánh xạ mô hình vật lý thành đối tượng thao tác hệ quản trị cục Các yếu tố: – Phân mảnh phân phát liệu – Quản lý dư thừa liệu – Sự độc lập hệ quản trị CSDL cbo 51 NHỮNG VẤN ĐỀ KỸ THUẬT ĐƯỢC NGHIÊN CỨU • Thiết kế csdl phân tán – Phân mảnh csdl ? – Dữ liệu phân chia với liệu nhân bản? • Xử lý truy vấn phân tán – Thiết kế giải thuật phân tích truy vấn biến đổi chúng thành chuỗi thao tác vận dụng liệu – Việc phân tán liệu, giá truyền thông phải xem xét – Tìm kế hoạch truy vấn tối ưu • Quản trị thư mục phân tán – Đồng việc truy nhập tương tranh đảm bảo tinh quán csdl trì – Toàn vẹn nhiều csdl xem xét (nhất quán tương hỗ) • Quản trị khóa chết phân tán: ngăn ngừa , tránh phát /phục hồi 52 Những vấn đề kỹ thuật nghiên cứu • Độ tin cậy – Đảm bảo hệ thống đàn hồi với thất bại – Nguyên tử bền vững • Csdl không - Rất nhiều site khác phương diện cấu trúc liệu logic(mô hình liệu)/ chế truy nhập (ngôn ngữ), cần cung cấp chế dịch 53 Kết luận • Csdl phân tán tập hợp csdl liên quan với phân tán mạng • Dữ liệu lưu số site, site nối với nhờ mạng Csdl phân tán hỗ trợ mô hình quan hệ • Tính suốt giấu chi tiết thực với người dùng Trong suốt Phân tán + Mạng + Giao dịch + Hiệu • Lập trình csdl phân tán liên quan đến : – Thiết kế csdl phân tán – Xử lý truy vấn phân tán – Quản trị thư mục phân tán – Điều khiển tương tranh phân tán – Quản trị khóa chết phân tán – Độ tin cậy 54 [...]... quan trọng nhất của công nghệ csdl là tích hợp chứ không tập trung • Mục tiêu của hệ thống csdl phân tán : đạt được sự tích hợp dữ liệu và trong suốt phân tán dữ liệu 21 Tính toán và xử lý dữ liệu phân tán • Hệ thống tính toán phân tán là tập hợp các phần tử xử lý tự trị được nối kết với nhau bằng mạng máy tính Các phần tử hợp tác để thực hiện nhiệm vụ • Thuật ngữ phân tán được chính xác hóa theo... toán và xử lý dữ liệu phân tán • Có thể phân tán – Logic xử lý – Các chức năng – Dữ liệu – Điều khiển • Phân loại các hệ thống phân tán theo các tiêu chí khác nhau – Mức độ kết dính: các phần tử xử lý kết nối với nhau như thế nào ( tỷ lệ giữa tổng dữ liệu được trao đổi đối với tổng dữ liệu xử lý cục bộ) Kết dính mạnh, kết dính yếu – Cấu trúc nối kết kết nối điểm-điểm giữa các phần tử xử lý Các... logic 1 bộ xử lý đơn – Các bộ xử lý trên các site khác nhau được nối kết với nhau qua mạng máy tính ( không tính đến đa xử lý , hệ thống xử lý song song) – Csdl phân tán là csdl không phải tập hợp các file Vị trí và truy vấn dữ liệu được tương tác bởi các mẫu người dùng – Hệ qtcsdl phân tán là tập hợp các hệ qtcsdl phân tán( không file hệ thống file điều khiển từ xa) 24 Định nghĩa csdl phân tán và hệ qtcsd... được phân quyền 28 Triển vọng csdl phân tán Các hệ thống csdl phân tán có các ưu điểm sau: • Độ tin cậy cao • Hiệu năng được nâng cao • Dễ dàng mở rộng quy mô • Trong suốt dữ liệu phân tán và nhân bản 29 Triển vọng csdl phân tán Độ tin cậy cao • Nhân bản các thành phần • Một liên kết truyền thông hay phần tử xử lý sự cố không làm toàn bộ hệ thống bị sập • Xử lý giao dịch phân tán đảm bảo nhất quán dữ. .. multi-point) Multicast 16 C Các khái niệm truyền thông dữ liệu • Link: thực thể vật lý • Kênh: thực thể logic – Kênh có dung lượng (b/s) – Băng thông (tương tự và số) 17 D Các giao thức truyền thông • Chồng giao thức TCP/IP – Kiến trúc phân tầng – Tầng giao vận – Tầng liên mạng • Các giao thức khác - IEEE 802 - ATM 18 1. 4 Cơ sở dữ liệu phân tán Độc lập dữ liệu • Ban đầu, các chương trình lưu dữ liệu trong các... trình phải duy trì dữ liệu của nó – Tổng phí lớn – Dễ mắc lỗi 19 Độc lập dữ liệu • Việc phát triển hệ qtcsdl giúp cho đạt được độc lập dữ liệu (trong suốt) một cách đầy đủ • Cung cấp việc duy trì và truy nhập dữ liệu điều khiển và trung tâm • ứng dụng độc lập với tổ chức vật lý và logic của file 20 Độc lập dữ liệu • Hệ thống csdl phân tán là bao gồm hai cách tiếp cận khác biệt: các hệ thống csdl và... đồng bộ 23 Định nghĩa csdl phân tán và hệ qtcsd phân tán • Một csdl phân tán là một tập hợp nhiều csdl liên quan logic trải trên một mạng máy tính • Một hệ qtcsdl phân tán là phần mềm quản trị csdl phân tán và cung cấp một cơ chế truy nhập tạo sự phân tán này trong suốt với người dùng • Hai thuật ngữ trên có thể được dùng lẫn nhau • Các giả thiết không tường minh : – Dữ liệu được lưu ở nhiều site,... hiện nhân bản – Việc ghi trở nên phức tạp hơn đối với dữ liệu được nhân bản 31 Triển vọng csdl phân tán Dễ dàng mở rộng hệ thống • Xác định quy mô csdl • Thúc đẩy công nghệ bộ vi xử lý và trạm – Mạng các trạm rẻ hơn nhiều máy tính lớn • Giá truyền thông dữ liệu với giá viễn thông • Tăng kích thước csdl 32 Triển vọng csdl phân tán Trong suốt • Tham chiếu đến sự tách rời ngữ nghĩa mức cao của hệ thống... 24 Định nghĩa csdl phân tán và hệ qtcsd phân tán 25 Ví dụ 1 cơ sở dữ liệu • CSDL gồm 3 quan hệ Dự án, Nhân viên và Công việc được phân chia và lưu trên các site khác nhau (phân mảnh) • Những vấn đề về truy vấn, giao dịch , tương tranh, độ tin cậy là gì? 26 Không phải csdl phân tán Chia xẻ bộ nhớ Không chia xẻ Chia xẻ đĩa Csdl trung tâm 27 Các ứng dụng csdl phân tán • Công nghiệp, đăc biệt là công nghiệp... function( chức năng phân tán) – distributed data processing (xử lý dữ liệu phân tán) – multiprocessors/multicomputers (đa xử lý/ đa máy tính) – satellite processing (xử lý vệ tinh) – back-end processing (xử lý back-end) – dedicated/special purpose computers (các máy tính mục đích thuần túy/dbiet) –timeshared systems (Các hệ thống phân chia thời gian) – functionally modular systems( Các hệ thống đơn thể ... Việc lặp lại li u làm tăng hiệu (dữ li u HK NY) Hong Kong-Trả lương Tính không đồng tự tri 1.2 CƠ SỞ DỮ LI U QUAN HỆ A Cơ sở li u quan hệ B Chuẩn hóa C Các ngôn ngữ li u quan hệ A Cơ sở li u quan... giao vận – Tầng li n mạng • Các giao thức khác - IEEE 802 - ATM 18 1.4 Cơ sở li u phân tán Độc lập li u • Ban đầu, chương trình lưu li u file thông thường • Mỗi chương trình phải trì li u – Tổng... li u quan hệ A Cơ sở li u quan hệ • Cơ sở li u: Tập hợp có cấu trúc li u li n quan đến tượng sống mà ta cố gắng mô hình hóa • Một CSDL quan hệ CSDL cấu trúc li u dạng bảng Về hình thức, định nghĩa