Bài giảng Cơ sơ dữ liệu phân tán: Phần 1 - ĐH Sư phạm kỹ thuật Nam Định

182 10 0
Bài giảng Cơ sơ dữ liệu phân tán: Phần 1 - ĐH Sư phạm kỹ thuật Nam Định

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bài giảng Cơ sơ dữ liệu phân tán: Phần 1 cung cấp cho người học những kiến thức như: Tổng quan về Cơ sở dữ liệu phân tán; Các mức trong suốt phân tán; Thiết kế cơ sở dữ liệu phân tán. Mời các bạn cùng tham khảo!

Tập giảng Cơ sơ liệu phân tán MỤC LỤC MỤC LỤC I CÁC DANH MỤC HÌNH V LỜI NÓI ĐẦU VII CHƢƠNG TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN 1.1 Các khái niệm 1.1.1 Xử lý phân tán 1.1.2 Hệ thống phân tán 1.1.3 Hệ sở liệu phân tán 1.2 Mục đích việc sử dụng sở liệu phân tán 1.2.1 Sự phát triển cấu tổ chức kinh tế 1.2.2 Sự kết nối lẫn CSDL 1.2.3 Sự lớn mạnh gia tăng 1.2.4 Giảm chi phí truyền thơng 1.2.5 Hiệu công việc 1.2.6 Độ tin cậy tính sẵn sàng 10 1.3 Các đặc điểm sở liệu phân tán 10 1.3.1 Điều khiển tập trung 10 1.3.2 Độc lập liệu 11 1.3.3 Giảm dƣ thừa 12 1.3.4 Các cấu trúc vật lý phức tạp dùng để truy xuất hiệu 12 1.3.5 Tính tồn vẹn 16 1.3.6 Phục hồi 17 1.3.7 Điều khiển đồng thời 17 1.3.8 Tính riêng biệt (privacy) tính bảo mật (security) 17 1.4 Mô hình kiến trúc tham chiếu CSDL phân tán 17 1.4.1 Lƣợc đồ toàn cục 18 1.4.2 Lƣợc đồ phân mảnh 18 1.4.3 Lƣợc đồ định vị 19 1.4.4 Lƣợc đồ ánh xạ cục 20 1.4.5 Mục tiêu kiến trúc tham chiếu CSDL phân tán 20 1.5 Cấu trúc logic CSDL phân tán 22 1.6 Lợi ích phân tán liệu mạng 22 1.7 Kiến trúc hệ quản trị CSDL phân tán 23 1.7.1 Các đặc tính kiến trúc hệ quản trị CSDL phân tán 23 1.7.2 Các kiểu kiến trúc tham chiếu hệ quản trị CSDL phân tán 26 1.8 Hệ quản trị CSDL phân tán 33 1.8.1 Các thành phần hệ quản trị CSDL phân tán 33 i Tập giảng Cơ sở liệu phân tán 1.8.2 Các dịch vụ hệ quản trị CSDL phân tán 36 1.8.3 Phƣơng pháp truy xuất CSDL phân tán 37 1.8.4 Phân loại hệ quản trị CSDL phân tán 38 Chƣơng CÁC MỨC TRONG SUỐT PHÂN TÁN 41 2.1 Các loại phân mảnh liệu 41 2.1.1 Điều kiện đắn để phân mảnh liệu 42 2.1.2 Phân mảnh ngang 43 2.1.3 Phân mảnh dọc 52 2.1.4 Phân mảnh hỗn hợp 57 2.2 Tính suốt phân mảnh dùng cho ứng dụng đọc 67 2.2.1 Các mức suốt phân tán 67 2.2.2 Chƣơng trình cho ứng dụng đọc 67 2.3 Tính suốt phân mảnh dùng cho ứng dụng cập nhật 85 2.3.1 Cây cập nhật 85 2.3.2 Chƣơng trình ứng dụng cho ứng dụng cập nhật 89 2.4 Các thao tác truy xuất CSDL phân tán 93 2.4.1 Truy xuất CSDL với giá trị 94 2.4.2 Truy xuất CSDL sau nhập vào tất giá trị 96 2.4.3 Truy xuất CSDL trƣớc nhập vào giá trị 98 2.4.4 Truy xuất CSDL sử dụng biểu thức chung 100 2.5 Ràng buộc CSDL phân tán 102 2.5.1 Ràng buộc toàn vẹn 102 2.5.2 Ràng buộc tham chiếu 103 2.5.3 Thiết kế ràng buộc tham chiếu 104 CHƢƠNG THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN 107 3.1 Vấn đề thiết kế sở liệu phân tán 108 3.1.1 Các bƣớc thiết kế phân tán liệu 108 3.1.2 Các mục tiêu thiết kế phân tán liệu 109 3.1.3 Chiến lƣợc thiết kế phân tán liệu 111 3.1.4 Các yêu cầu thông tin 115 3.2 Thiết kế phân mảnh sở liệu 116 3.3 Thiết kế phân mảnh ngang 117 3.3.1 Các yêu cầu thông tin phân mảnh ngang 117 3.3.2 Thiết kế phân mảnh ngang 122 3.3.3 Thiết kế phân mảnh ngang dẫn xuất 134 3.3.4 Kiểm tra điều kiện đắn phân mảnh ngang 139 3.4 Thiết kế phân mảnh dọc 140 3.4.1 Các chiến lƣợc thiết kế phân mảnh dọc 140 3.4.2 Các yêu cầu thông tin phân mảnh dọc 143 3.4.3 Giải thuật gom tụ 147 ii Tập giảng Cơ sở liệu phân tán 3.4.4 Giải thuật phân tách 153 3.4.5 Kiểm tra tính đắn phân mảnh dọc 156 3.5 Thiết kế phân mảnh hỗn hợp 157 3.6 Thiết kế định vị sở liệu .157 3.6.1 Bài toán định vị 158 3.6.2 Các yêu cầu thông tin 160 3.6.3 Mơ hình định vị 162 3.6.4 Các giải pháp 164 3.7 Kiểm soát liệu ngữ nghĩa .165 3.7.1 Quản lý khung nhìn 165 3.7.2 An toàn liệu 167 3.7.3 Kiểm sốt tính tồn vẹn ngữ nghĩa 170 CHƢƠNG BIẾN ĐỔI CÁC TRUY VẤN TOÀN CỤC THÀNH CÁC TRUY VẤN MẢNH 175 4.1 Các phép biến đổi tƣơng đƣơng dùng cho truy vấn .176 4.1.1 Cây toán tử truy vấn 176 4.1.2 Các phép biến đổi tƣơng đƣơng dùng cho đại số quan hệ 177 4.1.3 Đồ thị toán tử xác đinh biểu thức chung 181 4.2 Biến đổi truy vấn toàn cục thành truy vấn mảnh 184 4.2.1 Biểu thức chuẩn tắc truy vấn mảnh 184 4.2.2 Đại số quan hệ định tính 185 4.2.3 Đơn giản hóa quan hệ đƣợc phân mảnh ngang .189 4.2.4 Đơn giản hóa phép kết nối quan hệ đƣợc phân mảnh ngang 191 4.2.5 Đơn giản hóa cho phân mảnh ngang dẫn xuất 192 4.2.6 Đơn giản hóa quan hệ đƣợc phân mảnh dọc 194 4.2.7 Sử dụng phép suy diễn cho phép đơn giản hóa .196 4.2.8 Các chƣơng trình nửa kết nối 197 4.3 Gom nhóm phân tán định trị hàm kết hợp 198 4.3.1 Mở rộng đại số quan hệ 199 4.3.2 Các đặc tính phép gom nhóm 199 4.4 Các truy vấn có tham số 202 4.4.1 Đơn giản hóa truy vấn tham số mở rộng đại số quan hệ 203 4.4.2 Sử dụng vùng nhớ tạm thời sử dụng nhiều lần truy vấn tham số .205 CHƢƠNG TỐI ƢU HÓA CÁC CHIẾN LƢỢC TRUY XUẤT 207 5.1 Một số cấu cho tối ƣu hóa truy vấn 207 5.1.1 Các vấn đề tối ƣu hóa truy vấn 207 5.1.2 Các mục tiêu tối ƣu hóa truy vấn 209 5.1.3 Một mô hình truy vấn 211 5.1.4 Tóm lƣợc giả sử dùng cho tối ƣu hóa truy vấn phân tán 218 iii Tập giảng Cơ sở liệu phân tán 5.1.5 Tầm quan trọng tối ƣu hóa truy vấn sở liệu phân tán 218 5.2 Các truy vấn kết nối 220 5.2.1 Sử dụng chƣơng trình nửa kết nối cho truy vấn kết nối 220 5.2.2 Xác định chƣơng trình nửa kết nối SDD-1 224 5.2.3 Xác định chƣơng trình nửa kết nối giải thuật 228 5.2.4 Xử lý truy vấn cách sử dụng phép nối 231 5.3 Các truy vấn tổng quát 235 CÂU HỎI VÀ BÀI TẬP 239 PHỤ LỤC 277 TÀI LIỆU THAM KHẢO I iv Tập giảng Cơ sở liệu phân tán CÁC DANH MỤC HÌNH Hình 1.1 Xử lý liệu truyền thống Hình 1.2 Xử lý sở liệu Hình 1.3 Một sở liệu phân tán mạng phân tán địa lý Hình 1.4 Một sở liệu phân tán mạng cục Hình 1.5 Một hệ thống đa xử lý (multiprossor system) Hình 1.6 Sơ đồ lƣu trữ phân tán Hình 1.7 Một lƣợc đồ CSDL Codasyl 13 Hình 1.8 Một chƣơng trình tựa Codasyl-DBMS để tìm kiếm mặt hàng đƣợc cung cấp nhà cung cấp S1 13 Hình 1.9 Sự phân tán tập SUPPLIER-PART 14 Hình 1.10 Ví dụ kế hoạch truy xuất 15 Hình 1.11 Một kiến trúc tham chiếu dùng cho CSDL phân tán 18 Hình 1.12 Các mảnh hình ảnh vật lý quan hệ toàn cục 19 Hình 1.13 Các mảnh hình ảnh vật lý quan hệ dự án 20 Hình 1.14 Mơ hình Client-Server nhiều lớp 22 Hình 1.15 Lựa chọn cài đặt hệ quản trị CSDL 23 Hình 1.16 Kiến trúc tham chiếu Client/Server 27 Hình 1.17 Kiến trúc tham chiếu CSDL phân tán 28 Hình 1.18 Sơ đồ chức hệ quản trị CSDL phân tán tích hợp 29 Hình 1.19 Mơ hình kiến trúc phức hệ 30 Hình 1.20 Kiến trúc phức hệ CSDL với lƣợc đồ khái niệm toàn cục 31 Hình 1.21 Kiến trúc phức hệ CSDL không sử dụng GCS 32 Hình 1.22 Các thành phần phức hệ CSDL 33 Hình 1.23 Hệ quản trị CSDL phân tán 34 Hình 1.24 Các thành phần hệ quản trị CSDL phân tán 35 Hình 1.25 Các thành phần DDBMS thƣơng mại hóa 36 Hình 1.26 Truy xuất từ xa thơng qua thao tác DBMS 37 Hình 1.27 Truy xuất từ xa thông qua thao tác DBMS 38 Hình 1.28 Kiến trúc mơ hình hệ quản trị CSDL đồng 39 Hình 1.29 Kiến trúc mơ hình hệ quản trị CSDL khơng đồng 39 Hình 2.1 Cây phân mảnh dẫn xuất 52 Hình 2.2 Cây phân mảnh dẫn xuất hệ thống quản lý dự án 52 Hình 2.3 Truy xuất CSDL Quản lý dự án DDBMS với suốt phân mảnh 70 Hình 2.4 Truy xuất CSDL QL Kinh doanh DDBMS với suốt phân mảnh 71 Hình 2.5 Truy xuất CSDL QL Dự án DDBMS với suốt vị trí 74 Hình 2.6 Truy xuất CSDL QL kinh doanh DDBMS với suốt vị trí 76 Hình 2.7 Truy xuất CSDL QL Dự án DDBMS với suốt ánh xạ cục 80 Hình 2.8 Truy xuất CSDL QL kinh doanh DDBMS với suốt ánh xạ cục 82 Hình 2.9 Một số ứng dụng CSDL phân tán không đồng suốt 85 v Tập giảng Cơ sở liệu phân tán Hình 2.10 Cây cập nhật cho thuộc tính MAP phân mảnh quan hệ NV 87 Hình 2.11 Cây cập nhật khác cho thuộc tính MaP phân mảnh quan hệ NV 88 Hình 3.1 Sơ đồ thiết kế tổng CSDL phân tán 108 Hình 3.2 Chiến lƣợc thiết kế từ xuống 112 Hình 3.3 Sơ đồ thiết kế tổng CSDL phân tán 138 Hình 4.1 Đồ thị tốn tử chƣơng trình nửa kết nối 197 Hình 5.1 Một chƣơng trình rút gọn hồn tồn cho quan hệ R 223 Hình 5.2 Hậu tối ƣu hóa giải thuật SDD-1 227 Hình 5.3 kế hoạch cho quan hệ T 229 Hình 5.4 Giao hốn phép kết nối phép hợp 236 Hình 5.5 Tối ƣu hóa độc lập đồ thị kết nối phân tách 237 Hình 5.6 Các đồ thị tối ƣu hố khác cho truy vấn 237 vi Tập giảng Cơ sở liệu phân tán LỜI NÓI ĐẦU Ngày nay, với phát triển nhanh chóng cơng nghệ truyền thơng mạng Internet, với xu tồn cầu hố lĩnh vực, liệu không đơn giản đƣợc lƣu trữ tập trung nơi mà đƣợc lƣu trữ nhiều nơi Do đó, sở liệu phân tán trở thành lĩnh vực nghiên cứu ngành CNTT Môn học Cơ sở liệu phân tán môn học không đề cập đến vấn đề sở lý thuyết mà cung cấp số kỹ cần thiết để thiết kế cài đặt hệ sở liệu phân tán cụ thể Để giúp sinh viên ngành thuộc lĩnh vực Công nghệ thông tin trƣờng Đại học Sƣ phạm Kỹ thuật Nam Định học tốt môn học vận dụng để phân tích thiết kế sở liệu phân tán việc xuất “Tập giảng Cơ sở liệu phân tán” cần thiết Tập giảng đƣợc chia làm chƣơng: Chƣơng Tổng quan Cơ sở liệu phân tán Chƣơng Các mức suốt phân tán Chƣơng Thiết kế sở liệu phân tán Chƣơng Biến đổi truy vấn toàn cục thành truy vấn mảnh Chƣơng Tối ƣu hóa chiến lƣợc truy xuất Mỗi chƣơng tập giảng hệ thống hóa kiến thức bản, cần thiết Tƣơng ứng với nội dung kiến thức có ví dụ minh họa cụ thể, gán với ứng dụng thực tiễn Đặc biệt, cuối tập giảng, tác giả đƣa câu hỏi lý thuyết, câu hỏi trắc nghiệm số tập để sinh viên vận dụng củng cố lại kiến thức kỹ Với phần lý thuyết chi tiết, đầy đủ đƣợc trình bày cách khoa học, logic phần tập để củng cố kiến, hy vọng tập giảng mang lại cho bạn đọc nhiều điều bổ ích Trong q trình biên soạn, tập giảng khơng tránh khỏi sai sót, mong đồng nghiệp em sinh viên góp ý kiến để tập giảng ngày đƣợc hoàn thiện Mọi đóng góp ý kiến xin gửi Văn phịng Khoa Cơng nghệ thơng tin-Trƣờng Đại học Sƣ phạm Kỹ thuật Nam Định-Phƣờng Lộc Hạ-Tp Nam Định Nhóm biên soạn Phạm Hùng Phú- Nguyễn Văn Thẩm vii Tập giảng Cơ sở liệu phân tán Chƣơng TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN Với việc phân bố ngày rộng rãi công ty, xí nghiệp, liệu tốn lớn không tập trung đƣợc Các sở liệu (CSDL) thuộc hệ hai không giải đƣợc tốn mơi trƣờng khơng tập trung mà phân tán, song song với liệu hệ thống không nhất, hệ thứ ba hệ quản trị CSDL đời vào năm 80 có CSDL phân tán để đáp ứng nhu cầu Ngày nay, CSDL phân tán trở thành lĩnh vực quan trọng xử lý thông tin tầm quan trọng ngày tăng nhanh Có hai lý mặt cơng nghệ mặt tổ chức để theo hƣớng này: - Các CSDL phân tán khắc phục nhiều thiếu sót CSDL tập trung (centralized database) - Thích hợp cách tự nhiên với cấu trúc không tập trung (decentralized structure) nhiều tổ chức (organization) 1.1 Các khái niệm Nguyên lý hệ sở liệu phân tán đƣợc xây dựng dựa hợp hai hƣớng tiếp cận trình xử lý liệu, lý thuyết hệ sở liệu cơng nghệ mạng máy tính Một động lực thúc đẩy phát triển nhanh việc sử dụng hệ CSDL nhu cầu tích hợp loại liệu, cung cấp đa dạng loại hình dịch vụ dịch vụ đa phƣơng tiện cho ngƣời sử dụng Mặt khác, kết nối máy tính thành mạng với mục tiêu chia sẻ tài ngun, khai thác có hiệu tài ngun thơng tin, nâng cao khả tích hợp trao đổi loại liệu thành phần mạng Nhu cầu thu thập, lƣu trữ xử lý trao đổi thông tin ngày tăng, hệ thống xử lý tập trung bộc lộ nhƣợc điểm sau: - Tăng khả lƣu trữ thơng tin khó khăn, bị giới hạn tối đa thiết bị nhớ - Độ sẵn sàng phục vụ CSDL không cao số ngƣời sử dụng tăng - Khả tính tốn máy tính đơn lẻ dần tới giới hạn vật lý - Mơ hình tổ chức lƣu trữ, xử lý liệu tập trung không phù hợp cho tổ chức kinh tế, xã hội có hoạt động rộng lớn, đa quốc gia Những nhƣợc điểm đƣợc khắc phục nhiều hệ thống phân tán Những sản phẩm hệ thống phân tán xuất nhiều thị trƣờng bƣớc chứng minh tính ƣu việt hẳn hệ thống tập trung truyền thống Các hệ thống phân tán thay dần hệ thống tập trung Tập giảng Cơ sở liệu phân tán 1.1.1 Xử lý phân tán Thuật ngữ xử lý phân tán thuật ngữ đƣợc lạm dụng nhiều khoa học máy tính năm vừa qua Nó thƣờng đƣợc dùng để hệ thống gồm nhiều loại thiết bị khác chẳng hạn nhƣ: hệ đa vi xử lý, xử lý liệu phân tán, mạng máy tính Có hai khái niệm xử lý phân tán liên quan với - Khái niệm liên quan đến việc tính tốn Client/Server Trong ứng dụng đƣợc chia thành hai phần, phần Server phần Client đƣợc vận hành hai nơi Trong tính tốn phân tán cho phép truy nhập trực tiếp liệu xử lý liệu Server Client - Khái niệm thứ hai việc thực tác vụ xử lý phức tạp nhiều hệ thống Không gian nhớ xử lý nhiều máy hoạt động chia tác vụ xử lý Máy trung tâm giám sát quản lý tiến trình Có trƣờng hợp thơng qua Internet, hàng nghìn máy xử lý tác vụ Có thể định nghĩa hệ xử lý phân tán nhƣ sau: Hệ xử lý phân tán tập hợp phần tử xử lý tự trị (không thiết đồng nhất) đƣợc kết nối với mạng máy tính phối hợp thực công việc gán cho chúng Phần tử xử lý để thiết bị tính tốn có khả thực chƣơng trình 1.1.2 Hệ thống phân tán Hệ thống phân tán tập hợp máy tính độc lập kết nối với thành mạng máy tính đƣợc cài đặt hệ sở liệu phần mềm hệ thống phân tán tạo khả cho nhiều ngƣời sử dụng truy nhập chia sẻ nguồn thông tin chung Các máy tính hệ thống phân tán có kết nối phần cứng lỏng lẻo, có nghĩa khơng chia sẻ nhớ, có hệ điều hành tồn hệ thống phân tán Các mạng máy tính đƣợc xây dựng dựa kỹ thuật Web Ví dụ nhƣ mạng Internet, mạng Intranet… mạng phân tán 1.1.3 Hệ sở liệu phân tán Công nghệ hệ CSDL phát triển từ mơ hình liệu, ứng dụng định nghĩa hay nhiều tệp liệu riêng đƣợc mơ tả nhƣ hình 1.1, sang mơ hình định nghĩa quản lý liệu tập trung Điều dẫn đến khái niệm độc lập liệu, nghĩa tính bất biến hệ ứng dụng thay đổi cấu trúc lƣu trữ chiến lƣợc truy nhập liệu Tập giảng Cơ sở liệu phân tán pháp mang tính kinh nghiệm (heuristics) tốt để đạt đƣợc giải pháp gần tối ƣu (suboptimal solution) Có số lý đặt vấn đề đơn giản nhƣ bàn luận lại khơng thích hợp với CSDL phân tán Các lý vốn có tất mơ hình định vị tập tin trƣớc tất mạng máy tính - Chúng ta xử lý mảnh nhƣ tập tin riêng biệt mà lần định vị tập tin cách riêng bịêt Việc đặt mảnh thƣờng có ảnh hƣởng định đến việc đặt mảnh khác mà chúng đƣợc truy xuất chung với nhau, chi phí truy xuất đến mảnh cịn lại bị thay đổi (ví dụ phép kết nối phân tán) Do cần quan tâm đến mối quan hệ mảnh - Truy xuất đến liệu ứng dụng đƣợc mơ hình hoá đơn giản Một yêu cầu ngƣời sử dụng đƣợc phát sinh từ nơi tất liệu dùng để trả lời yêu cầu đƣợc truyền đến nơi Trong hệ thống CSDL phân tán, truy xuất đến liệu phức tạp nhiều so với mơ hình “truy xuất tập tin từ xa” Do mối quan hệ việc định vị xử lý truy vấn cần phải đƣợc mơ hình hố cách đắn - Các mơ hình khơng xét đến chi phí tính tồn vẹn, việc đặt hai quan hệ có liên quan đến ràng buộc toàn vẹn hai nơi khác tốn chi phí - Tƣơng tự cần phải xét đến chi phí điều khiển chế điều khiển đồng thời Bởi việc định vị yếu, mối quan hệ đƣợc thực cho toán khác cần phải binểu diễn mơ hình định vị Tuy nhiên điều làm cho chúng khó giải mơ hình Để phân biệt toán định vị tập tin truyền thống với việc định vị mảnh thiết kế mảnh CSDL phân tán, gọi toán thứ toán định vị tập tin (FAP - File Allocation Problem) toán thƣ hai toán định vi sở liệu ( DAP - Database Allocation Problem) Khơng có mơ hình chung mang tính kinh nghiệm mà phần nhập tập hợp mảnh cho việc định vị gần tối ƣu (near - optimal allocation) cho loại ràng buộc đƣợc bàn luận Các mơ hình đƣợc phát triển có số giả thiết đơn giản đƣợc áp dụng cho số tốn cụ thể Do đó, thay trình bày nhiều giải thuật định vị này, giới thiệu mơ hình tƣơng đối tổng qt sau bàn luận số giải thuật mang tính kinh nghiệm có để giải tốn định vị 3.6.2 Các u cầu thơng tin 1) Thông tin sở liệu - Hệ số chọn mảnh Hệ số chọn mảnh Fj truy vấn qi sel( Fj)={số Fj cần đƣợc truy xuất để xử lý qi} 160 Tập giảng Cơ sở liệu phân tán - Kích thước mảnh Fj size( Fj) = card(Fj)  length(Fj) length(Fj) chiều dài (số byte ) mảnh Fj 2) Thông tin ứng dụng Cho F = {F1,F2, ,Fn} Q = {q1,q2,…,qq} Kí hiệu rij số lần truy xuất đọc mảnh Fj q trình thực truy vấn qi Ta có ma trận RR xác định số lần đọc mảnh F trình thực truy vấn Q  r11 r1n  RR=      rq1 rqn  truy vấn q i đọc mảnh Fj rij =  0 nÕu truy vÊn q i không đọc mảnh Fj Kớ hiu uij l số lần truy xuất cập nhật mảnh Fj việc thực truy vấn qi Ta có ma trận UR xác định số lần cập nhật mảnh F trình thực truy vấn Q  u11 u1n    UR=    u q1 u qn    1 nÕu truy vÊn q i cËp nhËt m¶nh Fj u ij =  0 nÕu truy vÊn q i không cập nhật mảnh Fj Kớ hiu O(i) nơi gốc truy vấn qi 3) Thông tin vị trí Đối với nơi mạng máy tính, cần xác định + khả lƣu trữ + khả xử lý Cho F={F1, F2, , Fn} S={S1, S2,…,Sm} Chi phí lƣu trữ đơn vị: Ký hiệu USCk chi phí lƣu trữ liệu nơi Sk Chi phí xử lý: Ký hiệu LPCk chi phí xử lý đơn vị cơng việc nơi Sk 4) Thơng tin mạng - Chi phí truyền thơng đƣợc xác định theo gói liệu (frame of data): + Kí hiệu gij chi phí truyền gói liệu nơi Si Sj + Kí hiệu fsize kích thƣớc (tính theo byte) gói - Khả kênh truyền 161 Tập giảng Cơ sở liệu phân tán - Khoảng cách nơi - Chi phí giao thức,… 3.6.3 Mơ hình định vị Mơ hình định vị để cực tiểu hố chi phí tổng cộng việc xử lý lƣu trữ có dạng: (chi phí tổng cộng) ứng với ràng buộc thời gian đáp ứng, ràng buộc lƣu trữ, ràng buộc xử lý Kí hiệu xij biến định chọn nơi đặt cho 1 nÕu m¶nh Fi đặt S j x ij mảnh Fi không đặt S j 1) Chi phí tổng cộng Hàm chi phí tổng cộng TOC =  QPCi + qi Q   STCjk Sk S FjF Trong đó: + QPCi chi phí xử lý truy vấn ứng dụng qi +  QPCi chi phí xử lý truy vấn tất ứng dụng Q qi Q + STCjk chi phí lƣu trữ mảnh Fj nơi Sk +   STCjk chi phí lƣu trữ tổng cộng tất nơi mảnh Sk S FjF Chi phí lưu trữ: STCjk = USCk * size(Fj) * xij Chi phí xử lý truy vấn: QPCi = PCi + TCi Trong đó: + PCi chi phí xử lý cho ứng dụng qi + TCi chi phí truyền thơng cho ứng dụng qi Chi phí xử lý PC: PCi = ACi + IEi + CCi Trong đó: + ACi chi phí truy xuất cho ứng dụng qi + IEi chi phí trì toàn vẹn cho ứng dụng qi + CCi chi phí điều khiển đồng thời cho ứng dụng qi Chi phí truy xuất AC: ACi  Trong : 162 Σ Σ (uij * UR ij  rij * RR ij ) * x jk * LPCk Sk SFjF Tập giảng Cơ sở liệu phân tán + uij* URij số lần truy xuất cập nhật ứng dụng qi đến mảnh Fj + rij* RRij số lần truy xuất đọc ứng dụng qi đến mảnh Fj + LPCk chi phí truy xuất ứng dụng qi nơi Sk + xjk để chọn giá trị chi phí lƣu trữ nơi Sk có đặt mảnh Fj Chi phí truyền thơng TCi = TCUi + TCRi Trong + TCUi: chi phí truyền thơng liệu u cầu cập nhật + TCRi: chi phí truyền thơng liệu yêu cầu đọc Chi phí truyền thơng liệu u cầu đọc TCR i   min(uij * x jk *go(i),k  rij * x jk * seli (Fj ) *length(Fj ) FjF fsize *g k,o(i) ) Trong + u ij * x jk *go(i),k : chi phí truyền u cầu đọc đến vị trí có mảnh cần truy xuất + rij * x jk * seli (Fj ) *length(Fj ) fsize *g k,o(i) : chi phí truyền liệu từ vị trí có mảnh cần truy xuất đến vị trí u cầu Chi phí truyền thơng liệu yêu cầu cập nhật TCUk    uij * x jk *go(i),k    uij * xij *g k,o(i) Sk S FjF Sk S FjF Trong +   uij * x jk *go(i),k : gửi thông điệp cập nhật từ nơi gốc o(i) qi đến tất Sk S FjF nhân cần đƣợc cập nhật +   uij * xij *gk,o(i) : chi phí dành cho thơng báo xác nhận Sk S FjF 2) Các ràng buộc Cho Q = {q1,q2,…,qq} S = {S1,S2,…,Sm} Ràng buộc thời gian: qi  Q: ETi  MTi Trong + ETi: thời gian thực thi qi + MTi: thời gian đáp ứng lớn qi 163 Tập giảng Cơ sở liệu phân tán Ràng buộc lưu trữ Sk  S :  STC jk  SAk Fk F Trong + SAk: khả lƣu trữ nơi S k Ràng buộc xử lí Sk  S :  qi Q PPik  PAk Trong +  qi Q PPik : tải trọng xử lý qi nơi S k + PAk: khả xử lý S k 3.6.4 Các giải pháp Trong phần trƣớc, trình bày mơ hình định vị chung, phức tạp nhiều so với mơ hình FAP đựơc trình bày phần Bởi mơ hình FAP thuộc NP- đầy đủ, ngƣời ta cho rằng, giải pháp toán định vị CSDL (DAP) thuộc NP- đầy đủ Mặc dù khơng chứng minh điều ƣớc đốn này, nhƣng điều thực Do đó, cần phải tìm phƣơng pháp mang tính kinh nghiệm cho lời giải cần tối ƣu Kiểm tra “lời giải tốt” trƣờng hợp xét kết giải thuật mang tính kinh nghiệm có gần với định vị tối ƣu không ? Một số giải thuật mang tính kinh nghiệm đƣợc áp dụng để giải mơ hình FAP DAP Sự tƣơng ứng FAP tóan định vị nhà máy (plant location problem) đƣợc khảo sát từ lâu đƣợc nghiên cứu vận trù học (operatinons reasearch) Các giải thuật mang tính kinh nghiệm đƣợc nhà vận trù học phát triển thƣờng đƣợc sủ dụng để giải tốn FAP DAP Có nhiều nỗ lực khác nhằm giảm độ phức tạp toán Một chiến lƣợc giả sử tất cách phân chia có đƣợc xác định với chi phí lợi ích chúng theo việc xử lý truy vấn Do đó, tốn đƣợc mơ hình hóa chọn cách phân chia tối ƣu xắp xếp quan hệ Một đơn giản khác thƣờng đƣợc áp dụng trƣớc tiên bỏ quan nhân tìm lời giải tối ƣu không nhân Sự nhân đƣợc giải bƣớc thứ hai cách áp dụng giải thuật tham lam (greedy algorithm) lời giải không nhân nhƣ lời giải khả thi ban đầu sau cải tiến lời giải Tuy nhiên, giải thuật mang tính kinh nghiệm này, khơng có đủ liệu để xác định kết gắn liền với lời giải tối ƣu 164 Tập giảng Cơ sở liệu phân tán 3.7 Kiểm soát liệu ngữ nghĩa 3.7.1 Quản lý khung nhìn Một khung nhìn liệu cửa sổ động theo nghĩa phán ánh hoạt động cập nhật sở liệu, quan hệ ảo đƣợc định nghĩa nhƣ kết truy vấn quan hệ sở quan hệ trung gian Quản lý khung nhìn có tác dụng bảo đảm đƣợc tính an tồn liệu Nó cung cấp cách nhìn tổng quát trực diện thao tác đựoc thực CSDL Ngƣời sử dụng đƣợc phép truy nhập CSDL qua khung nhìn, khơng thể nhìn thấy khơng thể thao tác liệu ẩn, liệu đƣợc bảo vệ 1) Khung nhìn hệ quản trị sử liệu tập trung Một khung nhìn quan hệ đƣợc dẫn xuất từ quan hệ nguồn nhƣ kết câu truy vấn Khung nhìn đƣợc định nghĩa cách gán tên khung cho câu truy vấn Ví dụ 3.28: Xét quan hệ tồn cục NV ví dụ 3.2 câu truy vấn sau: CREAT VIEW NV1(MANV, TENNV) AS (SELECT MANV, TENNV FROM NV WHERE CV=‟Phân tích TKHT‟) Kết câu truy vấn định nghĩa khung nhìn, quan hệ gán tên NV1 gồm có thuộc tính MANV, TENNV nhân viên có chức vụ ‟Phân tích TKHT‟ Quan hệ gốc Khung nhìn 2) Cập nhật qua khung nhìn Khung nhìn đƣợc định nghĩa câu truy vấn bao gồm phép chiếu, chọn, kết nối hàm gộp nhóm đƣợc truy vấn nhƣ quan hệ sở Cập nhật qua khung nhìn đƣợc xử lý tự động chúng đƣợc lan truyền xác đến quan hệ sở 165 Tập giảng Cơ sở liệu phân tán Có hai loại khung nhìn: loại khung nhìn cập nhật đƣợc loại khung nhìn khơng cập nhật đƣợc Khung nhìn cập nhật đƣợc khung nhìn thực phép cập nhật lan truyền xác đến quan hệ sở mà khơng có nhầm lẫn Khung nhìn NV1 ví dụ 3.28 khung nhìn cập nhật đƣợc Khi thực việc chèn thêm thông tin nhân viên phân tích TKHT vào khung nhìn NV1, hệ thống ánh xạ thành thao tác chèn thông tin nhân viên vào quan hệ NV Nếu thuộc tính bị che khuất khung nhìn, chúng nhận giá trị khơng null Các hệ thống hỗ trợ cập nhật đƣợc qua khung nhìn hạn chế Các khung nhìn cập nhật đƣợc chúng đƣợc dẫn xuất từ quan hệ phép chọn phép chiếu Các khung nhìn đƣợc định nghĩa phép kết nối hay phép gộp nhóm thƣờng khơng thuộc loại cập nhật đƣợc Ví dụ 3.29: Xét quan hệ tồn cục NV ví dụ 3.2 câu truy vấn sau: CREAT VIEW HS1(TENNV, TG) AS (SELECT TENNV, TG FROM NV, HS WHERE NV.MANV=HS.MANV) Khung nhìn HS thuộc loại khung nhìn khơng cập nhật đƣợc Khung nhìn đƣợc dẫn xuất từ phép kết nối khung nhìn cập nhật đƣợc có chứa khố quan hệ sở 3) Khung nhìn hệ quản trị sở liệu phân tán Định nghĩa khung nhìn hệ quản trị sở liệu phân tán giống nhƣ hệ quản trị sở liệu tập trung Tuy nhiên, hệ thống phân tán, quan hệ sở dẫn xuất mảnh quan hệ đƣợc lƣu trữ vị trí khác Vì định nghĩa khung nhìn, tên khung nhìn , cấu trúc khung nhìn câu truy vấn truy xuất mảnh đƣợc sử dụng làm quan hệ sở ứng dụng phải đƣợc lƣu trữ thƣ mục mô tả quan hệ sở Phụ thuộc vào mức độ tự trị vị trí, định nghĩa khung nhìn tập trung vị trí, đƣợc nhân phần tồn Trong trƣờng hợp, thơng tin liên kết khung nhìn với vị trí định nghĩa phải đƣợc nhân Nếu định nghĩa khung nhìn khơng có vị trí câu truy vấn phải truy xuất từ xa đến vị trí có định nghĩa khung nhìn Ánh xạ câu truy vấn đƣợc diễn tả theo khung nhìn thành câu truy vấn đƣợc diễn tả theo quan hệ sở giống nhƣ hệ thống tập trung Nghĩa qua phƣơng pháp hiệu chỉnh Vì lƣợng từ hố dùng để định nghĩa khung nhìn đƣợc lấy từ thƣ mục phân tán, đƣợc trộn với câu truy vấn thành câu truy vấn theo quan hệ sở Một câu truy vấn nhƣ đƣợc gọi câu truy vấn phân tán 166 Tập giảng Cơ sở liệu phân tán Khung nhìn hệ thống phân tán đƣợc dẫn xuất từ quan hệ phân tán, có chi phí cao ƣớc lƣợng Một khung nhìn có trhể có nhiều ngƣời sử dụng, cần đƣa giải pháp nhằm tối ƣu hố dẫn xuất khung nhìn 3.7.2 An tồn liệu An toàn liệu nhiệm vụ quan trọng hệ thống sở liệu, nhằm bảo vệ liệu không bị truy xuất “bất hợp pháp” An toàn liệu bao gồm vấn đề: - Bảo vệ liệu: nhằm tránh ngƣời không đƣợc quyền hiểu đƣợc nội dung vật lý liệu Phƣơng pháp sử dụng thông dụng mã hố liệu Mã khố bí mật mã khố cơng khai - Biện pháp kiểm sốt cấp quyền nhằm đảm bảo ngƣời sử dụng đƣợc phép đƣợc thực thao tác đƣợc phép sở liệu Cấp quyền truy xuất sở liệu cho ngƣời sử dụng ngƣời quản trị sở liệu Ngƣời sử dụng khác đƣợc cấp quyền khác dƣới kiểm soát hệ thống Từ giải pháp kiểm soát cấp quyền.trong hệ thống tập trung đề xuất giải pháp kiểm soát cấp quyền phân tán 1) Kiểm soát cấp quyền tập trung Ba tác nhân có ảnh hƣởng đến việc kiểm sốt cấp quyền truy xuất sở liệu ngƣời sử dụng là: Ngƣời sử dụng, ngƣời quản trị sở liệu kích hoạt trình ứng dụng, thao tác gắn với ứng dụng tác nhân cuối đối tƣợng sở liệu đƣợc thao tác tác động Kiểm soát cấp quyền bao gồm việc kiểm soát ngƣời sử dụng, thao tác, đối tƣợng có đƣợc phép thực hay khơng Nghĩa ngƣời sử dụng thực thao tác đối tƣợng hay khơng Một quyền đƣợc cấp (Authorization) đƣợc xem ba thành phần: Ngƣời sử dụng, loại thao tác định nghĩa đối tƣợng Nghĩa ngƣời sử dụng đƣợc quyền thao tác đối tƣợng Khai báo ngƣời sử dụng, hay nhóm ngƣời sử dụng với hệ thống thƣờng đƣợc thực cặp: tên ngƣời sử dụng (User name), mật (Password).Tên ngƣời sử dụng xác định ngƣời sử dụng có tên hệ thống Mật xác nhận ngƣời sử dụng đƣợc quyền truy nhập vào sở liệu Tên mật phải khai báo đăng nhập vào hệ thống, nhằm ngăn chặn truy nhập vào hệ thống bất hợp pháp Đối tƣợng cần bảo vệ tập sở liệu Trong hệ thống quan hệ, đối tƣợng cần đƣợc bảo vệ định nghĩa quan hệ, khung nhìn, bộ, thuộc tính nội liệu Hơn nữa, chế khung nhìn cho phép bảo vệ đối tƣợng làm ẩn tập quan hệ (thuộc tính bộ) ngƣời sử dụng không đƣợc phép truy xuất 167 Tập giảng Cơ sở liệu phân tán Quyền hạn (Right) biểu thị mối liên hệ ngƣời sử dụng đối tƣợng ứng với tập thao tác cụ thể Trong hệ quản trị sở liệu dựa SQL, thao tác câu lệnh bậc cao nhƣ SELECT, INSERT, UPDATE DELETE, quyền đƣợc định nghĩa trao quyền thu hồi quyền câu lệnh: GRANT ON TO REVOKE FROM TO Từ khóa Public để tất ngƣời sử dụng Điều khiển cấp quyền đƣợc đặc trƣng dựa vào ngƣời cấp quyền (Grantor) Ở dạng đơn giản nhất, việc điều khiển đƣợc tập trung vào ngƣời nhóm ngƣời đóng vai trị nhà quản trị liệu có quyền hạn đối tƣợng CSDL có quyền sử dụng câu lệnh cấp quyền GRANT thu hồi quyền cấp REVOKE Phức tạp nhƣng linh hoạt điều khiển không tập trung Ngƣời tạo đối tƣợng chủ đối tƣợng đƣợc trao tất quyền đối tƣợng GRANT trao cho quyền quyền cho ngƣời ngƣời sử dụng đƣợc mơ tả Ngƣời nhận quyền tiếp tục trao quyền cho ngƣời sử dụng khác đối tƣợng Q trình thu hồi quyền phải thực đệ quy, gặp nhiều khó khăn Hệ thống phải trì phân cấp chứa hoạt động trao quyền cho đối tƣợng, chủ đối tƣợng gốc Quyền hạn chủ thể đối tƣợng ngƣời sử dụng nhận đƣợc quyền đối tƣợng đƣợc lƣu trữ dƣới dạng qui tắc cấp quyền Thuận tiện xem quyền nhƣ ma trận cấp quyền (Authorization Matrix), hàng chủ thể, cột đối tƣợng, phần tử ma trận thao tác đƣợc phép đƣợc xác định kiểu thao tác (ví dụ SELECT, UPDATE) Thƣờng kèm với kiểu thao tác có vị từ hạn chế thêm khả truy nhập đến đối tƣợng Tùy chọn đƣợc cung cấp với đối tƣợng quan hệ sở, khơng dành cho khung nhìn Ví dụ, thao tác đƣợc phép cho cặp SELECT * FROM NV WHERE CV=‟Phân tích TKHT‟, cho phép Nam đƣợc phép truy nhập đến nhân viên có chức vụ Phân tích TKHT Bảng sau ví dụ mẫu ma trận cấp quyền, đối tƣợng quan hệ NV HS thuộc tính TENNV NV Nam TENNV UPDATE UPDATE HS UPDATE Trung SELECT SELECT SELECT Vân SELECT SELECT * FROM HS WHERE NV=„Quản lý‟ 168 NONE Tập giảng Cơ sở liệu phân tán Ma trận cấp quyền đƣợc lƣu trữ theo ba cách: theo cột, theo hàng theo phần tử Khi ma trận đƣợc lƣu theo hàng, chủ thể đƣợc liên kết với danh sách đối tƣợng đƣợc phép truy nhập với quyền truy nhập tƣơng ứng Cách tiếp cận cho phép trì cấp quyền cách hiệu quả, tất quyền ngƣời sử dụng truy nhập vào hệ thống đƣợc lƣu trữ hồ sơ cá nhân (Profile) ngƣời sử dụng Tuy nhiên, việc thao tác quyền truy nhập (ví dụ cho phép ngƣời truy nhập đến đối tƣợng) khơng hiệu phải truy nhập đến tất hồ sơ cá nhân Nếu ma trận đƣợc lƣu theo cột, đối tƣợng đƣợc liên kết với danh sách ngƣời sử dụng đƣợc phép truy nhập Ƣu nhƣợc điểm nhƣ lƣu theo hàng Ƣu điểm hai cách tiếp cận đƣợc tổ hợp cách tiếp cận thứ ba, ma trận đƣợc lƣu theo phần tử, nghĩa theo quan hệ (chủ thể, đối tƣợng, quyền) Quan hệ có mục chủ thể đối tƣợng, qua cho phép truy nhập nhanh đến quyền chủ thể đối tƣợng 2) Kiểm soát cấp quyền phân tán Các vấn đề kiểm sốt cấp quyền mơi trƣờng phân tán bao gồm: cấp quyền cho ngƣời sử dụng xa, quản lý quy tắc cấp quyền phân tán việc xử lý khung nhìn nhóm ngƣời sử dụng Cấp quyền cho ngƣời sử dụng xa nhằm ngăn chặn truy nhập từ xa trái phép, nghĩa từ vị trí khơng nằm hệ quản trị CSDL phân tán Ngƣời sử dụng cần phải đƣợc nhận diện xác nhận vị trí đƣợc truy nhập Có hai giải pháp cho vấn đề này: - Thông tin xác nhận ngƣời sử dụng bao gồm tên truy nhập mật đƣợc nhân tất vị trí Các chƣơng trình cục bộ, đƣợc khởi hoạt từ vị trí xa phải rõ tên mật ngƣời sử dụng - Tất vị trí hệ thống phân tán phải nhận diện xác nhận tƣơng tự nhƣ ngƣời sử dụng Các vị trí giao tiếp với tên mật Giải pháp (1) có chi phí cao tính theo cơng việc quản lý thƣ mục việc đƣa thêm ngƣời sử dụng vào thao tán phân tán Tuy nhiên, ngƣời sử dụng truy nhập CSDL phân tán từ vị trí Giải pháp (2) cần thiết thông tin ngƣời sử dụng không đƣợc nhân Tuy vậy, sử dụng cấp quyền từ xa có hiệu Nếu tên mật ngƣời sử dụng không đƣợc nhân bản, nhƣng phải đƣợc lƣu vị trí ngƣời sử dụng truy nhập vào hệ thống Các quy tắc cấp quyền phân tán nhƣ quy tắc cấp quyền hệ tập trung Các định nghĩa khung nhìn phải đƣợc lƣu trữ Có thể nhân hồn tồn vị trí lƣu trữ vị trí đối tƣợng cần truy xuất Ƣu điểm 169 Tập giảng Cơ sở liệu phân tán phƣơng pháp tiếp cận nhân hồn tồn cấp quyền đƣợc xử lý kỹ thuật hiệu chỉnh truy vấn Tuy nhiên việc quản lý thƣ mục tốn Giải pháp lƣu trữ vị trí đối tƣợng cần truy xuất tốt trƣờng hợp tính chất cục tham chiếu cao.Tuy nhiên việc cấp quyền phân tán khơng thể kiểm sốt đƣợc vào thời điểm biên dịch Khung nhìn đƣợc coi mhƣ đối tƣợng qua chế cấp quyền Khung nhìn đƣợc cấu tạo đối tƣợng sở khác Vì trao quyền truy xuất đến khung nhìn đƣợc dịch thành trao quyền truy xuất đến đối tƣợng sở Nếu định nghĩa khung nhìn quy tắc cấp quyền đƣợc nhân hồn tồn, việc phiên dịch đơn giản đƣợc thực chỗ Phức tạp định nghĩa khung nhìn đối tƣợng sở đƣợc lƣu riêng phiên dịch thao tác hoàn toàn phân tán cấp quyền đƣợc trao khung nhìn phụ thuộc vào quyền truy xuất chủ nhân khung nhìn đối tƣợng sở giải pháp ghi nhận thông tin liên kết vị trí đối tƣợng sở Nhóm ngƣời sử dụng nghĩa cấp quyền truy xuất chung cho nhiều ngƣời, với mục đích làm đơn giản hố công việc quản lý sở liệu Trong hệ quản trị sở liệu tập trung, khái niệm ngƣời sử dụng đồng với nhóm ngƣời sử dụng Trong mơi trƣờng phân tán, mhóm ngƣời sử dụng biểu thị cho tất ngƣời sử dụng vị trí cụ thể, đƣợc biểu thị public@site_s, nhóm đặc biệt, đƣợc định nghĩa lệnh sau: DEFINE GROUP AS Vì mơi trƣờng phân tán, chủ thể, đối tƣợng phân tán nhiều vị trí khác quyền truy xuất thông tin đến đối tƣợng có thẩuto cho nhiều nhóm phân tán khác Vì vấn đề quản lý nhóm mơi trƣờng phân tán có số vấn đề cần giải Nếu thơng tin nhóm quy tắc cấp quyền đƣợc nhân hoàn toàn tất vị trí, việc trì quyền truy xuất tƣơng tự nhƣ hệ thống tập trung Tuy nhiên việc trì tốn Việc kiểm sốt phi tập trung, tức trì hoạt động tự trị vị trí khó khăn phức tạp nhiều Nhân hoàn toàn cho thơng tin cấp quyền có ƣu điểm kiểm sốt cấp qun đơn giản thực vào lúc biên dịch Tuy nhiên, chi phí cho việc quản lý phân tán cao, có nhiều vị trí hệ thống 3.7.3 Kiểm sốt tính tồn vẹn ngữ nghĩa Một vấn đề quan trọng khó khăn cho hệ CSDL bảo đảm đƣợc tính quán sở liệu (Databasse Consistency) Một trạng thái CSDL đƣợc gọi quán thỏa tập ràng buộc, đƣợc gọi ràng buộc toàn vẹn ngữ nghĩa (Semantic Integrity Constrsint) Đảm bảo tính qn CSDL, kiểm sốt tồn 170 Tập giảng Cơ sở liệu phân tán vẹn ngữ nghĩa cách loại bỏ hoá giải trình cập nhật làm cho CSDL khơng qn CSDL cập nhật nghĩa thỏa tập ràng buộc tồn vẹn Có hai loại ràng buộc tồn vẹn: ràng buộc cấu trúc ( Structural Constraint) ràng buộc hành vi (Behavioral Constraint) Ràng buộc cấu trúc mô tả đặc tính ngữ nghĩa mơ hình Ví dụ nhƣ ràng buộc khóa mơ hình quan hệ, liên kết -nhiều đối tƣợng mơ hình mạng Ngƣợc lại, ràng buộc hành vi mô tả mối liên kết đối tƣợng, nhƣ khái niệm phụ thuộc hàm mơ hình quan hệ 1) Kiểm sốt tồn vẹn ngữ nghĩa tập trung Một tiểu hệ thống kiểm sốt tồn vẹn ngữ nghĩa có hai thành phần chính: ngơn ngữ cho phép diễn tả thao tác phán đốn tồn vẹn, định chế chịu trách nhiệm thực hành động cụ thể nhằm ép buộc tính tồn ven có cập nhật a) Các loại ràng buộc: Bằng ngôn ngữ cấp cao, ngƣời quản trị sở liệu thiết lập đƣợc ràng buộc toàn vẹn, tạo quan hệ quan hệ có liệu, có chung cú pháp Ngơn ngữ cho phép mô tả, ghi nhận loại bỏ ràng buộc toàn vẹn Trong hệ CSDL quan hệ, ràng buộc toàn vẹn đƣợc định nghĩa nhƣ phán đoán Một phán đoán (Assertion) biểu thức đặc biệt đƣợc mơ tả phép tính quan hệ bộ, biến đƣợc lƣợng từ hóa với (∀) tồn (∃) Vì vậy, phán đốn đƣợc xem nhƣ lƣợng từ hóa câu truy vấn, mang giá trị sai cho tích Đề quan hệ đƣợc xác định biến Có ba loại ràng buộc toàn vẹn: ràng buộc tiền định, ràng buộc tiền dịch ràng buộc tổng quát b) Ép buộc thực thi ràng buộc: Ép buộc thực thi ràng buộc toàn vẹn nghĩa thực việc loại bỏ chƣơng trình cập nhật vi phạm số ràng buộc Một ràng buộc bị vi phạm hành động cập nhật phán đốn ràng buộc bị sai Có hai phƣơng pháp cho phép loại bỏ trình cập nhật phát sinh mâu thuẫn Phƣơng pháp phát mâu thuẫn (không quán): Một thao tác cập nhật u đƣợc thi hành biến đổi CSDL từ trạng thái D sang trạng thái Du Thuật toán ép buộc phải khẳng định ràng buộc liên quan Du cách áp dụng ràng buộc để kiểm tra Nếu trạng thái Du không quán, hệ quản trị CSDL chuyển sang trạng thái Du‟ khác cách hiệu chỉnh lại Du phải khôi phục lại trạng thái D Vì kiểm tra đƣợc áp dụng sau trạng thái CSDL thay đổi nên đƣợc gọi kiểm tra sau (Posttest) Phƣơng pháp 171 Tập giảng Cơ sở liệu phân tán không hiệu hệ thống phản hồi lại nhiều thao tác ràng buộc bị vi phạm Phƣơng pháp ngăn chặn mâu thuẫn: Một thao tác đƣợc thực chuyển CSDL sang trạng thái quán khác Các cần cập nhật có sẵn (trong trƣờng hợp chèn) phải truy nhập CSDL (trƣờng hợp xóa hiệu chỉnh) Thuật toán ép buộc xác nhận tất ràng buộc có liên đới sau cập nhật Nói chung, đƣợc thực cách áp dụng kiểm tra có đƣợc từ ràng buộc cho Nhƣ vậy, kiểm tra đƣợc áp dụng trƣớc trạng thái CSDL bị thay đổi, nên gọi kiểm tra trƣớc (Pretest) Phƣơng pháp ngăn chặn hiệu phƣơng pháp phát khơng phải hồi lại thao tác cập nhật ràng buộc bị vi phạm Thuật tốn hiệu chỉnh truy vấn ví dụ phƣơng pháp ngăn chặn, có hiệu đặc biệt việc ép buộc ràng buộc miền biến thiên Nó đƣa thêm lƣợng từ hóa phán đốn vào lƣợng từ hóa truy vấn tốn tử AND, thể câu truy vấn đƣợc hiệu chỉnh đƣợc ép buộc tồn vẹn 2) Kiểm sốt tồn vẹn ngữ nghĩa phân tán Các thuật tốn đảm bảo tính tồn vẹn ngữ nghĩa CSDL phân tán, đƣợc mở rộng từ phƣơng pháp đơn giản phần kiểm soát toàn vẹn ngữ nghĩa tập trung Giả thiết thuật tốn có tính đến yếu tố tự trị vị trí, nghĩa vị trí xử lý câu truy vấn cục thực việc kiểm soát liệu nhƣ hệ quản trị CSDL tập trung Giả thiết làm đơn giản việc mô tả phƣơng pháp Hai vấn đề thiết kế tiểu hệ thống kiểm sốt tồn vẹn hệ trị CSDL phân tán, vấn đề định nghĩa lƣu trữ phán đoán vấn đề ép buộc thi hành phán đoán Định nghĩa phán đốn tồn vẹn phân tán: Giả sử phán đốn tồn vẹn đƣợc diễn tả phép tính quan hệ Mỗi phán đoán đƣợc coi lƣợng từ hóa truy vấn, nhận giá trị sai với tích Đề quan hệ đƣợc xác định biến Các phán đốn liên quan đến liệu lƣu nhiều vị trí khác Vì chọn vị trí lƣu trữ phán đốn cho giảm thiểu chi phí kiểm tra tồn vẹn Một chiến lƣợc phán đốn tồn vẹn chia ba lớp: Phán đoán riêng: phán đoán đơn biến đơn quan hệ Chỉ đề cập đến đƣợc cập nhật, độc lập với phần lại CSDL Ràng buộc miền giá trị ví dụ “Ngân sách dự án khoảng 500000 đến 1000000” phán đoán riêng Phán đoán hướng tập hợp: Bao gồm ràng buộc đa biến đơn quan hệ nhƣ phụ thuộc hàm (mã số nhân viên xác định tên nhân viên) đa biến đa quan hệ nhƣ ràng buộc khóa ngoại 172 Tập giảng Cơ sở liệu phân tán Phán đốn có hàm gộp: Địi hỏi phải đƣợc xử lý đặc biệt chi phí ƣớc lƣợng hàm gộp Định nghĩa phán đốn tồn vẹn đƣợc bắt đầu vị trí có lƣu quan hệ phán đốn Quan hệ bị phân mảnh, vị từ phân mảnh trƣờng hợp đặc biệt phán đoán thuộc lớp Các mảnh khác quan hệ có nhiều vị trí khác Vì vậy, định nghĩa phán đốn tồn vẹn thao tác phân tán đƣợc thực qua hai bƣớc Bƣớc biến đổi phán đoán cấp cao thành phán đoán biên dịch Bƣớc lƣu trữ phán đoán tùy theo lớp phán đoán Các phán đoán thuộc lớp đƣợc xử lý giống nhƣ phán đoán thuộc lớp 2, tùy thuộc vào đặc tính chúng riêng hay theo tập hợp Phán đoán riêng: Định nghĩa phán đốn đƣợc gửi đến tất vị trí lƣu trữ mảnh quan hệ có mặt phán đốn Phán đốn phải tƣơng thích với liệu quan hệ vị trí Tính tƣơng thích đƣợc kiểm tra hai cấp: cấp vị từ cấp liệu Trƣớc tiên, tƣơng thích vị từ đƣợc xác nhận cách so sánh vị từ phán đoán với vị từ mảnh Một phán đoán C đƣợc coi khơng tƣơng thích với vị từ mảnh p “C đúng” dẫn đến “p sai”, ngƣợc lại đƣợc coi tƣơng thích Nếu khơng tƣơng thích vị trí, định nghĩa phán đốn phải bị loại bỏ mức tồn cục mảnh khơng thỏa mãn ràng buộc tồn vẹn Nếu có tƣơng thích vị từ, phán đốn đƣợc kiểm tra ứng với thể mảnh Nếu thể khơng thỏa mãn phán đốn bị loại bỏ mức tồn cục Nếu tƣơng thích, phán đốn đƣợc lƣu lại vị trí Việc kiểm tra tính tƣơng thích đƣợc thực cho phán đoán biên dịch với kiểu cập nhật “chèn” (các mảnh coi nhƣ “đƣợc chèn vào”) Phán đoán hướng tập hợp: Phán đoán hƣớng tập hợp thuộc loại đa quan hệ, nghĩa có vị từ kết nối Tuy nhiên phán đoán biên dịch đƣợc liên kết với quan hệ Vì định nghĩa phán đốn đƣợc gửi đến tất vị trí chứa mảnh đƣợc biến tham chiếu Việc kiểm tra tính tƣơng thích bao gồm mảnh quan hệ đƣợc sử dụng vị từ nối Tƣơng thích vị từ khơng có tác dụng khơng thể suy vị từ mảnh P sai phán đoán C (dựa vị từ kết nối) Vì vậy, cần phải kiểm tra C theo liệu, đòi hỏi phải nối mảnh quan hệ R với tất mảnh quan hệ S, hai quan hệ có vị từ kết nối Nhƣ chi phí cao nhƣ phép kết nối Cần phải tối ƣu hóa cách xử lý truy vấn phân tán Ba tình theo mức chi phí xảy ra: 173 Tập giảng Cơ sở liệu phân tán - Các mảnh R đƣợc dẫn xuất từ mảnh S dựa vào kết nối nửa thuộc tính đƣợc dùng vị từ kết nối Trong trƣờng hợp kiểm tra tƣơng thích có chi phí thấp S đối sánh đƣợc với R vị trí - S đƣợc phân mảnh thuộc tính kết nối Mỗi R phải đƣợc so sánh với tối đa mảnh S, giá trị thuộc tính nối thuộc R đƣợc dùng để tìm vị trí mảnh tƣơng ứng S - S khơng đƣợc phân mảnh thuộc tính kết nối Mỗi R phải đƣợc so sánh với tất R đƣợc đảm bảo tƣơng thích phán đốn đƣợc lƣu lại vị trí 174 ... KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN 10 7 3 .1 Vấn đề thiết kế sở liệu phân tán 10 8 3 .1. 1 Các bƣớc thiết kế phân tán liệu 10 8 3 .1. 2 Các mục tiêu thiết kế phân tán liệu 10 9 3 .1. 3... kế phân tán liệu 11 1 3 .1. 4 Các yêu cầu thông tin 11 5 3.2 Thiết kế phân mảnh sở liệu 11 6 3.3 Thiết kế phân mảnh ngang 11 7 3.3 .1 Các yêu cầu thông tin phân. .. SUỐT PHÂN TÁN 41 2 .1 Các loại phân mảnh liệu 41 2 .1. 1 Điều kiện đắn để phân mảnh liệu 42 2 .1. 2 Phân mảnh ngang 43 2 .1. 3 Phân mảnh dọc 52 2 .1. 4 Phân

Ngày đăng: 08/06/2021, 14:16

Tài liệu cùng người dùng

Tài liệu liên quan