Báo cáo tìm hiểu về hệ cơ sở dữ liệu phân tán

46 608 4
Báo cáo tìm hiểu về hệ cơ sở dữ liệu phân tán

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI TRUNG TÂM ĐÀO TẠO TÀI NĂNG KHOA KỸ SƢ CHẤT LƢỢNG CAO LỚP HỆ THỐNG THÔNG TIN VÀ TRUYỀN THÔNG BÁO CÁO TÌM HIỂU HỆ CƠ SỞ DỮ LIỆU PHÂN TÁN IT4994 – THỰC TẬP CHUYÊN NGÀNH NĂM HỌC 2011-2012 Phụ trách hướng dẫn : ThS Hồ Sỹ Bàng Sinh viên : Đào Thanh Tùng SHSV : 20082978 Lớp : HTTT-KSCLC-K53 Hà Nội, 6-2012 Báo cáo tìm hiểu hệ sở liệu phân tán Mục lục IT4994 – THỰC TẬP CHUYÊN NGÀNH NĂM HỌC 2011-2012 Mục lục Danh mục hình Lời mở đầu Chương 1: Tổng quan sở liệu phân tán I Giới thiệu sở liệu phân tán Đặt vấn đề Định nghĩa .5 So sánh c sở liệu tập trung sở liệu phân tán Ưu điểm nhược điểm hệ sở liệu p hân tán 10 II 4.1 Ưu điểm 10 4.2 Nhược điểm 11 Hệ quản trị CSDL phân tán ( DDBMS) 11 Định nghĩa .11 Thành phầ n chức 11 Cách thức truy cập .12 3.1 Trực tiếp 12 3.2 Gián tiếp 13 Kiến trúc tổng thể CSDL phân tán 14 Sơ đồ tổng thể ( Global Schema ) 14 Sơ đồ phân đoạn ( Fragment schema) 15 Sơ đồ định vị ( Allocation Schema) 15 Sơ đồ ánh x địa phương (Local mapping schema) 15 Các yếu tố suy từ kiến trúc 16 5.1 Tách rời khái niệm phân đoạn liệu với khái niệm định vị liệu 16 5.2 Biết liệu dư th ừa : 17 5.3 Độc lập với DBMS địa ph ươn g 17 Chương 2: Thiết kế CSDL phân tán 19 I Phương pháp thiết kế CSDL phân tán 19 Sơ đồ thiết kế tổng thể sở liệu phân tá n 19 Các phương pháp thiết kế CSDL phân tá n .20 II 2.1 Phương pháp thiết kế từ xuốn g 20 2.2 Phương pháp thiết kế từ lên 21 Phân mảnh liệu 22 Các lý phân mả nh 22 Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 Báo cáo tìm hiểu hệ sở liệu phân tán Các kiểu phân mảnh .23 2.1 Phân mảnh nga ng: 23 a Định nghĩa 23 b Các yêu cầu thông tin 24 c Phân loại: 26 d Phân mảnh ngang nguyên thủy: 27 e Phân mảnh ngang dẫn xuất 31 2.2 Phân mảnh d ọ c: 33 2.3 Phân mảnh hỗn hợp : 43 Các yêu cầu việc phân mả nh 43 3.1 Tính đầy đủ: 43 3.2 Tính tái thiết : 43 3.3 Tính tách biệt: 43 Kết luận 46 Danh mục hình Chương 1: Tổng quan sở liệu phân tán Hình 1.1 Một hệ sở liệu phân tán Hình 1.2 – Bảng so sánh CSDL tập trung CSDL phân tán 10 Hình 1.3 - Mô hình thành phần hệ quản trị sở liệu phát triển theo kiểu thương mại 12 Hình 1.4 Mô hình truy cập từ xa trực tiếp qua chương trình ứng dụng hệ quản trị sở liệu 13 Hình 1.5 Mô hình truy cập từ xa gián tiếp qua chương trình ứng dụng hệ quản trị sở liệu 13 Hình 1.6 – Kiến trúc chung cho CSDL phân tán 14 Hình 1.7- Các đoạn ảnh vật lý quan hệ tổng thể 16 Chương 2: Thiết kế CSDL phân tán 19 Hình 2.1 – Sơ đồ thiết kế tổng thể CSDL phân tán .19 Hình 2.2 – Sơ đồ thiết kế CSDL phân tán theo mô hình xuống ( Top down) 21 Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 Báo cáo tìm hiểu hệ sở liệu phân tán Lời mở đầu Những năm thập kỷ 70, máy tính có đủ khả xây dựng hệ thống thông tin hệ sở liệu Một mặt hình thành phát triển mô hình lý thuyết cho hệ sở liệu mặt khác nguồn phát triển hệ thống ứng dụng ngày có nhiều kinh nghiệm Hệ thống thông tin hình thành sở kết nối máy tính khác Những năm gần đây, hệ sở liệu phân tán phát triển dựa sở liệu mạng máy tính Cơ sở liệu phân tán gồm nhiều sở liệu tích hợp lại với thông qua mạng máy tính để trao đổi liệu, thông tin Cơ sở liệu tổ chức lưu trữ vị trí khác mạng máy tính chương trình ứng dụng làm việc sở truy cập liệu điểm khác Vấn đề hoàn toàn xây dựng cài đặt sở liệu phân tán Cần giải vấn đề xây dựng cài đặt sở liệu phân tán cụ thể vấn đề thiết kế phân tán, thiết kế sở liệu Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 Báo cáo tìm hiểu hệ sở liệu phân tán Chƣơng 1: Tổng quan sở liệu phân tán I Giới thiệu sở liệu phân tán Đặt vấn đề Vì yêu cầu công ty, doanh nghiệp, đơn vị kinh doanh vấn đề tổ chức cho kinh doanh có hiệu nắm bắt thông tin nhanh sở công ty địa điểm xa xây dựng hệ thống làm việc sở liệu phân tán phù hợp xu hướng hệ thống thoả mãn yêu cầu tổ chức đơn vị Lợi điểm tổ chức kỹ thuật xu hướng phát triển sở liệu phân tán là: giải hạn chế sở liệu tập trung phù hợp xu hướng phát triển tự nhiên với cấu không tập trung tổ chức, công ty doanh nghiệp Định nghĩa Một sở liệu (CSDL) phân tán tập hợp liệu, mà mặt logic tập hợp thuộc hệ thống, mặt vật lý liệu phân tán vị trí khác mạng máy tính Có hai điểm quan trọng nêu định nghĩa:  Phân tán: Dữ liệu không cư trú vị trí mà phân bố rộng khắp nhiều máy tính đặt nhiều vị trí khác nhau, điểm phân biệt sở liệu phân tán với sở liệu tập trung  Tương quan logic: Dữ liệu hệ phân tán có số thuộc tính ràng buộc chúng với Điều giúp phân biệt sở liệu phân tán với tập hợp sở liệu tập trung, file liệu lưu trữ nhiều vị trí khác nhau, điều thường thấy ứng dụng mà hệ thống phân quyền truy nhập liệu môi trường mạng Ví dụ sở liệu phân tán: - Một ngân hàng có ba chi nhánh đặt vị trí khác - Tại chi nhánh có máy tính điều khiển số máy kế toán cuối (teller terminal) sở liệu thống kê chi nhánh - Mỗi máy tính với sở liệu thống kê địa phương chi nhánh đặt vị trí sở liệu phân tán Các máy tính nối với Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 Báo cáo tìm hiểu hệ sở liệu phân tán mạng truyền thông Các nút mạng phân tán mặt xử lý thông tin vị trí mà quản lý, mặt khác tham gia vào việc xử lý yêu cầu thông tin cần truy cập qua nhiều địa điểm Ví dụ việc lên danh sách tất nhân viên ngân hàng Yêu cầu đòi hỏi tất máy tính chi nhánh công ty phải hoạt động để cung cấp thông tin Hình 1.1 Một hệ sở liệu phân tán So sánh sở liệu tập trung sở liệu phân tán Cơ sở liệu tập trung với sở liệu không qua thiết kế hình thành trước có sở liệu phân tán Hai hình thức phát triển sở tự phát hệ thống tập trung Như hai hình thức không đáp ứng yêu cầu tổ chức công việc phạm vi lớn Cơ sở liệu phân tán thiết kế khác sở liệu tập trung Do c ần đối sánh đặc trưng sở liêu phân tán với sở liệu tập trung để thấy lợi ích sở liệu phân tán Đặc trưng mô tả sở liệu tập trung điều khiển tập trung, độc lập liệu, giảm bớt dư thừa, cấu vật lý phức tạp khả truy cập, toàn vẹn, hồi phục, điều khiển tương tranh, biệt lập an toàn liệu Đặc điểm Điều khiển tập trung CSDL tập trung CSDL phân tán Khả điều khiển tập trung toàn nguồn tài nguyên thông tin tổ chức, xem động Ý niệm điều khiển tập trung nhấn mạnh Điều phụ thuộc vào kiến trúc Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 Báo cáo tìm hiểu hệ sở liệu phân tán mạnh cho việc đời CSDL Chúng phát triển tiến hoá hệ thống thông tin, mà ứng dụng có tập tin riêng Độc lập liệu Là nhân tố tác động đến cấu trúc sở liệu để tổ chức liệu chuyển cho chương trình ứng dụng Tiện lợi độc lập liệu chương trình ứng dụng không bị ảnh hưởng thay đổi cấu trúc vật lý liệu Giảm dư thừa liệu Trong sở liệu tập trung, tính dư thừa hạn chế nhiều tốt vì: -Dữ liệu không đồng có vài sở liệu logic; để tránh Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 CSDL phân tán Một cách tổng quát, CSDL phân tán điều khiển với cấu trúc phân lớp dựa vào hệ quản trị CSDL toàn cục (có trách nhiệm toàn CSDL phân tán) hệ quản trị CSDL địa phương (có trách nhiệm với CSDL địa phương riêng) Trong sở liệu phân tán, độc lập liệu có tầm quan trọng sở liệu truyền thống Khái niệm sở liệu suốt mô tả hoạt động chương trình sở liệu phân tán viết làm việc sở liệu tập trung Hay nói cách khác tính đ ắn chương trình không bị ảnh hưởng việc di chuyển liệu từ nơi sang nơi khác mạng máy tính Tuy nhiên tốc độ làm việc bị ảnh hưởng có thời gian di chuyển liệu Nói chung, nguyên nhân đối lập với tính dư thừa đưa môi trường truyền thống cho hệ thống phân tán công việc định giá mức độ tốt tính dư thừa đòi hỏi định giá lại công việc lựa chọn Báo cáo tìm hiểu hệ sở liệu phân tán nhược điểm giải pháp có -Giảm không gian lưu trữ Giảm dư thừa có nghĩa cho phép nhiều ứng dụng truy cập đến sở liệu mà không cần đến nhiều nơi chương trình ứng dụng cần Trong sở liệu truyền thống tính dư thừa liệu cần quan tâm vì: -Tính cục chương trình ứng dụng tăng liệu đặt nơi mà chương trình ứng dụng cần -Khả sẵn sàng hệ thống cao có lỗi nơi hệ thống không cản trở hoạt động chương trình ứng dụng Cấu trúc vật lý khả truy cập Người sử dụng truy cập đến sở liệu tập trung phải thông qua cấu trúc truy cập phức tạp: định vị sở liệu, thiết lập đường truyền mức độ dư thừa liệu Trong CSDL phân tán, việc giảm dư thừa phức tạp hai lý trên, nhiều lý để giảm dư thừa như: Hoạt động trình ứng dụng bị tăng lên liệu lại tất vị trí, nơi trình ứng dụng cần Tính thường trực hệ thống tăng lên, có lổi xẩy trạm không dừng việc thực ứng dụng trạm khác liệu chép lại Trong sở liệu phân tán, cấu trúc truy c ập phức tạp công cụ để truy cập hiệu đến sở liệu Hiệu có nghĩa thời gian tìm kiếm chuyển liệu nhỏ nhất, chi phí truyền thông thấp Mỗi cách thức truy cập sở liệu phân tán viết người lập trình tạo tối ưu Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 Báo cáo tìm hiểu hệ sở liệu phân tán Công việc viết cách thức truy cập sở liệu phân tán giống viết chương trình duyệt sở liệu tập trung Công việc mà chương trình duyệt làm xác định xem truy cập đến sở liệu Tính toàn vẹn, hồi phục điều khiển tương tranh Mặc dù sở liệu, tính toàn vẹn, hồi phục điều khiển đồng thời liên quan nhiều vấn đề liên quan lẫn Mở rộng vấn đề việc cung cấp giao tác Giao tác đơn vị việc thực hiện: giao tác cụ thể bó công việc thực toàn không thực Trong sở liệu phân tán, vấn đề điều khiển giao tác tự trị có ý nghĩa quan trọng: hệ thống điều phối phải chuyển đổi quỹ thời gian cho giao tác liên tiếp Như giao tác tự trị phương tiện đạt toàn vẹn sở liệu Có hai mối nguy hiểm giao tác tự trị lỗi tương tranh Biệt lập bảo mật Trong CSDL tập trung, hệ quản trị CSDL tập trung đảm bảo truy cập đến liệu ủy quyền Trong CSDL phân tán, hệ quản trị liệu địa phương thực chất phải đương đầu với vấn đề giống hệ quản trị CSDL CSDL truyền thống Tuy nhiên, hai khía cạnh đặc biệt sau CSDL phân tán cần phải xem xét: Trong CSDL phân tán với mức độ tự trị cao địa phương, người chủ liệu địa phương cảm giác bảo vệ tốt Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 Báo cáo tìm hiểu hệ sở liệu phân tán họ tự chủ thực bảo vệ thay phụ thuộc vào người quản trị CSDL trung tâm Vấn đề bảo mật chất hệ phân tán nói chung, mạng truyền thông diện rộng cho phép nhiều người cập nhật khai thác liệu nên cần bảo vệ Hình 1.2 – Bảng so sánh CSDL tập trung CSDL phân tán Ưu điểm nhược điểm hệ sở liệu phân tán 4.1 Ưu điểm Có nhiều nguyên nhân để phát triển sở liệu phân tán lại gồm điểm sau đây: Lợi điểm tổ chức tính kinh tế: tổ chức phân tán nhiều chi nhánh dùng sở liệu phân tán phù hợp với tổ chức kiểu Với vai trò động lực thúc đẩy kinh tế thương mại phát triển rộng hơn, việc phát triển trung tâm máy tính phân tán nhiều vị trí trở thành nhu cầu cần thiết Tận dụng sở liệu sẵn có: Hình thành sở liệu phân tán từ sở liệu tập trung có sẵn vị trí địa phương Thuận lợi cho nhu cầu phát triển: Xu hướng dùng sở liệu phân tán cung cấp khả phát triển thuận lợi giảm xung đột chức đơn vị tồn giảm xung đột chương trình ứng dụng truy c ập đến sở liệu Với hướng tập trung hoá, nhu cầu phát triển tương lai gặp khó khăn Giảm chi phí truyền thông: Trong sở liệu phân tán chương trình ứng dụng đặt địa phương giảm bớt chi phí truyền thông thực cách khai thác sở liệu chỗ Tăng số công việc thực hiện: Hệ sở liệu phân tán tăng số lượng công việc thực qua áp dụng nguyên lý xử lý song song với hệ thống xử lý đa nhiệm Tuy nhiên sở liệu phân tán có tiện lợi việc phân tán liệu tạo chương trình ứng dụng phụ thuộc vào tiêu chuẩn mở rộng vị trí làm cho Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 10 Báo cáo tìm hiểu hệ sở liệu phân tán Phân mảnh ngang dẫn xuất định nghĩa dựa phân mảnh ngang quan hệ thành viên đường nối dựa theo phép toán chọn quan hệ chủ nhân đường nối đó, hay ta gọi phân mảnh quan hệ thành viên dựa sở phân mảnh quan hệ chủ nhân Cho trước đường nối L, ta có: Owner (L) = S Member (L) = R Định nghĩa mảnh ngang dẫn xuất R sau: Ri = R θ Si với i=1 s s số lượng mảnh ngang R, Si = δ Fi(S) mảnh ngang nguyên thủy xây dựng từ vị từ hội sơ cấp Fi, θ phép liên kết khóa kết nối chủ nhân thành viên Ví dụ 2.9: Xét sơ đồ quan hệ PAY với EMP có đường kết nối L1, ta định nghĩa phép liên kết θ: PAY.Title = EMP.Title Trên quan hệ PAY ta có M PAY = { m1: Sal ≤ 3500; m2: Sal >3500} từ PAY chia thành mảnh hội sơ cấp PAY1 PAY2 PAY1 = δ Sal ≤ 3500 (PAY) PAY2 = δ Sal > 3500 (PAY) Ta có mảnh ngang dẫn xuất: EMP1 = EMP θ PAY1 EMP2 = EMP θ PAY2 EMP1 EMP2 ENo EName Title ENo EName Title E3 Bill KS Cơ khí E1 John KS Điện E4 Bush KS Lập trình E2 Mary KS Hệ thống E7 Algor KS Cơ khí E5 Blair KS Hệ thống E6 Tom KS Điện E8 David KS.Điện Sơ đồ liên kết sở liệu sau phân mảnh: Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 32 Báo cáo tìm hiểu hệ sở liệu phân tán Ta có số nhận xét quan trọng sau đây:  Thuật toán phân mảnh dẫn xuất cần có tập phân hoạch quan hệ chủ nhân - thành viên, tập vị từ liên kết quan hệ chủ nhân thành viên  Nếu quan hệ thành viên nhiều chủ nhân vấn đề trở nên phức tạp  Phân mảnh dẫn xuất gây nên phân mảnh lan truyền 2.2 Phân mảnh dọc: Phân mảnh dọc quan hệ tổng thể n-bộ R tách R thành quan hệ R1 , R2, , R k cho quan hệ R khôi phục lại từ quan hệ phép nối: Ví dụ: Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 33 Báo cáo tìm hiểu hệ sở liệu phân tán Ý nghĩa phân mảnh dọc tạo quan hệ nhỏ để cho giảm tối đa thời gian thực ứng dụng chạy mảnh Việc phân mảnh dọc hoạt động chia quan hệ R thành mảnh R1, R2, , Rn cho mảnh chứa tập thuộc tính chứa khóa R Với cách đặt vấn đề việc phân mảnh dọc không toán hệ sở liệu phân tán mà toán hệ sở liệu tập trung Phân mảnh dọc toán phức tạp, người ta chứng minh quan hệ có m thuộc tính thuộc tính khóa số lượng mảnh dọc phân số Bell thứ m (kí hiệu B(m)), số tăng nhanh với số m lớn đạt đến mm Chẳng hạn m=10 B(m)≈115.000, với m=15 B(m)≈10 9, với m=30 B(m)≈10 23 Vì toán phân mảnh dọc phải sử dụng đến thuật giải heuristic Có hai phương pháp nghiên cứu phương pháp nhóm phương pháp tách, hai phương pháp phương pháp tách tỏ có tối ưu Phương pháp nhóm: Khởi đầu tập mảnh, mảnh có thuộc tính, bước ghép số mảnh lại thỏa mãn tiêu chuẩn Phương pháp tách: Tại bước tìm phân hoạch có lợi cho việc truy xuất ứng dụng thuộc tính Thông tin dùng để phân mảnh dọc có liên quan đến ứng dụng, mảnh dọc thường chứa thuộc tính thường xuyên truy xuất chung ứng dụng, người ta tìm cách lượng hóa khái niệm số đo gọi “ái lực” (affinity – lực lôi cuốn) Số đo tính ta tính tần số truy xuất tới thuộc tính ứng dụng Trên sở khái niệm “ái lực” tính độ sử dụng thuộc tính câu vấn tin ứng dụng người ta xây dựng giải thuật tách hữu hiệu Gọi Q = {q1, q2, , qt } tập câu vấn tin mà ứng dụng truy xuất quan hệ R(A1, A2, , An) Với câu vấn tin qi thuộc tính Aj đưa giá trị sử dụng thuộc tính, kí hiệu use (qi , Aj) định nghĩa sau: Aj vấn tin qi sử dụng Use (qi, Aj) = trường hợp ngược lại Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 34 Báo cáo tìm hiểu hệ sở liệu phân tán giá trị use (qi , *) dễ xác định biết ứng dụng chạy CSDL Ví dụ 2.10: Xét quan hệ PROJ, giả sử ứng dụng sử dụng câu vấn tin SQL truy xuất đến nó: q1: Tìm ngân sách dự án theo mã số SELECT Budget FROM PROJ WHERE PNo = V q2: Tìm tên ngân sách tất dự án SELECT FROM PName, Budget PROJ q3: Tìm tên dự án theo vị trí SELECT FROM WHERE PName PROJ Loc = V q4: Tìm tổng ngân sách dự án vị trí SELECT Sum (Budget) FROM PROJ WHERE Loc = V Để thuận tiện ta kí hiệu A1 = PNo, A2 = PName; A3 = Budget; A4 = Loc Chúng ta có ma trận sau Ta nhận xét giá trị sử dụng không chứa thông tin độ lớn tần số ứng dụng, số đo nằm định nghĩa số đo lực thuộc tính aff (Ai, Aj) Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 35 Báo cáo tìm hiểu hệ sở liệu phân tán ref(qk) số truy xuất đến thuộc tính (Ai , Aj) cho ứng dụng qk vị trí Sl acc(qk) kí hiệu số đo tần số truy xuất ứng dụng Kết tính toán ma trận vuông nxn ta gọi ma trận lực thuộc tính AA Ví dụ 2.11: Tiếp tục với ví dụ đơn giản giả sử ref(qk) = cho tất qk Sl Số đo tần số truy xuất ứng dụng giả thiết sau: acc1(q1) = 15 acc1(q2) = acc1(q3) = 25 acc1(q4) = acc2 (q1) = 20 acc2 (q2) = acc2 (q3) = 25 acc2 (q4) = acc3(q1) = 10 acc3(q2) = acc3(q3) = 25 acc3(q4) = Như tính số đo lực thuộc tính A1 A3 ứng dụng truy xuất đến hai thuộc tính q1 nên ta có: Ma trận lực thuộc tính đầy đủ sau Thuật toán tụ nhóm Mục tiêu thuật toán tìm phương pháp để nhóm thuộc tính quan hệ lại dựa giá trị lực thuộc tính AA Ý tưởng thuật toán từ ma trận lực thuộc tính AA sinh ma trận lực tụ CA dựa hoán vị hàng cột, hoán vị thực cho số đo lực chung AM lớn Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 36 Báo cáo tìm hiểu hệ sở liệu phân tán aff(A0 ,Aj) = aff(Ai ,A0 ) = aff(An+1 ,Aj) = aff(Ai,An+1 ) = điều kiện biên thuộc tính đặt vào CA vào bên trái thuộc tính cận trái bên phải thuộc tính cận phải hóan vị cột, tương tự cận hoán vị hàng Vì ma trân lực AA có tính đối xứng nên công thức thu gọn: Chúng ta định nghĩa cầu nối (bond) hai thuộc tính Ax Ay là: dựa vào định nghĩa viết lại AM sau: Bây xét dãy thuộc tính sau: số đo lực chung cho thuộc tính là: Khi đặt thuộc tính Ak thuộc tính Ai Aj số đo lực chung là: Đóng góp thực cho số đo lực chung đặt Ak Ai Aj là: Ví dụ 2.12: Với ma trận AA tính trên, tính đóng góp thực chuyển thuộc tính A4 vào thuộc tính A1 A2 : Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 37 Báo cáo tìm hiểu hệ sở liệu phân tán Ta có: bond(A1,A4) = 45*0 + 0*75 + 45*3 + 0*78 = 135 bond(A4,A2) = 11865 bond(A1,A2) = 225 vậy: cont(A1,A4 ,A2) = 2*135 + 2*11865 – 2*225 = 23550 Thuật toán lượng nối BEA (Bond Energy Algorithm) Thuật toán lượng nối thực qua ba bước B1 Khởi gán Đặt cố định cột AA vào CA Cột chọn thuật toán B2 Thực lặp Lấy n-i cột lại (i số cột đặt vào CA) thử đặt chúng vào i+1 vị trí lại ma trận CA Nơi đặt chọn cho đóng góp nhiều cho số lực chung mô tả Việc lặp kết thúc không cột để đặt B3 Sắp thứ tự hàng Một thứ tự cột xác định, hàng cần đặt lại để vị trí tương đối chúng phù hợp với vị trí tương đối cột Thuật toán BEA Đầu vào: AA ma trận lực thuộc tính Đầu ra: CA ma trận lực tụ Begin /* Khởi gán */ CA(*,1) := AA(*,1) ; CA(*,2) := AA(*,2) ; index := ; While index best Then best:=z End; Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 41 Báo cáo tìm hiểu hệ sở liệu phân tán Ví dụ 6.14: Tiếp tục với tính toán với liệu có acc1(q1) = 15 acc2 (q1) = 20 acc3(q1) = 10 acc1(q2) = acc2 (q2) = acc3(q2) = acc1(q3) = 25 acc2 (q3) = 25 acc3(q3) = 25 acc1(q4) = acc2 (q4) = acc3(q4) = Ở vị trí : TA = {A1}, TQ = {}, BQ = {q2, q3, q4}, OQ = {q1} CTQ1 = CBQ1 = acc 1(q2) + acc2 (q2) + acc (q2) + acc (q3) + acc 2(q3 ) + acc3(q3 ) + acc (q4) + acc 2(q4) + acc 3(q4) = 83 COQ1 = 45 z = - 2025 Ở vị trí : TA = {A1, A3}, TQ = {q1}, BQ = {q3}, OQ = {q2, q4} CTQ2 = 45 CBQ2 = 75 COQ2 = z = 3311 Ở vị trí : TA = {A1, A3, A2 }, TQ = {q1, q2 }, BQ = {}, OQ = {q3, q4} CTQ3 = 50 CBQ3 = COQ3 = 78 z = - 6084 Ta chọn vị trí làm điểm phân chia vị trí giá trị chi phí cao Như có PROJ3 = {A1, A2, A4 }{và PROJ4 = A1, A3 } Tức PROJ3 = {PNo, Budget} PROJ4 = {PNo, PName, Loc} Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 42 Báo cáo tìm hiểu hệ sở liệu phân tán 2.3 Phân mảnh hỗn hợp: Là kết hợp phân mảnh ngang phân mảnh dọc Các yêu cầu việc phân mảnh Việc phân mảnh quan hệ tổng thể phải tuân theo số quy tắc định để tái thiết lại quan hệ cũ bảo đảm ngữ nghĩa Một phương pháp thiết kế phân mảnh đắn phải thỏa mãn ba tính chất sau: - Tính đầy đủ (completeness) - Tính tái thiết (reco nstructio n) - Tính tách biệt (disjointness) 3.1 Tính đầy đủ: Nếu quan hệ R phân rã thành mảnh R1, R2, , R k mục liệu có R phải có mảnh Ri 3.2 Tính tái thiết được: Nếu quan hệ R phân rã thành mảnh R1, R2, , R k phải tồn toán tử θ cho R = θ(R i ), ∀ i - Toán tử θ thay đổi tùy theo loại phân mảnh - Trong thực tế mảnh phân mảnh ngang θ phép hợp, phân mảnh dọc θ phép nối phân mảnh hỗn hợp θ phép nửa nối 3.3 Tính tách biệt: Nếu quan hệ R phân mảnh ngang thành quan hệ R1, R2 , , R k mục liệu ti nằm mảnh Ri không nằm mảnh R k, k≠i - Tiêu chuẩn bảo đảm mảnh ngang phải tách rời - Nếu quan hệ phân mảnh dọc thuộc tính chung phải lặp lại mảnh Do đó, trường hợp phân mảnh dọc tính tách biệt định nghĩa trường thuộc tính chung quan hệ Ví dụ: Xét sở liệu công ty máy tính tổ chức sau: • NHANVIEN (MANV, TENNV, CHUCVU): quan hệ chứa liệu nhân viên công ty • TLUONG (CHUCVU, LUONG): quan hệ chứa liệu liên quan Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 43 Báo cáo tìm hiểu hệ sở liệu phân tán lương chức vụ nhân viên • DUAN (MADA, TENDA, NGANSACH): quan hệ chứa liệu dự án mà công ty phát triển • HOSO (MANV, MADA, NHIEMVU, THOIGIAN): quan hệ chứa liệu hồ sơ nhân viên phân công thực dự án) Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 44 Báo cáo tìm hiểu hệ sở liệu phân tán Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 45 Báo cáo tìm hiểu hệ sở liệu phân tán Kết luận Như thông qua báo cáo ta tìm hiểu nét sở liệu phân tán • Hệ sở liệu phân tán: Hệ sở liệu phân tán mô tả tập hợp nhiều sở liệu có liên quan logic đến phân bố mạng máy tính • Hệ Quản trị sở liệu phân tán: Hệ thống phần mềm cho phép quản lý hệ sở liệu phân tán làm cho phân tán trở nên “trong suốt” người sử dụng • Kiến trúc Hệ Quản trị sở liệu phân tán: Mô hình phổ biến có nhiều ưu điểm mô hình client/server • Thiết kế phân tán gồm ba toán chủ yếu: Phân mảnh ngang để chia quan hệ theo bộ, phân mảnh dọc để chia quan hệ theo thuộc tính phân tán tài nguyên để cấp phát tập tin liệu Em xin chân thành cảm ơn giúp đỡ giảng viên ThS Hồ Sỹ Bàng Nhờ có giúp đỡ thầy mà em hoàn thành báo cáo Do thời gian kiến thức có hạn nên báo cáo tránh thiếu sót Em mong thầy có nhận xét để em hoàn thiện Em xin chân thành cảm ơn thầy! Hà Nội ngày 21 tháng năm 2012 Sinh viên Đào Thanh Tùng Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 46 [...]... của cơ sở dữ liệu phân tán Tất nhiên kiến trúc này không biểu diễn tường minh cho mọi hệ cơ sở dữ liệu phân tán Các mức của cơ sở dữ liệu phân tán được trình bày mang tính khái niệm thích hợp để dễ hiểu về tổ chức của các cơ sở dữ liệu phân tán nói chung Hình 1.6 – Kiến trúc chung cho CSDL phân tán 1 Sơ đồ tổng thể ( Global Schema)  Xác định tất cả các dữ liệu sẽ được lưu trữ trong cơ sở dữ liệu phân. .. Tùng – Lớp HTTT – KSCLC – K53 13 Báo cáo tìm hiểu hệ cơ sở dữ liệu phân tán yêu cầu Hệ quản trị cơ sở dữ liệu phân tán cung c ấp cả hai kiểu truy cập bởi vì mỗi cách truy cập đều có ưu điểm của nó 4 Kiến trúc tổng thể của CSDL phân tán Trong hệ cơ sở dữ liệu phân tán, những người thiết kế hệ thống đã xây dựng nên một hệ các phần mềm phục vụ yêu cầu người dùng trên cơ sở dữ liệu đã có sẵn Hình dưới đây... điều khiển giữa các hệ quản trị cơ sở dữ liệu tập trung cài đặt ở những điểm khác nhau trên mạng máy tính Những phần mềm cần thiết cho việc xây dựng cơ sở dữ liệu phân tán là:  Phần quản lý cơ sở dữ liệu ( Database Management - DB )  Phần truyền thông dữ liệu (Data Communication - DC ) Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 11 Báo cáo tìm hiểu hệ cơ sở dữ liệu phân tán  Từ điển dữ liệu được mở rộng... tin về phân tán dữ liệu trong mạng máy tính (Data Dictionary - DD)  Phần cơ sở dữ liệu phân tán (Distributed Database DDB) Hình 1.3 - Mô hình các thành phần của hệ quản trị cơ sở dữ liệu phát triển theo kiểu thƣơng mại Những dịch vụ hệ quản trị cơ sở dữ liệu cung cấp: - Cách thức truy cập dữ liệu từ xa: bằng chương trình ứng dụng - Lựa chọn một cấp độ trong suốt phân tán thích hợp: cho phép mở rộng hệ. .. trúc này là:  Tách rời khái niệm phân đoạn dữ liệu với khái niệm định vị dữ liệu  Biết được dữ liệu dư thừa  Độc lập với các DBMS địa phương Ba yếu tố này tương ứng với ba mức trong suốt tương ứng 5.1 Tách rời khái niệm phân đoạn dữ liệu với khái niệm định vị dữ liệu Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 16 Báo cáo tìm hiểu hệ cơ sở dữ liệu phân tán  Phân đoạn dữ liệu, bao gồm những công việc mà... Một công ty có các văn phòng ở Paris, London, NewYork, Toronto Công ty này có các cơ sở dữ liệu sau đây: Cơ sở dữ liệu về nhân viên: EMP (ENo, EName, Title) Cơ sở dữ liệu về các dự án: Cơ sở dữ liệu về lương: Cơ sở dữ liệu về phân công: PROJ (PNo, PName, Budget, Loc) PAY (Title, Sal) ASG (ENo, PNo, Dur, Resp) Giải thích về các thuộc tính: Sal: Lương; Title: Chức vụ; Budget: Ngân sách của dự án; Loc:... cấp độ trong suốt phân tán và phân chia công việc thực hiện để công việc quản trị hệ thống đơn giản hơn) - Quản trị và điều khiển cơ sở dữ liệu bao gồm công cụ quản lý cơ sở dữ liệu, tập hợp thông tin về các thao tác trên cơ sở dữ liệu và cung cấp thông tin tổng thể về file dữ liệu đặt ở các nơi trong hệ thống - Điều khiển tương tranh và điều khiển hồi phục dữ liệu của giao tác phân tán 3 Cách thức truy... CSDL phân tán Tuy nhiên, một cách tổng quát chúng ta có thể thiết kế CSDL phân tán theo các bước sau: Hình 2.1 – Sơ đồ thiết kế tổng thể CSDL phân tán  Thiết kế lược đồ quan hệ tổng thể: Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 19 Báo cáo tìm hiểu hệ cơ sở dữ liệu phân tán - Thiết kế các quan hệ tổng thể - Mô tả toàn bộ dữ liệu sẽ được dùng trong hệ thống  Thiết kế phân đoạn: thực hiện chia nhỏ dữ liệu. .. cập cơ sở dữ liệu từ xa qua chương trình ứng dụng theo hai cách cơ bản: Truy cập từ xa trực tiếp và gián tiếp 3.1 Trực tiếp Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 12 Báo cáo tìm hiểu hệ cơ sở dữ liệu phân tán Hình 1.4 Mô hình truy cập từ xa trực tiếp qua chƣơng trình ứng dụng của hệ quản trị cơ sở dữ liệu Theo mô hình trực tiếp trên, chương trình ứng dụng đưa ra yêu cầu truy cập đến cơ sở dữ liệu. .. đổi thông báo trong mọi địa điểm • Khó kiểm soát tính toàn vẹn dữ liệu với nhiều bản sao dữ liệu được phân bố khắp mọi nơi • Đáp ứng chậm nhu cầu của các trạm trong trường hợp các phần mềm ứng dụng không được phân bố phù hợp với việc sử dụng chung II Hệ quản trị CSDL phân tán ( DDBMS) 1 Định nghĩa Hệ quản trị cơ sở dữ liệu phân tán cung cấp công cụ như tạo lập và quản lý cơ sở dữ liệu phân tán Phân tích ... hiểu hệ sở liệu phân tán Kết luận Như thông qua báo cáo ta tìm hiểu nét sở liệu phân tán • Hệ sở liệu phân tán: Hệ sở liệu phân tán mô tả tập hợp nhiều sở liệu có liên quan logic đến phân bố mạng... Một hệ sở liệu phân tán So sánh sở liệu tập trung sở liệu phân tán Cơ sở liệu tập trung với sở liệu không qua thiết kế hình thành trước có sở liệu phân tán Hai hình thức phát triển sở tự phát hệ. .. đặt sở liệu phân tán Cần giải vấn đề xây dựng cài đặt sở liệu phân tán cụ thể vấn đề thiết kế phân tán, thiết kế sở liệu Đào Thanh Tùng – Lớp HTTT – KSCLC – K53 Báo cáo tìm hiểu hệ sở liệu phân

Ngày đăng: 15/01/2016, 22:39

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan