1. Trang chủ
  2. » Luận Văn - Báo Cáo

Các kỹ thuật phân tán dữ liệu trong cơ sở dữ liệu phân tán

88 5 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 88
Dung lượng 769,84 KB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI    LUẬN VĂN THẠC SĨ KHOA HỌC NGÀNH : CÔNG NGHỆ THÔNG TIN CÁC KỸ THUẬT PHÂN TÁN DỮ LIỆU TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN KOEU SOKMEAK GV HƯỚNG DẪN KHOA HỌC: GS.TS NGUYỄN THÚC HẢI HÀ NỘI-2008 KOEU SOKMEAK CÔNG NGHỆ THÔNG TIN 2006-2008 Hà nội 2008 LỜI NÓI ĐẦU Lịch sử hệ phân tán bắt nguồn từ phát triển máy tính đa người dùng Sự đời hệ thống mạng LAN tốc độ cao vào kỷ 70s tác động đến phát triển hệ phân tán Các trạm làm việc hệ thống máy chủ định đời hệ phân tán Xu hướng thúc đẩy nhờ việc phát triển phần mềm hệ điều hành ứng dụng phân tán Hệ sở liệu phân tán có phạm vi rộng, từ cung cấp tiện ích tính tốn dùng cho mục đích chung nhiều nhóm người sử dụng đến hệ thống truyền thông đa phương tiện Hệ sở liệu phân tán xây dựng dựa công nghệ bản: (1) sở liệu, (2) mạng máy tính Hệ sở liệu phân tán mô tả tập hợp nhiều sở liệu có liên quan logic đến phân bố mạng máy tính Cơ sở liệu phân tán giảm chi phí truyền thơng, thời gian đáp ứng nhanh, đảm bảo tính độc lập liệu , tránh dư thừa liệu chia sẻ tài nguyên Trong Khuôn khổ luận văn này, em đề cập đến sở lý thuyết phương pháp, thuật tốn sử dụng q trình phân tán liệu Luận văn hoàn thành nhờ vào hướng dẫn tận tình GS.TS Nguyễn Thúc Hải, Khoa CNTT, Trường ĐHBKHN Em xin trân trọng cảm ơn Thầy GS.TS Nguyễn Thúc Hải hướng dẫn bảo ln tạo điều kiện thuận lợi cho em hồn hành luận văn Một lần em xin cảm ơn thầy cô Khoa CNTT, TTSĐH, Trường ĐHBKHN giảng dạy suốt thời gian qua, đặc biệt xin cảm ơn Chính phủ Cộng hịa Xã hội Chủ nghĩa Việt Nam tạo điều kiện hội tốt cho em hồnh thành học tập Hà Nội :Tháng 11 Năm 2008 Học viên: Koeu Sokmeak MỤC LỤC Trang LỜI NÓI ĐẦU TÓM TẮT LUẬN VĂN MỤC LỤC BẢNG VÀ HÌNH VẼ BẢNG CÁC TỪ VIẾT TẮT& TỪ KHÓA PHẦN 1: GIỚI THIỆU CSDL PHÂN TÁN VÀ SỰ PHÂN TÁN DỮ LIỆU CHƯƠNG 1: TỔNG QUAN VỀ HỆ CSDL PHÂN TÁN ĐỊNH NGHĨA: CÁC ĐẶC ĐIỂM CSDL PHÂN TÁN SO VỚI CSDL TẬP TRUNG: PHÂN LOẠI CSDL PHÂN TÁN: 13 XU THẾ PHÁT TRIỂN CSDL PHÂN TÁN: 18 CHƯƠNG : CÁC KHÁI NIỆM PHÂN TÁN DỮ LIỆU 20 LÝ DO PHÂN ĐOẠN : 20 CÁC KIỂU PHÂN ĐOẠN: 21 MỨC ĐỘ PHÂN ĐOẠN: 22 CÁC QUY TẮC PHÂN ĐOẠN ĐÚNG ĐẮN: 22 CÁC KIỂU CẤP PHÁT: 23 PHẦN II: CÁC KỸ THUẬT PHÂN TÁN DỮ LIỆU 25 CHƯƠNG 3: KỸ THUẬT PHÂN ĐOẠN: 26 3.1 PHÂN ĐOẠN NGANG: 26 3.1.1 YẾU CẦU THÔNG TIN VỀ PHÂN ĐOẠN NGANG : 26 3.1.1.1: THÔNG TIN VỀ CƠ SỞ DỮ LIỆU : 26 3.1.1.2 THÔNG TIN ỨNG DỤNG: 29 3.1.2 PHÂN LOẠI PHÂN ĐOẠN NGANG: 32 3.1.2.1 PHÂN ĐOẠN NGANG NGUYÊN THỦY: 32 3.1.2.1.1 THUẬT TOÁN COM-MIN: 36 3.1.2.1.2 THUẬT TOÁN PHORIZONTAL: 38 3.1.2.2 PHÂN ĐOẠN NGANG DẪN XUẤT: 42 3.1.3 KIỂM ĐỊNH TÍNH ĐÚNG ĐẮN CỦA PHÂN ĐOẠN NGANG 48 3.2 PHƯƠNG PHÁP PHÂN ĐOẠN DỌC AVP[13] 50 3.2.1 CÁC LÝ DO CHỌN AVP 50 3.2.2 CÁC YÊU CẦU VỀ THÔNG TIN 52 3.2.3 MƠ HÌNH CHI PHÍ 53 3.2.4 THUẬT TOÁN PHÂN ĐOẠN DỌC AVP 54 3.2.4.1 GIAI ĐOẠN XÂY DỰNG CÂY PT 55 3.2.4.2 GIAI ĐOẠN TRÍCH KẾT QUẢ CÁC ĐOẠN DỮ LIỆU: 61 3.2.5 TÓM TẮT 65 CHƯƠNG 4: KỸ THUẬT PHÂN BỐ DỮ LIỆU 66 4.1 MỞ ĐẦU : 66 4.2 MƠ HÌNH VÀ MỘT SỐ VẤN ĐỀ CƠ BẢN LIÊN QUAN ĐẾN PHÂN BỐ DỮ LIỆU 67 4.2.1 ĐẶT RA BÀI TOÁN 67 4.2.2 YÊU CẦU THÔNG TIN 69 4.2.2.1 THÔNG TIN VỀ CSDL 69 4.2.2.2 THÔNG TIN VỀ ỨNG DỤNG 69 4.2.2.3 THÔNG TIN VỀ CÁC TRẠM: 70 4.2.2.4 THÔNG TIN VỀ MẠNG: 70 4.2.3 MƠ HÌNH PHÂN BỐ DỮ LIỆU 70 4.3 PHƯƠNG PHÁP HEURISTIC ĐỐI VỚI PHÂN BỐ DỮ LIỆU ĐỘNG[11] 73 4.3.1 THUẬT TOÁN PHÂN BỐ TỐI ƯU(BRUNSTORM) 73 4.3.1.1 ƯU ĐIỂM CỦA THUẬT TOÁN: 76 4.3.1.2 NHƯỢC ĐIỂM CỦA THUẬT TOÁN: 76 4.3.2 THUẬT TỐN NGƯỠNG(TRESHOLD) 77 4.4 TĨM TẮT: 83 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 84 KẾT LUẬN : 84 HƯỚNG PHÁT TRIỂN : 84 CÁC TÀI LIỆU THAM KHẢO 85 BẢNG VÀ HÌNH VẼ Trang Hình Mơ hình hệ CSDL phân tán đơn giản Hình 2: Kiến trúc hệ CSDL phân tán 10 Hình 3: Phân đoạn quan hệ tổng thể R 11 Hình 4: Phân loại hệ CSDL phân tán theo kiến trúc 12 Hình : So sánh lựa chọn nhân 19 Hình 6: CSDL mẫu 23 Hình : Biểu diễn mối liên hệ quan hệ nhờ đường nối 23 Hình 8: Mơ tả BVP 46 Hình : Cây phân đoạn PT 51 Bảng : Tần xuất để truy xuất đoạn truy vấn 52 Hình 10: Xây dựng PT 53 Bảng 2: Các lợi nhuận bước PT hình 54 Hình 11: Lược đồ Venn 54 Hình 12: Đoạn i thuật tốn tối ưu 69 Bảng 3: Liệt kê xác suất truy cập lần 72 Hình 13: Biểu diễn đoạn i với đếm 72 Hình 14 : Os hàm xs hệ thống có trạm 75 Hình 15 : Đồ thị đường cong thay đổi ngưỡng 76 BẢNG CÁC TỪ VIẾT TẮT& TỪ KHÓA Simple Predicate Minterm Predicate Miniterm selectivity Sel Access Frequency Relation Minterm Fragement Completeness Minimality Nonrelevant Attribute Usage Value aff(A,B) Physical Site Virtual Site Assign Assign set Query Processing Cost QPC Site Tranmission Cost STC Data Allocation Problem DAP File Allocation Problem FAP Processing Cost PC Tranmission Cost TC Access Cost AC Integrity Enforcement Cost IE Concurrency Control Cost CC Attribute Affinity Matrix Partition Vị từ đơn giản Vị từ hội sơ cấp Số lượng truy xuất câu truy vấn Độ tuyển hội sơ cấp Tần số truy xuất Quan hệ Đoạn hội sơ cấp Tính đầy đủ vị từ đơn giản Tính tiểu cực vị từ đơn giản Liên đới Giá trị sử dụng thuộc tính Số đo lực Trạm vật lý Trạm ảo Chỉ định Tập định Chi phí để xử lý câu hỏi Chi phí để lưu trữ đoạn trạm Vấn đề định vị CSDL Vấn đề định vị tệp Chi phí xử lý Chi phí truyền liệu Chi phí truy nhập Chi phí đảm bảo tính tồn vẹn Chi phí điều khiển tương tranh Ma trận lực thuộc tính Phân hoạch Partition Algorithm Fragement Bond Energy Algorithm BEA Derived Horizontal Fragmentation Primary Horizontal Fragmentation Couter Ma trix Adaptive Vertical Partitioning AVP Partition Tree Binary Vertical Partitioning BVP Thuật toán phân hoạch Phân đoạn phân mảnh Thuật toán lượng nối Phân đoạn ngang dẫn xuất Phân đoạn ngang nguyên thủy Ma trận đếm Phân đoạn dọc thích nghi Cây phân đoạn Phân đoạn dọc nhị phân Học viên: Koeu Sokmeak -1- Kỹ thuật Phân tán liệu PHẦN 1: GIỚI THIỆU CSDL PHÂN TÁN VÀ SỰ PHÂN TÁN DỮ LIỆU CHƯƠNG 1: TỔNG QUAN VỀ HỆ CSDL PHÂN TÁN ĐỊNH NGHĨA: Cơ sở liệu phân tán (CSDL phân tán) định nghĩa sau: CSDL phân tán tập CSDL có quan hệ với mặt logic phân bố mạng máy tính Hệ quản trị CSDL phân tán hệ thống phần mềm cho phép quản trị CSDL phân tán làm cho phân tán trơng suốt người sử dụng [1] Định nghĩa nhấn mạnh hai khía cạnh quan trọng CSDL phân tán: 1- Tính phân tán, thực tế liệu khơng cư trú trạm, phân biệt CSDL phân tán với CSDL tập trung 2- Sự tương quan lơgic, liệu có số tính chất ràng buộc lẫn phân biệt CSDL phân tán với tập CSDL địa phương với tệp cư trú trạm khác mạng CÁC ĐẶC ĐIỂM CSDL PHÂN TÁN SO VỚI CSDL TẬP TRUNG: Để dễ xem xét đặc điểm hệ CSDL phân tán ta xét chúng thông qua đặc điểm hệ CSDL tập trung: • Điều khiển tập trung: Viện Sau Đại Học, Khoa CNTT, Trường Đại Học Bách Khoa Hà nội GV Hướng Dẫn Khoa Học: GS.TS Nguyễn Thúc Hải Học viên: Koeu Sokmeak Kỹ thuật Phân tán liệu - 65 - Trong ứng dụng cập nhật chi phí truyền liệu là: TCU i = ∑∑ u ∀S k ∈ S ∀F j ∈ F ij * x jk * g o (i ),k + ∑∑ u ∀S k ∈ S ∀F j ∈ F ij * x jk * g k o ( i ) Thành phần thứ gửi thông báo cập nhật từ trạm gốc O(i) truy vấn qi tới tất đoạn cần phải cập nhật Thành phần thứ gửi thông tin xác nhận việc cập nhật Chi phí đọc liệu tính sau: TCRi = ∑ min(uij * x jk * g o(i ),k ) + rij * x jk * ∀F j ∈ F , sk ∈S seli ( F j ) * length( F j ) fsize * g k ,o ( i ) Thành phần thứ tính chi phí việc truyền thơng tin đọc liệu tới trạm mà có đoạn cần truy nhập, thành phần thứ hai tính tốn chi phí việc truyền kết từ trạm khác tới trạm gốc (trạm cần lấy liệu) Sau lấy cảu tổng chi phí Ta có : TCj = TCUj + TCRj, với hàm giá tính phí đưa trên, vấn đề xác định phân bố liệu không dư thừa để cực tiểu hố chi phí truyền thơng tổng thể tốn khó Vì cần phải đưa vài kỹ thuật heurristics mà cho phép thực việc tối ưu hoá toán phân bố Để giải vấn đề trên, ta đưa số thuật toán phân bố liệu áp dụng kỹ thuật heurristics Viện Sau Đại Học, Khoa CNTT, Trường Đại Học Bách Khoa Hà nội GV Hướng Dẫn Khoa Học: GS.TS Nguyễn Thúc Hải Học viên: Koeu Sokmeak - 66 - Kỹ thuật Phân tán liệu 4.3 PHƯƠNG PHÁP HEURISTIC ĐỐI VỚI PHÂN BỐ DỮ LIỆU ĐỘNG[11] 4.3.1 THUẬT TOÁN PHÂN BỐ TỐI ƯU(BRUNSTORM) Trong hệ CSDL phân tán, hiệu hệ thống tăng lên đoạn lưu trạm mà chúng thường truy xuất nhiều Vấn đề phải tìm trạm thích hợp cho đoạn Đếm số truy xuất cho trạm đoạn giải pháp cần thiết Một trạm trở thành ứng cử viên lưu trữ đoạn trạm tần suất truy cập đoạn cao Cho ma trận đếm(counter matrix) S(m,n), m số đoạn n số trạm S11 S= S21 Sm1 S12 … S1n S22 … S2n Sm2 … Smn Mỗi phần tử Sij S cho biết tần số truy xuất đoạn i trạm j Một S mô tả số truy xuất đoạn i tất trạm Các cột S cho biết tần số truy xuất trạm tất đoạn Ma trận S phải cập nhật sau lần có truy xuất đến đoạn Để đạt ràng buộc thời gian đáp ứng tối ưu, phải lưu đoạn trạm với tần suất truy cập cao Nói cách khác, Six>Siy với y=1 n, đoạn i phải lưu trạm x Viện Sau Đại Học, Khoa CNTT, Trường Đại Học Bách Khoa Hà nội GV Hướng Dẫn Khoa Học: GS.TS Nguyễn Thúc Hải Học viên: Koeu Sokmeak Kỹ thuật Phân tán liệu - 67 - Ví dụ: Cho ma trận đếm với đoạn trạm sau: X Y Z A B C Ở A, B, C đoạn, X, Y, Z trạm Đoạn A truy xuất 3, lần trạm tương ứng X, Y, Z Đoạn B truy xuất 5, 3, lần trạm X, Y, Z Tương tự đoạn C 1, lần trạm X, Y Z Vậy dựa ma trận đếm, đoạn A đoạn C nên lưu tram Y, đoạn B nên lưu trạm X Tuy nhiên, mô hình lưu trữ trạm đề cập thuật tốn Nếu sử dụng mơ hình tập trung vấn đề tải lượng đường truyền nảy sinh Độ tin cậy hệ thống giảm mơ hình tập trung, điển hình trạm trung tâm down Để khắc phục vấn đề trên, giải pháp tốt phải tổ chức ma trận S thành lưu tất trạm Vậy theo cách này, đoạn dịch chuyển đếm tương ứng đoạn dịch chuyển theo Hình 12 đoạn i với đếm S0 đến Sn tương ứng Đoạn i S0, S1, S2,…Sn Hình 12: Đoạn i thuật tốn tối ưu Viện Sau Đại Học, Khoa CNTT, Trường Đại Học Bách Khoa Hà nội GV Hướng Dẫn Khoa Học: GS.TS Nguyễn Thúc Hải Học viên: Koeu Sokmeak - 68 - Kỹ thuật Phân tán liệu Trước hết, giả sử tất đoạn phân bố trạm dựa theo số phương pháp Sau đó, trạm j, chạy thuật toán tối ưu mà mô tả chi tiết phần THUẬT TOÁN PHÂN BỐTỐI ƯU Bước 1: Đối với đoạn cục bộ, khởi tạo giá trị đếm Sik=0, k=1…n Bước 2: Xử lý nhu cầu truy cập đoạn Bước 3: Tăng giá trị đếm trạm truy cập tương ứng với đoạn Ví dụ, trạm X truy cập đoạn i, thiết lập Six= Six+1 Bước 4: Nếu trạm truy cập trạm cục bộ(truy cập cục bộ) quay lại bước Bước 5: Ngược lại, với đếm trạm từ xa lớn giá trị đếm trạm cục chuyển quyền sở hữu đoạn với chuỗi đếm truy cập cho trạm từ xa(remote node) Ví dụ, trạm X truy cập đoạn i Six>Sij chuyển đoạn i cho trạm X lưu trữ Bước 6: Quay lại bước Trong thuật toán này, nên lưu ý hai thuộc tính: • Thuộc tính sở hữu(ownership): Đối với đoạn, trạm có giá trị đếm cao trở thành trạm sở hữu đoạn, ý đoạn lưu trữ trạm • Thuộc Tính tạm trú(migrate): Đối với đoạn, giá trị đếm trạm lớn giá trị đếm trạm sở hữu quyền sở hữu đoạn chuyển sang trạm Viện Sau Đại Học, Khoa CNTT, Trường Đại Học Bách Khoa Hà nội GV Hướng Dẫn Khoa Học: GS.TS Nguyễn Thúc Hải Học viên: Koeu Sokmeak - 69 - Kỹ thuật Phân tán liệu 4.3.1.1 ƯU ĐIỂM CỦA THUẬT TỐN: • Tính độc lập trạm trung tâm Bởi trạm chạy thuật tốn tối ưu cách tự trị, khơng có ràng buộc với trạm trung tâm Mỗi trạm có quyền sở hữu đoạn • Khi trạm hệ thống down, thuật tốn tiếp tục chạy thao tác nó, khơng có đoạn lưu trạm hỏng 4.3.1.2 NHƯỢC ĐIỂM CỦA THUẬT TỐN: : Thuật tốn có nhược điểm chính: • (1) Vấn đề lưu trữ: Khi dung lượng đoạn giảm số lượng trạm tăng lên dung lượng ma trận đếm tăng lên Hậu không gian lưu trữ ma trận tăng Ví dụ, dung lượng đoạn ghi số trạm 500 cần phải lưu trữ 500 giá trị ghi • (2) Vấn đề mở rộng: Đó vấn đề kiểu liệu giá trị đếm Khi giá trị đếm tăng lên liên tục, hậu dẫn đến thuật tốn chạy khơng cịn Ví dụ dùng byte kiểu liệu để lưu trữ giá trị đếm, lưu giá trị đếm nhỏ 255 Viện Sau Đại Học, Khoa CNTT, Trường Đại Học Bách Khoa Hà nội GV Hướng Dẫn Khoa Học: GS.TS Nguyễn Thúc Hải Học viên: Koeu Sokmeak Kỹ thuật Phân tán liệu - 70 - 4.3.2 THUẬT TOÁN NGƯỠNG(TRESHOLD) Trong số tình huống, để đáp ứng nhu cầu khơng gian lưu trữ với việc sử dụng thuật toán phân bố tối ưu đề xuất brunstom cần chi phí cao Một giải pháp để giảm nhu cầu khơng gian lưu trữ cần thuật tốn tối ưu khác với chi phí thấp Ở luận văn này, sử dụng thuật toán Threshold để giải đáp câu hỏi Giả sử số trạm n, xs xác suất truy cập trạm đoạn đó, với giả thiết đoạn lưu trạm Giả sử xd xác suất truy cập tất trạm lại đoạn Trạm sở hữu thao tác truy cập cục bộ, trạm lại thao tác truy cập từ xa Xác suất trạm sở hữu không truy cập đoạn là: (n-1)xd Xác suất trạm sở hữu không truy cập thành công lần là: [(n-1)xd]2 Xác suất trạm sở hữu không truy cập thành công m lần là: [(n-1)xd]m Vậy, xác suất trạm sở hữu truy cập lần truy cập thành công m lần là: 1- [(n-1)xd]m Bảng liệt kê xác suất trạm sở hữu thực thi truy cập lần số truy cập thành công m lần: Xs m=5 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.40951 0.67232 0.83193 0.92224 0.96875 0.98976 0.99757 0.99968 0.99999 m=10 0.65132 0.89263 0.97175 0.99395 0.99902 0.99990 0.99999 1.00000 1.00000 m=25 0.92821 0.99622 0.99987 1.00000 1.00000 1.00000 1.00000 1.00000 1.00000 m=50 0.99485 0.99999 1.00000 1.00000 1.00000 1.00000 1.00000 1.00000 1.00000 Bảng 3: Liệt kê xác suất truy cập lần Viện Sau Đại Học, Khoa CNTT, Trường Đại Học Bách Khoa Hà nội GV Hướng Dẫn Khoa Học: GS.TS Nguyễn Thúc Hải m=100 0.99997 1.00000 1.00000 1.00000 1.00000 1.00000 1.00000 1.00000 1.00000 Học viên: Koeu Sokmeak - 71 - Kỹ thuật Phân tán liệu Dựa vào bảng trên, với xs=0.1 số truy cập thành cơng 10 xác suất truy cập lần có giá trị 0.65132 Trên bảng liệt kê, kết luận: Nếu xác xuất truy cập trạm sở hữu tăng xác suất truy cập lần tăng theo Ý tưởng nguồn gốc đời thuật toán ngưỡng(Threshold) Trong thuật toán ngưỡng, lưu trữ đếm đoạn Đoạn i s Hình 13: Biểu diễn đoạn i với đếm Nếu so sánh với thuật toán tối ưu, đương nhiên nhu cầu khơng gian lưu trữ giảm lưu trữ giá trị đếm thay phải lưu chuỗi giá trị đếm thuật toán tối ưu Trong thuật toán ngưỡng, giá trị khởi tạo đếm không Giá trị đếm tăng lên đơn vị lần có truy cập từ xa đoạn Mặt khác, thiết lập giá trị khơng truy cập cục Nói cách khác, giá trị đếm cho biết số lần truy cập thành công truy cập từ xa Đến giá trị đếm vượt qua giá trị ngưỡng xác định trước đó, quyền sở hữu chuyển cho trạm khác Vậy câu hỏi đạt ra: Trạm trở thành trạm sở hữu ? Chúng ta cần lưu ý, thuật tốn ngưỡng khơng cho ta biết thông tin truy cập đoạn q khử Thực ra, tồn q trình truy cập, biết thông tin trạm cuối mà Vậy, có hai chiến lược để chọn trạm sở hữu (1) chọn ngẫu nhiên, (2) trạm truy cập cuối chọn Nhưng cách (1) xảy trường hợp trạm khơng truy cập đoạn lần Vậy cách chọn (2) cách chọn tối ưu Viện Sau Đại Học, Khoa CNTT, Trường Đại Học Bách Khoa Hà nội GV Hướng Dẫn Khoa Học: GS.TS Nguyễn Thúc Hải Học viên: Koeu Sokmeak - 72 - Kỹ thuật Phân tán liệu Giả thiết đoạn phân bố trạm hệ thống mạng theo phương pháp Giá trị ngưỡng chọn trước Sau trạm j, chạy thuật toán ngưỡng cho đoạn i mà lưu THUẬT TỐN NGƯỠNG Bước 1: Đối với đoạn lưu, khởi tạo giá trị đếm không(si=0) Bước 2: Xử lý nhu cầu truy cập đoạn Bước 3: Nếu truy cập cục bộ, thiết lập giá trị đếm khơng Quay lại bước Ví dụ, trạm j truy cập đoạn i, thiết lập si=0 Bước 4: Nếu truy cập từ xa, tăng đếm đoạn tương ứng lên đơn vị Ví dụ đoạn i truy cập từ xa, thiết lập si=si+1 Bước 5: Nếu giá trị đếm đoạn lớn giá trị ngưỡng thiết lập giá trị đếm trạm sở hữu không, đồng thời chuyển quyền sở hữu đoạn sang trạm từ xa Ví dụ si>t, set si=0 chuyển đoạn sang trạm từ xa Bước : Quay lại bước Điểm quan trọng thuật toán ngưỡng lựa chọn giá trị ngưỡng Giá trị ảnh hưởng trực tiếp đến tính dịch chuyển đoạn Nếu giá trị ngưỡng tăng lên dẫn đến tình đoạn lưu trữ đoạn lâu Cịn giá trị giảm nảy sinh tình khác đoạn dịch chuyển đến trạm nhiều Viện Sau Đại Học, Khoa CNTT, Trường Đại Học Bách Khoa Hà nội GV Hướng Dẫn Khoa Học: GS.TS Nguyễn Thúc Hải Học viên: Koeu Sokmeak - 73 - Kỹ thuật Phân tán liệu Chúng ta nên lưu ý điểm quan trọng khác phân bố xác suất truy cập Nếu xác suất truy cập tất trạm đoạn nhau, đoạn dịch qua tất trạm CÁC KẾT QUẢ MƠ PHỎNG Trong mơ phịng, giả thiết : • n biểu diễn số trạm, • xs biểu diễn xác suất truy cập đoạn trạm sở hữu, • xd biểu diễn xác suất truy cập đoạn trạm cịn lại, • Os biểu diễn xác suất mà đoạn thuộc trạm sở hữu, • Od biểu diễn tổng xác suất mà đoạn thuộc trạm cịn lại Vậy có : (1) Os+Od=1 (2) Xs+(n-1)xd=1 Bây quan sát thay đổi xác suất truy cập giá trị ngưỡng ảnh hưởng đến xác suất đoạn thuộc trạm sở hữu Viện Sau Đại Học, Khoa CNTT, Trường Đại Học Bách Khoa Hà nội GV Hướng Dẫn Khoa Học: GS.TS Nguyễn Thúc Hải Học viên: Koeu Sokmeak - 74 - Kỹ thuật Phân tán liệu THAY ĐỔI XÁC SUẤT TRUY CẬP : Khi n giá trị constant, xs xd quan tâm giá trị xs Xs Hình 14 : Os hàm xs hệ thống có trạm Kết luận : Với giá trị ngưỡng 0, 3, 10, kết luận : Khi xác suất truy cập đoạn trạm tăng giá trị ngưỡng giảm xác suất đoạn thuộc trạm hội tụ nhanh Viện Sau Đại Học, Khoa CNTT, Trường Đại Học Bách Khoa Hà nội GV Hướng Dẫn Khoa Học: GS.TS Nguyễn Thúc Hải Học viên: Koeu Sokmeak - 75 - Kỹ thuật Phân tán liệu THAY ĐỔI GIÁ TRỊ NGƯỠNG : Chúng ta nên lưu ý : giá trị ngưỡng luôn giá trị khơng âm Ví dụ hệ thống mạng có trạm cho xác suất truy cập đoạn 0.28, 0.24, 0.2, 0.16 0.12 Qua thử nghiệm vẽ đường cong sau : Hình 15 : Đồ thị đường cong thay đổi ngưỡng Đối với đường cong với xác suất 0.28 0.24, hàm Os hội tụ đến Xs>Xd Đối với đường cong với xác suất 0.2, hàm Os giá trị không đổi constant Xs=Xd Đối với đường cong với xác suất 0.16 0.12, hàm Os hội tụ đến Xs

Ngày đăng: 27/02/2021, 23:39

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN