Phân mảnh dọc

Một phần của tài liệu Gộp nhóm các giá trị lặp của các thuộc tính trong các mảnh của cơ sở dữ liệu phân tán (Trang 27 - 28)

Cho R là một quan hệ trên tập các thuộc tính Ω = {A1, A2,…, An}. Khi đó phân mảnh dọc quan hệ R sinh ra các mảnh R1, R2,, …, Rm sao cho mỗi mảnh là một quan hệ chứa một tập con các thuộc tính cuả quan hệ R và khóa của nó. Tức là Ω sẽ được phân mảnh sao cho Ω = Ω1 Ω2 …. Ωm, trong đó Ri là mảnh quan hệ trên các thuộc tính Ωi, i=1…m.

Mục đích của phân mảnh dọc là phân chia quan hệ R thành tập các quan hệ nhỏ hơn để có nhiều ứng dụng có thể chỉ cần thực hiện trên một mảnh, điều này làm giảm đáng kể chi phí. Mảnh tối ưu là mảnh sinh ra một lược đồ phân mảnh cho phép giảm thiểu thời gian thực hiện của ứng dụng trên mảnh đó.

Kỹ thuật phân mảnh dọc phức tạp hơn phân mảnh ngang, vì số lựa chọn phân hoạch rất lớn. Trong trường hợp có m thuộc tính không phải khóa chính, thì số mảnh có thể là mm.

Để có được lời giải tối ưu cho bài toán phân mảnh dọc rất khó, không hiệu quả. Vì vậy cần phải sử dụng các phương pháp Heuristic cho phân mảnh dọc các quan hệ toàn cục. Có hai phương pháp Heuristic:

a. Nhóm thuộc tính: bắt đầu gán mỗi thuộc tính cho một mảnh và trong mỗi bước, nối một số mảnh lại với nhau cho đến khi thỏa mãn điều kiện phân mảnh.

b. Tách mảnh: bắt đầu bằng một quan hệ và quyết định cách phân chia quan hệ dựa trên hành vi truy xuất của các ứng dụng trên các thuộc tính. Ở đây chúng ta chỉ xem xét kỹ thuật tách mảnh vì nó thích hợp với phương pháp thiết kế CSDLPT từ trên xuống.

Việc nhân bản các thuộc tính khóa của quan hệ toàn cục trong các mảnh là một đặc trưng của phương pháp phân mảnh dọc cho phép khôi phục quan hệ toàn cục và bảo đảm tính toàn vẹn ngữ nghĩa và làm giảm đi quá trình trao đổi dữ liệu. Vì vậy, phương pháp phân mảnh dọc chỉ đề cập đến các thuộc tính không khóa.

Một phần của tài liệu Gộp nhóm các giá trị lặp của các thuộc tính trong các mảnh của cơ sở dữ liệu phân tán (Trang 27 - 28)

Tải bản đầy đủ (PDF)

(81 trang)