Thuật toán tính size của mảnh

Một phần của tài liệu Gộp nhóm các giá trị lặp của các thuộc tính trong các mảnh của cơ sở dữ liệu phân tán (Trang 61 - 62)

Với mỗi mảnh hhõn hợp, ta có thể phải tính kích thước của chúng để có thể khi cần thì tính chi phí khi truyền các mảnh trên mạng. Kích thước (tính theo bytes) của một mảnh F(B1,B2,….,Bk) (với Bi là thuộc tính thứ i của mảnh) có số bộ là n được tính như sau:

    k i i B length n F Size 1 ) ( ) ( Trong đó,

 Length(Bi) là chiều dài của thuộc tính thứ i  n là số bộ của F

Áp dụng công thức trên, ta tiến hành tính kích thước cho từng mảnh tương ứng.

Nhận xét:

Qua hai thuật toán phân mảnh ngang, phân mảnh hỗn hợp thì chúng ta có một mảnh hỗn hợp bao gồm các thuộc tính có giá trị lặp với số lượng lớn hơn 2 khi đó các việc gộp nhóm mới có giá trị tiết kiệm dung lượng thiết bị lưu trữ, thời gian truyền khố dữ liệu đó trên mạng. Vì khi lưu trữ chúng ta chỉ cần lưu trữ các thuộc tính của mảnh hỗn hợp đã thu được và một bộ các giá trị của thuộc tính cùng khóa của nó và các khóa của các bộ còn lại. Khi cần sử dụng người ta có thể liệt kê thuộc tính các khóa của mảnh hỗn hợp, còn các

giá trị của mảnh hỗn hợp sẽ là bộ giá trị được kèm theo. Việc tiết kiệm này cũng được thể hiện khi truyền các mảnh hỗn hợp trên mạng.

Việc gộp nhóm quan trọng nhất là phân mảnh ngang để tìm tìm ra số bộ có giá trị lặp tại số thuộc tính nào đó, còn phân mảnh dọc là để tách nhóm các giá trị lặp đó khỏi các bộ của mảnh ngang đã cho mà tạo ra mảnh hỗn hợp.

Một phần của tài liệu Gộp nhóm các giá trị lặp của các thuộc tính trong các mảnh của cơ sở dữ liệu phân tán (Trang 61 - 62)

Tải bản đầy đủ (PDF)

(81 trang)