Sự dư thừa trong tập phụ thuộc hàm

Một phần của tài liệu (LUẬN án TIẾN sĩ) phát hiện phụ thuộc hàm và phụ thuộc hàm suy rộng trong cơ sở dữ liệu (Trang 108 - 109)

Cho trước tập phụ thuộc hàm F trờn tập thuộc tớnh  = {A1, A2,..., An}, nghĩa là tập F gồm cỏc phụ thuộc hàm cú dạng X  Y với X, Y  .

Ta dựng ký hiệu F  (Z  W) để chỉ phụ thuộc hàm Z  W được suy diễn từ F bằng cỏch ỏp dụng cỏc quy tắc của hệ quy tắc suy diễn Armstrong (cỏc quy tắc phản xạ, gia tăng và bắc cầu). Để kiểm tra Z  W cú được suy diễn từ F hay khụng, ta chỉ cần kiểm tra W cú là tập con của ZF hay khụng.

Một phụ thuộc hàm X  Y trong F được gọi là dư thừa nếu X  Y suy

diễn được từ F \ {X  Y}. Ngoài ra, một phụ thuộc hàm cú thể dư thừa thuộc

tớnh ở vế trỏi hoặc vế phải. Khỏi niệm dư thừa sẽ được hỡnh thức húa trong phần tiếp theo.

Vớ dụ 4.5. Xột tập phụ thuộc hàm F = {A  BC, B  E, AB  D, A  E, E

E. Phụ thuộc hàm AB  D dư thừa B ở vế trỏi vỡ ta cú A  D đỳng do AF =

ABCDE  D. Ngoài ra, A  BC dư thừa C ở vế phải vỡ A  C được suy ra từ A  E và E  C.

Việc loại bỏ sự dư thừa trong tập phụ thuộc hàm cú vai trũ quan trọng

như đó trỡnh bày ở trờn. Cho trước tập phụ thuộc hàm F, ta cú thể loại bỏ sự dư thừa trong F bằng thuật toỏn thụng dụng sau (được trỡnh bày trong hầu hết cỏc sỏch về cơ sở dữ liệu để tỡm phủ tối tiểu của F):

Bước 1. Với cỏc phụ thuộc hàm trong F cú vế phải chứa nhiều thuộc

tớnh, tỏch từng phụ thuộc hàm này thành cỏc phụ thuộc hàm cú vế phải chỉ

chứa một thuộc tớnh. Sau bước 1, F chỉ gồm cỏc phụ thuộc hàm với vế phải cú

một thuộc tớnh.

Bước 2. Với mỗi phụ thuộc hàm f  F, kiểm tra F \{ f }  f. Nếu f suy

diễn được từ F \{ f } thỡ loại bỏ f khỏi F.

Bước 3. Loại bỏ cỏc thuộc tớnh dư thừa ở vế trỏi của cỏc phụ thuộc hàm cũn lại trong F.

Thuật toỏn trờn sẽ cho kết quả là một tập phụ thuộc hàm mới tương

đương với tập F ban đầu nhưng với kớch thước nhỏ hơn. Tuy nhiờn, nú phải

sử dụng nhiều lần thuật toỏn tớnh bao đúng (bước 2 và bước 3) và việc kiểm tra để loại bỏ cỏc thuộc tớnh dư thừa ở vế trỏi và vế phải của cỏc phụ thuộc hàm khụng hề đơn giản. Do đú, thuật toỏn trờn khỏ phức tạp và khú ỏp dụng

trong thực tế, đặc biệt khi kớch thước tập F lớn.

Một phần của tài liệu (LUẬN án TIẾN sĩ) phát hiện phụ thuộc hàm và phụ thuộc hàm suy rộng trong cơ sở dữ liệu (Trang 108 - 109)

Tải bản đầy đủ (PDF)

(132 trang)