1.4. Phỏt hiện phụ thuộc hàm
1.4.3. Một số chủ đề liờn quan đến phỏt hiện phụ thuộc hàm
Trong phần này, ta sẽ trỡnh bày túm tắt một số chủ đề liờn quan đến phỏt hiện phụ thuộc hàm [45].
Lấy mẫu. Khi quan hệ r lớn, chi phớ cho việc kiểm tra một phụ thuộc
hàm ứng viờn cú thể rất cao. Để giảm thời gian kiểm tra một phụ thuộc hàm
ứng viờn trờn r, lấy mẫu là một phương phỏp được đề xuất cho mục đớch này.
Kớ hiệu f là một phụ thuộc hàm ứng viờn, s là một mẫu nhỏ của quan hệ r ,
[0,1]
là một tham số tin cậy (nhỏ). í tưởng chớnh của phương phỏp lấy mẫu là nếu f được thỏa bởi s thỡ f được thỏa bởi r với độ tin cậy (1). Nếu f bị vi phạm bởi cỏc bộ trong s thỡ chắc chắn f khụng được thỏa bởi r
[41]. Sử dụng ý tưởng này, cỏc phụ thuộc hàm ứng viờn khụng được thỏa bởi
quan hệ r cú thể được tỉa một cỏch hiệu quả. Phương phỏp lấy mẫu thường
được sử dụng kết hợp với cỏc phương phỏp khỏc.
Duy trỡ cỏc phụ thuộc hàm đó được phỏt hiện. Trong phần này, giả sử quan hệ r được cho trước và tất cả cỏc phụ thuộc hàm được thỏa bởi r đó
được phỏt hiện và được lưu trữ trong tập . Ta nghiờn cứu vấn đề tập sẽ
thay đổi như thế nào khi thực hiện chốn thờm một bộ vào r hoặc xúa đi một bộ khỏi r .
Khi một bộ t được chốn vào r , cỏc phụ thuộc hàm cú thể được duy trỡ
theo cỏch sau [10]: Với mỗi phụ thuộc hàm X A trong , kớ hiệu Xlà bao đúng thuộc tớnh được tớnh từ . Sau thao tỏc chốn, tớnh:
[ ]
qSELECT X FROM r WHERE X t X
Nếu q 1 thỡ việc chốn thờm bộ khụng ảnh hưởng đến . Nếu q 1
thỡ phải tồn tại B trong Xcú cỏc giỏ trị khỏc nhau trong q X[ ]. Tỡm Z B
trong sao cho Z X và loại bỏ Z B khỏi .
Khi một bộ t bị xúa khỏi quan hệ r, cỏc phụ thuộc hàm đỳng trờn r
vẫn đỳng trờn (r t). Tuy nhiờn, cỏc phụ thuộc hàm mới cú thể được bổ sung vào do việc xúa cú thể loại bỏ cỏc bộ vi phạm một số phụ thuộc hàm. Đỏng tiếc là chưa cú cỏch nào đơn giản để phỏt hiện cỏc phụ thuộc hàm mới sẽ được bổ sung; ta cú thể ỏp dụng lại cỏc thuật toỏn phỏt hiện phụ thuộc hàm đối với quan hệ (r t).
Phỏt hiện khúa. Phỏt hiện khúa là trường hợp đặc biệt của phỏt hiện
phụ thuộc hàm. Định lý sau đõy kiểm tra một tập thuộc tớnh cú phải là khúa đối với quan hệ r hay khụng.
Định lý 1.4 [45].
(1) Cho X là một tập con của và rlà một quan hệ. Tập X là một
khúa của r nếu và chỉ nếu r X[ ] r . [32, 59]
(2) Một thuộc tớnh AR là một khúa nếu và chỉ nếu A khụng thuộc
bất kỳ tập bằng nhau nào của quan hệ r.
Theo (1), điểm mấu chốt của định lý là việc tớnh lực lượng. Lực lượng
r cú thể nhận được từ cỏc siờu dữ liệu (metadata) của r. Lực lượng [ ]
r X được tớnh trong 2 trường hợp: nếu X chỉ cú một thuộc tớnh thỡ cũng cú
thể nhận được từ cỏc siờu dữ liệu của r giống như r . Nếu X gồm nhiều
thuộc tớnh thỡ cú thể sử dụng phương phỏp phõn hoạch để tớnh r X[ ][59]. Cụng trỡnh trong [9] chỉ rừ: cho trước một tập cỏc phụ thuộc hàm, bài