Về một số kết quả liờn quan đến FD và AFD

Một phần của tài liệu (LUẬN án TIẾN sĩ) phát hiện phụ thuộc hàm và phụ thuộc hàm suy rộng trong cơ sở dữ liệu (Trang 49 - 53)

Cỏc kết quả nghiờn cứu về FD sẽ làm nền tảng cho việc nghiờn cứu cỏc loại RFD núi chung và AFD núi riờng. Sau khi [37] được cụng bố năm 1999, đó cú nhiều bài bỏo khỏc tiếp tục được cụng bố nhằm ỏp dụng và mở rộng cỏc kết quả trong [37]. Tuy nhiờn, những kết quả đú vẫn chưa cú những đúng gúp đỏng kể và cho tới nay, thuật toỏn TANE trong [37] vẫn là một trong những thuật toỏn quan trọng và hiệu quả nhất để tỡm cỏc FD và AFD. Bài bỏo [40] được cụng bố năm 2003. Trong [40], sử dụng khỏi niệm phõn hoạch trờn tập hợp cỏc bộ của một quan hệ, cỏc tỏc giả đó đưa ra một số kết quả nhằm phỏt hiện cỏc FD và AFD. Tuy nhiờn, chỳng tụi sẽ chỉ ra cỏc kết quả đú thực chất chớnh là một số bổ đề trong [37]. Thờm vào đú, trong [37] vẫn cũn một số bổ đề cơ bản và quan trọng chưa được chứng minh, vỡ vậy chỳng tụi sẽ đưa ra cỏc chứng minh cho cỏc bổ đề đú. Trong số cỏc chứng minh này, cú những chứng minh là mới, cú những chứng minh chỉ là chi tiết, rừ ràng hơn.

2.1.1. Phõn hoạch

Cho r là một quan hệ (thể hiện) của lược đồ quan hệ S(). Hai bộ t và u thuộc r được gọi là tương đương trờn tập thuộc tớnh X cho trước nếu t[X] = u[X]. Ký hiệu lớp tương đương của bộ t  r khi phõn hoạch theo X là [t]X = {u

là mịn hơn phõn hoạch ’ nếu mỗi lớp tương đương trong  đều là tập con của

một lớp tương đương nào đú trong ’.

Một phõn hoạch được lược gọn là một phõn hoạch mà cỏc lớp tương

đương một phần tử đó bị loại bỏ. Khỏi niệm phõn hoạch được lược gọn trong

[40] cú tờn khỏc là phõn hoạch chịu ràng buộc.

Tớch của hai phõn hoạch X và Y, ký hiệu là X  Y, là phõn hoạch

được định nghĩa như sau:

 t, u  r: (t, u)  X  Y nếu và chỉ nếu (t, u)  X và (t, u)  Y

2.1.2. Một số kết quả

Định lý 2.1. (Định lý 1 trong [40]). Phụ thuộc hàm X  A được thoả nếu và

chỉ nếu X mịn hơn A.

Định lý 2.1 chớnh là bổ đề 2.1 trong [37]. Đõy là một điều kiện cần và đủ để biết một FD cú được thoả món hay khụng.

Chứng minh. Giả sử X  A. Ta cần chứng minh   X    A sao cho

  . Thật vậy,  t, u    t[X] = u[X]. Vỡ X  A nờn từ t[X] = u[X] 

t[A] = u[A]    A sao cho t, u  . Như vậy    và do đú X mịn hơn

A.

Ngược lại, giả sử X mịn hơn A. Ta cần chứng minh XA. Ta cú:  t,

u  r, nếu t[X] = u[X] thỡ   X sao cho t, u  . Vỡ X mịn hơn A nờn 

 A sao cho   . Suy ra t, u   và do vậy t[A] = u[A]. Điều này chứng tỏ

XA. 

Định lý 2.2. (Định lý 2 trong [40]). Phụ thuộc hàm X  A được thoả nếu và

chỉ nếu |X| = |X{A}|.

Định lý 2.2 chớnh là bổ đề 2.2 trong [37]. Bổ đề này cho ta thờm một điều kiện cần và đủ để biết một FD cú thoả món hay khụng trờn cơ sở so sỏnh số lớp tương đương của hai phõn hoạch.

Chứng minh. Vỡ phõn hoạch X{A} mịn hơn X nờn |X|  |X{A}| (i)

Giả sử XA. Ta cần chứng minh |X| = |X{A}|. Thật vậy,   X,  t, u  , ta cú t[X] = u[X], vỡ XA nờn từ t[X] = u[X] suy ra t[A] = u[A], do đú

t[X{A}] = u[X{A}]    X{A} để t, u  . Như vậy,   . Mặt khỏc,

 t, u   ta cú t[X{A}] = u[X{A}]  t[X] = u[X]  t, u      . Vậy  =     X{A}. Điều này chứng tỏ |X|  |X{A}| (ii). Từ (i) và (ii) ta cú |X| = |X{A}|.

Giả sử |X| = |X{A}|. Ta cần chứng minh XA. Thật vậy, giả sử  t, u  r và t[X] = u[X]    X để t, u  . Vỡ |X| = |X{A}| nờn   X{A}

mà  =   t, u    t[X{A}] = u[X{A}]  t[A] = u[A]  X  A. 

Định lý 2.3. (Định lý 3 trong [40]). Phụ thuộc hàm X  A được thỏa nếu và chỉ nếu

g3(X) = g3(X  {A}).

trong đú g3(X) là sai số của siờu khúa X, tức tỷ số giữa số cực tiểu cỏc bộ phải lấy đi khỏi r để X là một siờu khúa với số bộ | r | của r. Như vậy, cho  là một

ngưỡng sai số, 0    1, khi đú X là một khúa xấp xỉ nếu g3(X)  .

Chứng minh. Vỡ mọi siờu khúa đều cú tớnh chất là phõn hoạch của nú chỉ gồm

cỏc lớp tương đương một phần tử. Do đú, cú thể dựng phõn hoạch X để tớnh

g3(X). Theo định nghĩa, 3( ) r X 1 X g X r r       , Từ đú, với X, Y   ta cú:

g3(X) = g3(Y) nếu và chỉ nếu X  Y

Theo định lý 2.2, X  A nếu và chỉ nếu X  X A .

Suy ra X  A nếu và chỉ nếu g3 Xg3X  A . Định lý 2.3 được chứng minh.

Định lý 2.4. (Định lý 4 trong [40]). Ta cú X  Y = X  Y

Định lý 2.4 chớnh là bổ đề 3.6 trong [37] với kớ hiệu X  Y = X . Y.

làm giảm thời gian phỏt hiện cỏc phụ thuộc trong TANE. Chứng minh bổ đề này cũn giỳp ta hiểu rừ hơn về tớch của hai phõn hoạch (định nghĩa tớch của hai phõn hoạch trong cả [37] và [40] khụng được hỡnh thức hoỏ toỏn học).

Chứng minh. Để chứng minh định lý 2.4, ta chỉ cần chỉ ra X  Y là phõn hoạch

ớt mịn nhất mà mịn hơn cả X và Y.

- Trước hết, ta chứng minh X  Y mịn hơn X và Y. Thật vậy, với mọi

  X  Y và với mọi t, u   ta cú t[X  Y] = u[X  Y]  t[X] = u[X] và

t[Y] = u[Y]     X và   Y sao cho t, u   và t, u  . Như vậy,   ,   . Điều này chứng tỏ X  Y mịn hơn X và Y.

- Tiếp theo, ta chứng minh X  Y là phõn hoạch ớt mịn nhất mà mịn hơn X và

Y. Giả sử cú một phõn hoạch Z nào đú mịn hơn cả X và Y. Ta phải chứng

minh Z mịn hơn X  Y. Thật vậy, với mọi   Z và với mọi t, u   ta cú

t[Z] = u[Z]. Vỡ Z mịn hơn X và Y nờn tồn tại   X và   Y sao cho

t, u   và t, u  , do đú t[X] = u[X] và t[Y] = u[Y]. Từ đú ta cú t[XY] = u[XY]

 tồn tại   X  Y để t, u  . 

Định lý 2.5. (Định lý 5 trong [40]). Giả sử B  X và X - {B}  B. Khi đú, nếu X  A thỡ X - {B}  A. Nếu X là một siờu khoỏ thỡ X - {B} cũng là một siờu

khoỏ.

So với bổ đề 3.4 trong [37], đúng gúp của định lý 2.5 chỉ là nếu X  A

và X - {B}  B với B  X thỡ X - {B}  A. í nghĩa là trong quỏ trỡnh tỡm

kiếm cỏc FD, nếu xột thấy một tập thuộc tớnh là khoỏ thỡ cú thể tỉa khụng gian

tỡm kiếm.

Chứng minh.

a) Nếu X  A và X - {B}  B với B  X thỡ X - {B}  A.

Vỡ X - {B}  B và X - {B}  X - {B} (luật phản xạ) nờn X - {B}  X. Mặt khỏc, ta cú X  A nờn X - {B}  A (luật bắc cầu).

b) Nếu X là một siờu khoỏ thỡ X - {B} cũng là một siờu khoỏ.

Vỡ X - {B}  B và X - {B}  X - {B} (luật phản xạ) nờn X - {B}  X. Do

Định lý 2.6. (Định lý 6 trong [40]). C+(X) = {A  R | B  X, X - {A, B}  B

khụng được thoả}.

Định lý 2.6 thực chất là định nghĩa của cỏc ứng cử viờn phải (rhs+ candidates) trong [37]. Trong [40], định nghĩa của C+(X) trựng với kết quả của

bổ đề 3.3 trong [37].

Định lý 2.7. (Định lý 7 trong [40]). Giả sử A  X và X - {A}  A. Phụ thuộc

hàm X - {A}  A tối tiểu nếu và chỉ nếu với mọi B  X, ta cú A  C+(X - {B}).

Định lý 2.7 chớnh là bổ đề 3.1 trong [37]. Bổ đề này chỉ rừ một kết quả quan trọng dưới dạng điều kiện cần và đủ để khẳng định một phụ thuộc hàm đó tối tiểu hay chưa.

Chứng minh.

- Giả sử A  X và X - {A}  A tối tiểu. Vỡ X - {A}  A tối tiểu nờn (X -

{A})-{B}  A khụng thoả món với mọi B  X và B  A, do đú A  C+(X- {B}).

- Giả sử với mọi B  X, ta cú A  C+(X-{B}). Ta cần chứng minh X - {A}  A tối tiểu với A  X. Thật vậy, nếu X - {A}  A chưa tối tiểu thỡ tồn tại B  X và B  A sao cho X - {A, B}  A được thoả, suy ra A  C+(X-{B}), mõu thuẫn

với giả thiết.

Một phần của tài liệu (LUẬN án TIẾN sĩ) phát hiện phụ thuộc hàm và phụ thuộc hàm suy rộng trong cơ sở dữ liệu (Trang 49 - 53)