Thể hiện luật không chắc chắn cho các thuộc tính có giá trị lặp

Một phần của tài liệu Loại bỏ các mẫu tin nhân bản thừa trong cơ sở dữ liệu quan hệ (Trang 62 - 63)

M Ở ĐẦU

2.4. Thể hiện luật không chắc chắn cho các thuộc tính có giá trị lặp

Để thẩm định các bộ của một quan hệ từ đó rút ra kết luận liệu các bộ

của nó có phải là nhân bản thừa hay không?. Chúng ta cần đưa ra các tiêu

chuẩn để thẩm định như sau:

 Với mỗi thuộc tính Ai đặt pi = p(Ai)  [0, 1] gọi là độ chắc chắn lặp của

thuộc tính Ai. pi càng lớn thì khả năng nhân bản giá trị của Ai càng lớn, pi càng nhỏ thì khả năng nhân bản giá trị của Ai càng nhỏ. Ví dụ, nếu Ai là số chứng

minh nhân dân thì p(Ai) = 0, tức là khả năng nhân bản của thuộc tính này là không thể có; còn nếu Ai là giới tính hay quê quán thì p(Ai) rất gần với 1, tức

là khả năng nhân bản giá trị của hai thuộc tính này là rất lớn. Các pi, i = 1,m

được xác định bằng lý thuyết chắc chắn thuộc hệ chuyên gia.

 Nếu trong HV có tồn tại k để p(HVk) = 0 (p(HV) =

1 ( ) n i i P A   ) thì chỉ giữ

lại một bộ và xác định lại các giá trị của các thuộc tính không thuộc HV

nhưng liên đới bộ với HV. Ví dụ bỏ một bộ trong HV2p( 2 2

HV ) =

p(GiayCMND)= 0 sau đó xác minh lại QueQuan, ….

 Gọi po , p1  (0,1) là cận dưới và cận trên tương đối của độ chắc chắn

lặp của phép thẩm định sao cho:

i.Nếu 0  ( k)

k p HV

  po thì khẳng định các bộ đó là nhân bản thừa của

nhau nên chỉ giữ lại một bộ và xác định lại các giá trị của các thuộc

ii.Nếu ( k)

k p HV

  p1 thì khẳng định các bộ của HV không phải nhân bản

thừa của nhau nên đều được giữ lại.

iii.Nếu po  ( k)

k p HV

  p1 thì bằng cách bổ sung các thuộc tính không

thuộc HV và tính lại ( k)

k p HV

 và nếu vẫn có po  ( k)

k p HV

  p1 thì phải thẩm định trực tiếp từng giá trị của các thuộc tính của các bộ này.

Một phần của tài liệu Loại bỏ các mẫu tin nhân bản thừa trong cơ sở dữ liệu quan hệ (Trang 62 - 63)

Tải bản đầy đủ (PDF)

(79 trang)