M Ở ĐẦU
2.4. Thể hiện luật không chắc chắn cho các thuộc tính có giá trị lặp
Để thẩm định các bộ của một quan hệ từ đó rút ra kết luận liệu các bộ
của nó có phải là nhân bản thừa hay không?. Chúng ta cần đưa ra các tiêu
chuẩn để thẩm định như sau:
Với mỗi thuộc tính Ai đặt pi = p(Ai) [0, 1] gọi là độ chắc chắn lặp của
thuộc tính Ai. pi càng lớn thì khả năng nhân bản giá trị của Ai càng lớn, pi càng nhỏ thì khả năng nhân bản giá trị của Ai càng nhỏ. Ví dụ, nếu Ai là số chứng
minh nhân dân thì p(Ai) = 0, tức là khả năng nhân bản của thuộc tính này là không thể có; còn nếu Ai là giới tính hay quê quán thì p(Ai) rất gần với 1, tức
là khả năng nhân bản giá trị của hai thuộc tính này là rất lớn. Các pi, i = 1,m
được xác định bằng lý thuyết chắc chắn thuộc hệ chuyên gia.
Nếu trong HV có tồn tại k để p(HVk) = 0 (p(HV) =
1 ( ) n i i P A ) thì chỉ giữ
lại một bộ và xác định lại các giá trị của các thuộc tính không thuộc HV
nhưng liên đới bộ với HV. Ví dụ bỏ một bộ trong HV2 vì p( 2 2
HV ) =
p(GiayCMND)= 0 sau đó xác minh lại QueQuan, ….
Gọi po , p1 (0,1) là cận dưới và cận trên tương đối của độ chắc chắn
lặp của phép thẩm định sao cho:
i.Nếu 0 ( k)
k p HV
po thì khẳng định các bộ đó là nhân bản thừa của
nhau nên chỉ giữ lại một bộ và xác định lại các giá trị của các thuộc
ii.Nếu ( k)
k p HV
p1 thì khẳng định các bộ của HV không phải nhân bản
thừa của nhau nên đều được giữ lại.
iii.Nếu po ( k)
k p HV
p1 thì bằng cách bổ sung các thuộc tính không
thuộc HV và tính lại ( k)
k p HV
và nếu vẫn có po ( k)
k p HV
p1 thì phải thẩm định trực tiếp từng giá trị của các thuộc tính của các bộ này.