3.4. Mở rộng phụ thuộc hàm và phụ thuộc đa trị
3.4.1. Quan hệ tương tự
Cho hệ thống thông tin A= (U, A). Với mỗi V ⊆U vàX ⊆A, ta gọi miền giá
trị của V trên X là tập hợp
dom(V, X) := {u(X)|u∈V}.
Khi V = U ta viết dom(X) thay cho dom(U, X) và hơn nữa, nếu X = {a}, ta chỉ
viết một cách đơn giản: Ia = dom({a}).
Để mở rộng các khái niệm phụ thuộc, trên các tập giá trị Ia, ngoài quan hệ bằng nhau thông thường ta giả định là tồn tại một quan hệ tương tự, phản ánh độ gần nhau giữa các giá trị. Một cách chính xác, một ánh xạ s :Ia×Ia →[0,1]được gọi là quan hệ tương tự trên tập Ia nếu hai điều kiện sau thỏa mãn:
a) s(a1, a2) =s(a2, a1), với mọi a1, a2 ∈Ia, b) s(a1, a2) = 1⇔a1 =a2.
s(a1, a2)được gọi là độ tương tự giữa hai giá trị a1 và a2.Cho α∈[0,1], hai giá trị
khi hàm s chỉ nhận hai giá trị 0 và 1, thì với mọi α > 0, a1 =α a2 khi và chỉ khi
a1 =a2.
Cho tập thuộc tính B ={b1, b2,· · · , bm} ⊆A và ξ, η ∈dom(B). Khi đó ξ và η
có thể xem là hai dãy (ξ1, ξ2,· · · , ξm)và (η1, η2,· · · , ηm), với ξi, ηi ∈Ibi,1≤i≤m.
Độ tương tự giữa ξ và η được định nghĩa là giá trị:
S(ξ, η) = min{s(ξi, ηi)|1≤i≤m}. (3.5)
Bây giờ, giả sử ξ∈dom(B) vàE ⊆dom(B), ta gọi độ thuộc của ξ vàoE là độ tương tự lớn nhất giữa ξ với các giá trị trong E. Cụ thể, giá trị này được xác định
bởi:
µ(ξ, E) = max
η∈E S(ξ, η).
Một cách tự nhiên, ta tiếp tục dùng ký hiệu ξ=α ηnếu S(ξ, η)≥αvà nói rằng
ξ và η là α−tương tự. Cũng vậy, ta nói ξ thuộc vào tập E với mức α, và ký hiệu ξ ∈α E, nếuµ(ξ, E)≥α. Mệnh đề dưới đây cho ta một số tính chất cơ bản của các
khái niệm này mà việc chứng minh có thể được suy ra trực tiếp từ định nghĩa.
Mệnh đề 3.4. Cho B ⊆A, E ⊆dom(B), ξ, η ∈dom(B), ta có
a) S(ξ, η) =S(η, ξ); S(ξ, η) = 1⇔ξ =η.
b) 0≤µ(ξ, E)≤1; µ(ξ, E) = 1⇔ξ∈E.
c) Nếu E ⊆E0 ⊆dom(B), thì µ(ξ, E)≤µ(ξ, E0).
d) ξ ∈α E ⇔ ∃η ∈E, ξ=α η.
Ví dụ 3.2. Xét hệ thống với ba thuộc tính:a(tên lập trình viên),b(trình độ chun mơn), c(ngơn ngữ lập trình sử dụng) được cho trong Bảng 3.3, cịn quan hệ tương tự giữa các giá trị trong từng thuộc tính được cho bởi Bảng 3.4 và Bảng 3.5.
a b c A Đại học PASCAL A Đại học FORTRAN A Đại học COBOL A Trung cấp PASCAL A Trung cấp C A Trung cấp FORTRAN A Thạc sĩ COBOL A Thạc sĩ PASCAL B Đại học C B Đại học PASCAL Bảng 3.3: Bảng dữ liệu về các lập trình viên b Đại học Trung cấp Thạc sĩ Đại học 1 0.6 0.8 Trung cấp 0.6 1 0.3 Thạc sĩ 0.8 0.3 1
Bảng 3.4: Quan hệ tương tự trên Ib
c FORTRAN COBOL PASCAL C
FORTRAN 1 0.9 0.7 0.8
COBOL 0.9 1 0.7 0.6
PASCAL 0.7 0.7 1 0.8
C 0.8 0.6 0.6 1
Đặt B = {b, c}, ξ= (Đại học, FORTRAN), η= (Thạc sĩ, COBOL), với ξ, η ∈ dom(B), ta có
S(ξ, η) = min{s(Đại học, Thạc sĩ), s(FORTRAN, COBOL)}
= min{0.8,0.9}= 0.8.
Mặt khác, với E ={Đại học,Trung cấp} ⊆Ib và Thạc sĩ ∈Ib, ta có
µ(Thạc sĩ, E) = max{s(Thạc sĩ, Đại học), s(Thạc sĩ, Trung cấp)}
= max{0.8,0.3}= 0.8.
Như vậy, ξ=0.8 η và Thạc sĩ ∈0.8 E.