CHƯƠNG 2 XÂY DỰNG MÔ HÌNH CSDL QUAN HỆ VỚI THÔNG TIN NGÔN NGỮ
2.2 Quản lý ngữ nghĩa dữ liệu dựa trên ĐSGT
ĐSGT và các ánh xạ định lượng ngữ nghĩa có thể cung cấp công cụ hữu hiệu để khai thác ngữ nghĩa của dữ liệu mờ hoặc dữ liệu ngôn ngữ trong các CSDL này.
Như đã chỉ ra ở trên, chúng ta có một cách thống nhất để thao tác dữ liệu vì (i) bản chất của việc thao tác dữ liệu dựa trên các quan hệ mờ là quản lý dữ liệu kinh điển và (ii) các ánh xạ định lượng ngôn ngữ được định nghĩa bởi một công thức đệ quy
duy nhất với tham số. Phát biểu thứ hai nói rằng chúng ta rất dễ thay đổi ngữ nghĩa của dữ liệu theo quan điểm người dùng. Để minh họa điều này, ta hãy xét ví dụ sau đây:
Ví dụ 2.2. Xét lược đồ quan hệ R = {TEN, TUOI, CHUCDANH, CT, SV}, trong đó TEN, TUOI, CHUCDANH, CT và SV là Tên, Tuổi, Chức danh khoa học, Số Công trình khoa học và Số sinh viên sau đại học đã bảo vệ thành công luận văn Thạc sỹ hoặc luận án Tiến sỹ thành công. Có thể gọi lược đồ quan hệ này là GIÁOVIÊN.
Giả sử một thể hiện r của R được cho như sau:
TEN TUOI CHUCDANH CT SV
John 35 PhD 25 8
Peter 55 Ass. Prof 50 25
William M Rather young
Ass. Prof 45 35
Johnson 65 Prof 70 40
Mary V Rather young
Ass. Prof 34 32
Claude 59 Prof 60 31
Andrei Rather old Ass. Prof 55 39 Bảng 2.1: Một thể hiện r của lược đồ R
Một ví dụ về truy vấn CSDL này là: “Hãy tìm giáo viên trẻ (young) đã công bố ít nhất một số lượng khá lớn (Rather large) các công trình khoa học và hướng dẫn một số lượng khá lớn (Rather large) sinh viên sau đại học thành công”.
Câu trả lời của truy vấn này phụ thuộc vào sự tương tự dữ liệu được định nghĩa ở trên bởi các lân cận của young, Rather large (cho số công trình khoa học) và Rather large (cho số sinh viên sau đại học).
Cho DAGE = [0, 120], DWRK = [0, 75] và DPGD = [0, 50] và các tham số của SQM gán cho TUOI giống Ví dụ 1.2, trong khi các tham số CT and SV được cho như sau = fm(c) = 0.40, (Less) = 0.20, (Rather) = (More) = 0.30, (Very) = 0.20.
(1) Với thuộc tính TUOI, ta cần tính lân cận của young và các giá trị định lượng ngôn ngữ y, MPy và Vpy viết tắt của young, More Possibly young và Very Possibly young, như sau:
AGE(y) = [fm(y) – ((M) + (V))fm(y)]120 = [0.45 - (0.30 + 0.18)0.45]120 = 28.08
AGE(Py) = AGE(y) + [((M) + (V))(P)fm(y)]120 = 36.3744
AGE(MPy) = AGE(Py) – [((P) + (L))(M)(P)fm(y)]120 = 33.67872
AGE(VPy) = AGE(Py) – [(M)(P)fm(y) + ((P) + (L))(V)(P)fm(y)]120
= 29.572992
Sau đây là một số lân cận của young:
A1(y) = (y) = [0.0, fm(y)120] = [0.0, 54.0]
A2(y) = (AGE(y) – (M)fm(y) 120, AGE(y) + (P) fm(y) 120] = (11.88, 45.36]
A3(y) = (AGE(y) – (L)(M)fm(y) 120, AGE(y) + (V)(P) fm(y) 120] = (24.84, 31.1904]
(2) Với thuộc tính CT chúng ta có các đẳng thức sau đây, trong đó lr viết tắt cho large và sm viết tắt cho small:
WRK(lr) = [fm(sm) + (fm(lr) – ((R)+(L))fm(lr))]75 = [0.40 - (0.30 + 0.20)0.60]75 = 52.50
(R lr) = (lr) – ((M)+(V))(R)fm(lr))75 = 45.75
Sau đây là một số lân cận của Rather large:
W,2(R lr) = (R lr) = (WRK(lr) – (R)fm(lr)75, WRK(lr)] = (52.50–13.50, 52.50]
= (39.00, 52.50]
W,3(R lr) = (R lr) \{(LR lr)(VR lr)} = (WRK(R lr) –
(R)(M)fm(lr)(M)75, WRK(R lr)
– (M)(R)fm(lr)(M)75] = (41.70, 49.80].
(3) Với thuộc tính SV chúng ta có các biểu thức tính toán giống như trong (2), ngoại trừ 75 được thay bằng 50:
PGR(lr) = [fm(sm) + (fm(lr) – ((R)+(L))fm(lr))]50 = [0.40 - (0.30 + 0.20)0.60]50 = 35.00
PGR(R lr) = PGR(lr) – ((M)+(V))(R)fm(lr))]50 = 30.50 Một số lân cận của Rather large là:
P,2(R lr) = (R lr) = (WRK(lr) – (R)fm(lr)50, WRK(lr)] = (35.00–9.00, 35.00] = (24.00, 35.00]
P,3(R lr) = (R lr) \ {(LR lr)(VR lr)} = (WRK(R lr) –
(R)(M)fm(lr)(M)50, WRK(R lr)
– (M)(R)fm(lr)(M)50] = (27.80, 33.20].
Bảng sau cho một số câu trả lời cho câu truy vấn ở trên. Lưu ý rằng các giá trị trong dấu ngoặc tròn trong trong cột TUOI là giá trị định lượng ngữ nghĩa của các thuật ngữ trong cùng ô.
Mức độ tương tự (11.88, 45.36] (39.00, 52.50] (24.36, 35.00]
TEN TUOI CHUCDANH CT SV
John 35 PhD 25 8
Peter 55 Ass. Prof 60 25
William
M Possibly young (33.67872)
Ass. Prof 53 35
Johnson 65 Prof 70 40
Mary
V Possibly young (29.572992)
Ass. Prof 42 32
Claude 59 Prof 60 31
Andrei Rather old Ass. Prof 55 39
Mức độ tương tự (24.84, 31.1904) (41.70, 49.80] (27.80, 33.20]
TEN TUOI CHUCDANH CT SV
John 35 PhD 25 8
Peter 55 Ass. Prof 55 25
William M Rather young
(33.67872) Ass. Prof 50 35
Johnson 65 Prof 70 40
Mary
V Rather young (29.572992)
Ass. Prof 42 32
Claude 59 Prof 60 31
Andrei Rather old Ass. Prof 55 39
Bảng 2.2
Có thể kiểm tra rằng các hàng bôi đậm của hai bảng trên thỏa điều kiện truy vấn theo mức độ tương tự ghi trên hàng đầu của các cột được đề cập của các bảng tương ứng.