Quản lý ngữ nghĩa dữ liệu dựa trên ĐSGT

Một phần của tài liệu Về một mô hình CSDL quan hệ với thông tin không chắc chắn dạng ngôn ngữ gần tự nhiên (Trang 41)

1. 4.1 Những phát biểu cơ bản

2.2 Quản lý ngữ nghĩa dữ liệu dựa trên ĐSGT

ĐSGT và các ánh xạ định lượng ngữ nghĩa có thể cung cấp công cụ hữu hiệu để khai thác ngữ nghĩa của dữ liệu mờ hoặc dữ liệu ngôn ngữ trong các CSDL này. Như đã chỉ ra ở trên, chúng ta có một cách thống nhất để thao tác dữ liệu vì (i) bản chất của việc thao tác dữ liệu dựa trên các quan hệ mờ là quản lý dữ liệu kinh điển và (ii) các ánh xạ định lượng ngôn ngữ được định nghĩa bởi một công thức đệ quy

duy nhất với tham số. Phát biểu thứ hai nói rằng chúng ta rất dễ thay đổi ngữ nghĩa của dữ liệu theo quan điểm người dùng. Để minh họa điều này, ta hãy xét ví dụ sau đây:

Ví dụ 2.2. Xét lược đồ quan hệ R = {TEN, TUOI, CHUCDANH, CT, SV}, trong đó TEN, TUOI, CHUCDANH, CT và SV là Tên, Tuổi, Chức danh khoa học, Số Công trình khoa học và Số sinh viên sau đại học đã bảo vệ thành công luận văn Thạc sỹ hoặc luận án Tiến sỹ thành công. Có thể gọi lược đồ quan hệ này là GIÁOVIÊN. Giả sử một thể hiện r của R được cho như sau:

TEN TUOI CHUCDANH CT SV

John 35 PhD 25 8

Peter 55 Ass. Prof 50 25 William M Rather young Ass. Prof 45 35 Johnson 65 Prof 70 40 Mary V Rather young Ass. Prof 34 32 Claude 59 Prof 60 31 Andrei Rather old Ass. Prof 55 39

Bảng 2.1: Một thể hiện r của lược đồ R

Một ví dụ về truy vấn CSDL này là: “Hãy tìm giáo viên trẻ (young) đã công bố ít nhất một số lượng khá lớn (Rather large) các công trình khoa học và hướng dẫn một số lượng khá lớn (Rather large) sinh viên sau đại học thành công”.

Câu trả lời của truy vấn này phụ thuộc vào sự tương tự dữ liệu được định nghĩa ở trên bởi các lân cận của young, Rather large (cho số công trình khoa học) và Rather large (cho số sinh viên sau đại học).

Cho DAGE = [0, 120], DWRK = [0, 75] và DPGD = [0, 50] và các tham số của SQM gán cho TUOI giống Ví dụ 1.2, trong khi các tham số CT and SV được cho như sau =

fm(c) = 0.40, (Less) = 0.20, (Rather) = (More) = 0.30, (Very) = 0.20.

(1) Với thuộc tính TUOI, ta cần tính lân cận của young và các giá trị định lượng ngôn ngữ y, MPyVpy viết tắt của young, More Possibly youngVery Possibly young, như sau:

AGE(y) = [fm(y) – ((M) + (V))fm(y)]120 = [0.45 - (0.30 + 0.18)0.45]120 = 28.08

AGE(Py) = AGE(y) + [((M) + (V))(P)fm(y)]120 = 36.3744

AGE(MPy) = AGE(Py) – [((P) + (L))(M)(P)fm(y)]120 = 33.67872

AGE(VPy) = AGE(Py) – [(M)(P)fm(y) + ((P) + (L))(V)(P)fm(y)]120 = 29.572992

Sau đây là một số lân cận của young:

A1(y) = (y) = [0.0, fm(y)120] = [0.0, 54.0]

A2(y) = (AGE(y) – (M)fm(y)120, AGE(y) + (P)fm(y)120] = (11.88, 45.36] A3(y) = (AGE(y) – (L)(M)fm(y) 120, AGE(y) + (V)(P) fm(y) 120] = (24.84, 31.1904]

(2) Với thuộc tính CT chúng ta có các đẳng thức sau đây, trong đó lr viết tắt cho

largesm viết tắt cho small:

WRK(lr) = [fm(sm) + (fm(lr) – ((R)+(L))fm(lr))]75 = [0.40 - (0.30 + 0.20)0.60]75 = 52.50

Sau đây là một số lân cận của Rather large: W,2(R lr) = (R lr) = (WRK(lr) – (R)fm(lr)75, WRK(lr)] = (52.50–13.50, 52.50] = (39.00, 52.50] W,3(R lr) = (R lr) \{(LR lr)(VR lr)} = (WRK(R lr) – (R)(M)fm(lr)(M)75, WRK(R lr) – (M)(R)fm(lr)(M)75] = (41.70, 49.80].

(3) Với thuộc tính SV chúng ta có các biểu thức tính toán giống như trong (2), ngoại trừ 75 được thay bằng 50:

PGR(lr) = [fm(sm) + (fm(lr) – ((R)+(L))fm(lr))]50 = [0.40 - (0.30 + 0.20)0.60]50 = 35.00

PGR(R lr) = PGR(lr) – ((M)+(V))(R)fm(lr))]50 = 30.50 Một số lân cận của Rather large là:

P,2(R lr) = (R lr) = (WRK(lr) – (R)fm(lr)50, WRK(lr)] = (35.00–9.00, 35.00] = (24.00, 35.00] P,3(R lr) = (R lr) \ {(LR lr)(VR lr)} = (WRK(R lr) – (R)(M)fm(lr)(M)50, WRK(R lr) – (M)(R)fm(lr)(M)50] = (27.80, 33.20].

Bảng sau cho một số câu trả lời cho câu truy vấn ở trên. Lưu ý rằng các giá trị trong dấu ngoặc tròn trong trong cột TUOI là giá trị định lượng ngữ nghĩa của các thuật ngữ trong cùng ô.

Mức độ tương tự (11.88, 45.36] (39.00, 52.50] (24.36, 35.00] TEN TUOI CHUCDANH CT SV

John 35 PhD 25 8

Peter 55 Ass. Prof 60 25

William M Possibly young (33.67872) Ass. Prof 53 35 Johnson 65 Prof 70 40 Mary V Possibly young (29.572992) Ass. Prof 42 32 Claude 59 Prof 60 31

Andrei Rather old Ass. Prof 55 39

Mức độ tương tự (24.84, 31.1904) (41.70, 49.80] (27.80, 33.20] TEN TUOI CHUCDANH CT SV

John 35 PhD 25 8

Peter 55 Ass. Prof 55 25

William M Rather young

(33.67872) Ass. Prof 50 35 Johnson 65 Prof 70 40 Mary V Rather young (29.572992) Ass. Prof 42 32 Claude 59 Prof 60 31

Andrei Rather old Ass. Prof 55 39

Có thể kiểm tra rằng các hàng bôi đậm của hai bảng trên thỏa điều kiện truy vấn theo mức độ tương tự ghi trên hàng đầu của các cột được đề cập của các bảng tương ứng.

Một phần của tài liệu Về một mô hình CSDL quan hệ với thông tin không chắc chắn dạng ngôn ngữ gần tự nhiên (Trang 41)

Tải bản đầy đủ (PDF)

(105 trang)