MÔ HÌNH CSDL MỜ DỰA TRÊN QUAN HỆ TƢƠNG TỰ

Một phần của tài liệu Biểu diễn và xử lý các truy vấn trong cơ sở dữ liệu quan hệ mờ (Trang 29 - 34)

Từ những năm 1982, Buckles và Petry [7] là những ngƣời đầu tiên sử dụng các quan hệ tƣơng tự trong mô hình quan hệ, xem một giá trị di

của miền trị Di, tƣơng ứng với thuộc tính Ai, là một tập con của Di. Ký hiệu P(Di) là tập tất cả các tập con khác rỗng của Di, ta có các định nghĩa sau:

 Một quan hệ mờ r là một tập con của tích Descartes P(D1)...P(Dn) Một bộ t thuộc r đƣợc xác định bởi ngữ nghĩa nội tại của quan hệ.

Chẳng hạn nếu D1 là tập các thành phố lớn và D2 là tập các quốc gia thì (Hà Nội, Pháp)  P (D1) x P (D2), nhƣng rõ ràng không thuộc quan hệ r (thủ đô, quốc gia).

 Một bộ mờ ti là một phần tử thuộc đồng thời cả r và P(D1) x ... x P(D2) và có dạng ti = (di1, di2, ..., din), trong đó dij Dj, i = 1, 2, ..., n.

 Một thể hiện  = (a1, a2, ..., an) của một bộ ti = (di1, di2,..., din) là một phép gán trị sao cho aj  dij với mọi j.

Nhƣ vậy trong quan hệ thông thƣờng một bộ với thông tin đầy đủ đồng nhất với thể hiện của nó.

Theo cách tiếp cận dựa trên quan hệ tƣơng tự, trên mỗi miền trị Dj của thuộc tính Aj có xác định một quan hệ tƣơng tự sj : Dj x Dj  [0, 1] có các tính chất phản xạ (sj(x, x) = 1), đối xứng (sj(x, y) = sj(y, x) và T1 - bắc cầu.

Khi đó ngƣỡng tƣơng tự trên Dj đƣợc xác định bởi:

    ij d y , x j i j) min min s (x,y) D ( Thres   

Trong CSDL không mờ, lực lƣợng của dij, bằng 1 nên sj(x, x) = 1, và Thres (Dj) = 1 với mọi j. Sau này ta sẽ chứng tỏ rằng một giá trị ngƣỡng tối thiểu cho trƣớc có thể đƣợc dùng để xác định những bộ nào có thể đƣợc tổ hợp với nhau bởi phép hợp (tập hợp) trực tiếp các giá trị miền tƣơng ứng.

Một phép toán của đại số quan hệ mờ gồm ngoài các thành phần giống nhƣ một phép toán của đại số quan hệ thông thƣờng, còn có thêm một mệnh đề/câu định nghĩa các ngƣỡng tƣơng tự cực tiểu.

Thí dụ với quan hệ r(A,B,C) trong đó trên các miền trị Dom(B), Dom(C) đã xác định các quan hệ tƣơng tự sA, sB, khi đó phép chiếu trên các thuộc tính B và C có dạng:

project B, C (r) with Thres (B) > 0,8, Thres (C) > 0,9. Sau đây ta ký hiệu Level (Dj) thay cho Thres (Dj).

Trong một CSDL mờ, một bộ thuộc một quan hệ nào đó là dƣ thừa nếu nó có thể đƣợc trộn/hợp nhất với một bộ khác, thông qua phép hợp tập hợp của các giá trị miền tƣơng ứng. Tuy nhiên, việc trộn các bộ chịu sự ràng buộc vào các ngƣỡng tƣơng tự.

Trƣớc hết, ta có định nghĩa sau:

Định nghĩa: Trong CSDL mờ dựa trên quan hệ tƣơng tự, hai bộ: ti = (di1, di2, ..., dim) và

tk = (dk1, dk2, ..., dkm)

đƣợc gọi là dƣ thừa (redundant) nếu nhƣ với các Level(Dj) cho trƣớc, Level (Dj)  k j ij,y d d x min   [sj (x, y)], j = 1, 2, ..., m.

Trong CSDLQH thông thƣờng, không có các bộ dƣ thừa đồng nghĩa với không có quá một xuất hiện của một thể hiện. Do đó liệu có quyền đòi hỏi rằng cho trƣớc một thể hiện của các miền, một quan hệ mờ chỉ đƣợc chứa nhiều nhất một bộ với thể hiện đó.

Rất may là ta có hai định lý sau đây, mà chứng minh có thể tìm đọc trong [20].

Định lý 1: Cho một quan hệ mờ r không chứa các bộ dƣ thừa với các quan hệ tƣơng tự trên miền đều có tính bắc cầu max-min. Khi đó

Ti Tj =  i  j

Trong đó Ti , Tj theo thứ tự là tập các thể hiện có thể có đối với các bộ ti và tj.

Định lý 2: Một quan hệ mờ có đƣợc từ việc trộn/hợp nhất các bộ dƣ thừa là duy nhất nếu nhƣ mỗi quan hệ tƣơng tự đều có tính bắc cầu max- min.

Hai định lý 1 và 2 là cơ sở để chứng minh các phép toán của đại số quan hệ nhƣ các phép chiếu, hợp và giao đều cho hiệu quả duy nhất trong môi trƣờng mờ.

Sau đây để cho tiện, ta gọi CSDL mờ dựa trên quan hệ tƣơng tự là CSDL mờ tƣơng tự.

Để hỏi một CSDL mờ tƣơng tự, ta dùng câu hỏi Q(ai, ah,..., ak) là một biểu thức của một hay nhiều công thức nguyên tố đƣợc tổ hợp bởi các toán tử boole tuyển hay hội để tạo thành một tân từ hỏi:

V1 op Vh op ... op Vk

Với quan hệ r có các miền trị D1, ..., Dm, mỗi nguyên tố phải có dạng Ai  ai (với   [<, <, >, >, =, ) hoặc h (Ai  ai) với h là một gia tử ngôn ngữ nhƣ not, very, more-or-less, ...

Nhƣ đã biết gia tử "very" đƣợc lý giải nhƣ một phép co, còn "more-or- less" nhƣ một phép dẫn.

more-or-less (kích thƣớc = lớn) and not very (trọng lƣợng = nặng), khi hỏi trên một quan hệ có các thuộc tính KICH-THUOC và TRONG- LUONG.

Độ thuộc của một bộ trong quan hệ kết qủa đƣợc tính theo khả năng sánh hợp của bộ đó với các điều kiện của câu hỏi.

Giả sử a  Dj, là một phần tử bất kỳ. Độ thuộc, ký hiệu a (b), b  Dj đƣợc xác định bởi sj(a, b) trên cơ sở quan hệ tƣơng tự sj trên Dj và từ đó, câu hỏi Q() sản sinh một độ thuộc Q(t) cho một bộ t thuộc quan hệ kết quả nhƣ sau:

) Mỗi thể hiện I = (a'1, ..., a'n) của t xác định một giá trị sj(aj, a'j) với mỗi phần tử miền aj của Q(ai, ah, ..., ak).

) Định giá các gia tử và các toán tử trong Q() trên các độ thuộc sj(aj, a'j) để tính đƣợc Q(I), độ thuộc của thể hiện I đối với câu hỏi.

) Kết quả có Q(t) max Q(I)

Y I 

Trong đó Y là tập các thể hiện của t.

Nói tóm lại, độ thuộc của một bộ biểu diễn sự sánh hợp tốt nhất. Khi đó quan hệ kết qủa gồm tập các bộ có độ thuộc khác không. Trong thực hành, thƣờng chỉ chọn những bộ có độ thuộc lớn hơn một ngƣỡng đã chọn.

Nhiều cách mở rộng mô hình dựa trên quan hệ tƣơng tự đã đƣợc nghiên cứu phát triển [21], [22] nhằm mở rộng phạm vi ứng dụng của mô hình này.

Một loại mô hình rất gần với loại mô hình dựa trên quan hệ tƣơng tự là các mô hình dựa trên quan hệ gần nhau. Quan hệ gần nhau trên một miền trị thuộc tính là một quan hệ có tính phản xạ và đối xứng, không có tính bắc cầu,

do đó tạo thuận lợi cho việc mô hình hoá mối quan hệ giữa các phần tử của miền trị.

Ta có định nghĩa sau:

Định nghĩa : Nếu P là một quan hệ gần nhau trên Dj khi đó với [0, 1], các phần tử x, y  Dj đƣợc gọi là  - gần nếu và chỉ nếu xP*y, hay tồn

tại một dãy y1, y2, ..., yk  Dj sao cho: xPy1Py2P... PykP y,

trong đó P ký hiệu nhát cắt mức  của P. Hơn nữa, lƣu ý là xPy ở đây đƣợc gọi là  - tƣơng tự khi P(x, y) > .

Theo định nghĩa trên, dễ thấy là tính  gần có thể dùng để phân hoạch một miền trị vô hƣớng đƣợc liên kết với một quan hệ gần nhau và đó chính là vấn đề mấu chốt để mở rộng mô hình dựa trên quan hệ tƣơng tự sáng mô hình dựa trên quan hệ gần nhau.

Một phần của tài liệu Biểu diễn và xử lý các truy vấn trong cơ sở dữ liệu quan hệ mờ (Trang 29 - 34)

Tải bản đầy đủ (PDF)

(78 trang)