mà quan hệ bằng nhau trong mô hình CSDLQH truyền thống chỉ là một trường hợp riêngcủa nó.3.Bắc cầu SDx, z≥MaxyMin[SDx, y, SDy, z] Một giá trị thuộc tính dij, trong đó i là chỉ số của bộ
Trang 1hệ trợ giúp quyết định phổ biến vẫn là mô hình cơ sở dữ liệu quan hệ (CSDLQH) truyềnthống.
Trong mô hình CSDLQH truyền thống các dữ liệu được lưu trữ đều là dữ liệu rõ.Các phép toán trên CSDL đều được xây dựng dựa trên cơ sở các phép so sánh đơn giảnnhư =, >, ≥, ≤, <, ≠ Trong đó các phép so sánh dùng để so sánh giữa hai biến là hai thuộctính hoặc giữa một biến là một thuộc tính và một hằng, kết quả cho giá trị “TRUE” hoặc
“FALSE” tùy theo mối quan hệ của chúng Như vậy miền giá trị của biến được so sánh làmiền các giá trị rõ và việc so sánh là so sánh chính xác Tuy nhiên thông tin về thế giớithực cần lưu trữ hay xử lý thường có thể là thông tin không đầy đủ, chúng có thể có nhiềudạng chẳng hạn như: không biết một số thông tin về một đối tượng, thông tin lưu trữ có thểkhông chính xác, thông tin lưu trữ có thể không chắc chắn hay mờ Do đó, các nhà quản lýthường phải đối mặt với vấn đề thiếu thông tin trong quá trình ra quyết định, họ phải dùngđến những thông tin không hoàn toàn đầy đủ để rút ra các tri thức tổng hợp, hỗ trợ cho việc
ra quyết định
Việc cần thiết phải có một mô hình cơ sở dữ liệu thích hợp để cho phép lưu trữ và xử
lý cả những thông tin đầy đủ và không đầy đủ đã được nhiều nhà khoa học quan tâmnghiên cứu Hiện tại đã có nhiều cách tiếp cận mở rộng đưa dữ liệu mờ vào lý thuyết quan
hệ với mong muốn tìm được những mô hình chấp nhận thông tin không đầy đủ, cho phépbiểu diễn và khai thác thông tin một cách tốt hơn, tiện lợi hơn trong những lớp bài toánthực tế nào đó
Trang 2Với mục đích tìm hiểu các mô hình đã được sử dụng để mở rộng CSDLQH, đồ ánnày sẽ đề cập đến một số cách tiếp cận mờ để mở rộng CSDLQH trong Chương I, trong đónhấn mạnh vào mô hình CSDLQH dựa trên tính tương tự của hai tác giả P.Buckles vàE.Petry Chương II sẽ trình bày mô hình CSDLQH dựa trên tính tương tự của TS.Hồ Cẩm
Hà Dựa trên các tài liệu tham khảo và các kiến thức đã được học trong môn cơ sở dữ liệu
I, trong Chương III tác giả đồ án sẽ mở rộng lý thuyết thiết kế CSDLQH truyền thống đểchuẩn hoá lược đồ CSDLQH dựa trên tính tương tự Cuối cùng, Chương IV sẽ trình bàyviệc cài đặt một mô đun cho phép thực hiện các thao tác xử lý dữ liệu theo mô hình được
đề cập trong Chương II
Chương I Khái quát về CSDLQH với thông tin không đầy đủ
Mô hình quan hệ mặc dù không phải là mô hình quản trị cơ sở dữ liệu (CSDL) xuấthiện đầu tiên và cũng không phải là mô hình quản trị CSDL tiên tiến nhất nhưng lại đóngvai trò quan trọng và được sử dụng phổ biến nhất hiện nay Chính vì vậy, việc áp dụng lýthuyết mờ vào mô hình CSDLQH là một trong những xu hướng đã được rất nhiều nhànghiên cứu quan tâm Chương này gồm hai phần chính, phần thứ nhất sẽ trình bày tóm tắtmột số hướng tiếp cận CSDLQH mờ, phần thứ hai sẽ trình bày tương đối chi tiết cách tiếpcận dựa trên cơ sở tính tương tự của hai tác giả P.Buckles và E.Petry
1 Một số cách tiếp cận CSDLQH mờ
Tiếp cận dựa trên cơ sở quan hệ mờ (The fuzzy relation – based approach)
Tiếp cận này do Bladwin và Zhou đưa ra đầu tiên vào năm 1984, Zvieli đưa ra năm1986
Theo đó quan hệ mờ R⊆D1×D2× ×Dn được đặc trưng bởi hàm thuộc:
µR: D1×D2× ×Dn→[0,1]
Trang 3Như vậy, mỗi bộ của R có dạng t=(u1,u2, ,un,µR(u1,u2, ,un)), trong đó ui∈Di vớii=1,2, ,n, µR(u1,u2, ,un) chỉ mức độ thuộc quan hệ R của t.
Với cách tiếp cận này, khái niệm một bộ thuộc về một quan hệ là một khái niệm mờtrong khi các giá trị cụ thể của các thuộc tính lại là giá trị không mờ hoặc cũng có thể làcác biến ngôn ngữ nhưng được xử lý như một đơn giá trị
Tiếp cận trên cơ sở tính khả năng (The possibility – based approach)
Tiếp cận này do Prade và Testemale đưa ra đầu tiên vào năm 1983, Zemankova đưa
ra năm 1984 Theo đó các giá trị thuộc tính bị mờ hoá bằng việc cho phép các phân phốikhả năng xuất hiện như một giá trị thuộc tính Nghĩa là:
Một quan hệ R là một tập con của Π(D1)×Π(D2)× ×Π(Dn), với Π(Di)={π|π là mộtphân phối khả năng của Ai trên Di}
Một n bộ t∈R có dạng (π1, π2,…, πn), πAi∈Π(Di) Ngoài ra còn có thêm phần tử đặcbiệt e để chỉ những giá trị không thể áp dụng Như vậy πAi được định nghĩa là một hàm xácđịnh từ (Di∪e) lên [0,1]
Theo mô hình này các giá trị thuộc tính được làm mờ hóa bằng việc cho phép cácphân phối khả năng xuất hiện như một giá trị thuộc tính
Vào năm 1989 và 1991, Rundensteiner, Hawkes, Bandler và Chen đã mở rộng môhình này bằng cách thêm vào một quan hệ ci xác định trên mỗi miền Di thể hiện mối quan
hệ “gần nhau” giữa các phần tử của miền, ci: Di×Di→[0,1] là một quan hệ mờ hai ngôi trên
Di thỏa các tính chất:
Phản xạ: ci(x,x)=1
Đối xứng : ci(x,y)=ci(y,x)
Tiếp cận dựa trên xấp xỉ ngữ nghĩa (The semantic proximity approach)
Cách tiếp cận này do Wei-Yi-Lin đưa ra để đo mức độ xấp xỉ về mặt ngữ nghĩa giữahai giá trị Hàm xấp xỉ SP có các tính chất sau:
0 ≤ SP(f1, f2) ≤ 1,
SP(f1, f2) = SP(f2, f1),
Trang 4Nếu a1=a2, b1=b2, c1=c2, d1=d2 và |d1-c1|>|b1-a1| thì SP(f1,f2)≥SP(g1,g2).
Đối với mô hình này, khi so sánh hai bộ thì phải so sánh về mặt ngữ nghĩa Nói cáchkhác, hai bộ được gọi là bằng nhau nếu độ xấp xỉ ngữ nghĩa của chúng vượt quá mộtngưỡng nào đó
Tiếp cận phối hợp (The combined approach)
Với cách tiếp cận này, sẽ áp dụng việc mờ hoá cả trong sự thuộc vào một quan hệcủa một bộ cũng như tính mờ trong các giá trị thuộc tính hay mối quan hệ giữa các phần tửcủa miền Theo Van Schooten và Kere (1988), giá trị thuộc tính là các phân phối khả năng
và mỗi bộ được gán cho một cặp (p, n) để biểu diễn một cách tương ứng các khả năng cóthể thuộc quan hệ và khả năng không thể thuộc quan hệ của bộ này Như vậy một n-bộ códạng: (πA1, πA2, πAn, pt, nt), πAi ∈Π(Di)
Ở đây, giá trị tại các thuộc tính không cần phải là giá trị nguyên tố, một đơn giá trị,nhưng phải được đánh giá “gần nhau” ở cấp độ nào đó
2 Mô hình CSDLQH dựa trên tính tương tự
Mô hình CSDLQH dựa trên tính tương tự do P.Buckles và E.Petry đưa ra lần đầutiên vào năm 1983 Đây là việc mở rộng và làm mờ hoá CSDLQH truyền thống đã đượcCodd đưa ra vào cuối những năm 70
Trong mô hình này, các miền giá trị của CSDL hoặc là vô hướng rời rạc, hoặc là tập
số rời rạc lấy từ những tập vô hạn hay hữu hạn Giá trị miền (giá trị tại một thuộc tính) củamột bộ cũng có thể là một giá trị vô hướng (đơn) hay một dãy gồm nhiều giá trị vô hướng.Quan hệ bằng nhau ở đây được thay thế bởi một quan hệ tương tự được mô tả tường minh
Trang 5mà quan hệ bằng nhau trong mô hình CSDLQH truyền thống chỉ là một trường hợp riêngcủa nó.
3.Bắc cầu SD(x, z)≥Maxy(Min[SD(x, y), SD(y, z)])
Một giá trị thuộc tính dij, trong đó i là chỉ số của bộ thứ i, được định nghĩa là một tậpcon không rỗng của miền tương ứng Dj Dùng kí hiệu 2Dj để chỉ tập tất cả các tập conkhông rỗng của Dj
Định nghĩa 1.2 Một quan hệ mờ r, là một tập con của tích Đề-các 2D1×…×2Dm
Định nghĩa 1.3 Một bộ t của một quan hệ mờ là một phần tử của tập 2D1×…×2Dm
Một cách tổng quát, một bộ ti∈r có dạng: ti=(di1, di2,…, dim), dij⊆Dj
Định nghĩa 1.4 Một thể hiện ℑ={a1, a2,…, am} của một bộ ti=(di1, di2…, dim) là bất cứ mộtphép gán nào sao cho aj∈dij ∀j=1, 2,…, m
Không gian thể hiện là D1 × D2 × × Dm và bị giới hạn bởi tập các bộ hợp lệ trongquan hệ mờ Các bộ hợp lệ được xác định dưới ngữ nghĩa của quan hệ này TrongCSDLQH truyền thống thì bộ t trùng với thể hiện của chính nó
Định nghĩa 1.5 Ngưỡng tương tự của một miền Dj của một quan hệ (mờ) được kí hiệu làThres(Dj) và được xác định như sau:
Thres(Dj)≤min{min[sj(x,y)]}
i x,y∈dijtrong đó i=1, 2, là chỉ số của bộ
Có thể thấy được rằng, CSDLQH truyền thống chính là trường hợp đặc biệt củaCSDL mờ khi ngưỡng Thres(Dj)=1 với mọi j
Trang 6Trên cơ sở các ngưỡng tương tự đã cho trên mỗi miền trị thuộc tính, tính dư thừa dữliệu của một quan hệ trong mô hình này được xác định và đại số quan hệ được xây dựng.Định nghĩa 1.6 Trong quan hệ mờ r, hai bộ ti=(di1, di2,…, dim) và tk=(dk1, dk2,…, dkm), i≠kđược coi là thừa đối với nhau nếu ∀j=1, 2,…,m:
Thres(Dj)≤min[sj(x,y)]
x,y∈dij∪dkjtrong đó: Thres(Dj)≤min{min[sj(x,y)]}, i=1, 2,… là chỉ số của bộ
i x,y∈dijNhư vậy, mỗi bộ có thể tương ứng với một số lớn các thể hiện Tuy nhiên, với quanniệm về dư thừa dữ liệu như trên, mô hình CSDLQH này vẫn tương thích với CSDLQHtruyền thống Ở đây, không cho phép tồn tại hai bộ có chung một thể hiện
2.2 Đại số quan hệ
Các phép toán quan hệ mờ cũng gồm bốn thành phần (toán tử quan hệ, thuộc tính,tên quan hệ, điều kiện) như trong mô hình quan hệ truyền thống thêm vào đó là một câuxác định ngưỡng tương tự áp dụng cho phép toán này
Kết quả cuối cùng của phép toán quan hệ là một quan hệ đạt được bằng việc trộn các
bộ thừa (tức là hợp các giá trị thuộc tính tương ứng) cho đến khi không còn bộ thừa
Một bộ được coi là nằm trong quan hệ kết quả của phép giao hai quan hệ sẽ là một
bộ thuộc một trong hai quan hệ này và có thể được trộn với một bộ nào đó thuộc quan hệkia mà không vi phạm các ngưỡng tương tự đã cho trước
Phép hợp hai quan hệ cho kết quả là một quan hệ đạt được sau khi đã loại bỏ các bộthừa của tập gồm tất cả các bộ thuộc quan hệ này và tất cả các bộ thuộc quan hệ kia
Các phép chiếu, hợp và giao cho kết quả duy nhất Phép chiếu và phép hợp chỉ khácCSDLQH truyền thống ở cách thức loại bỏ các bộ thừa
2.3 Phụ thuộc hàm
Để mở rộng khái niệm phụ thuộc hàm cho CSDLQH dựa trên tính tương tự, trướchết khái niệm về độ tương tự giữa hai bộ cần phải được xác định
Trang 7Định nghĩa 1.7 Cho một miền Dk của một quan hệ r, độ tương tự của hai bộ ti và tj trên Dkđược định nghĩa là:
Ts[Dk(ti,tj)]=Min(sk(p,q))
p,q∈dik∪djk
Ở đây dik và djk là giá trị của bộ ti và bộ tj trên thuộc tính thứ k của quan hệ r, cónghĩa là dik và djk đều là tập con của Dk Trong CSDLQH truyền thống cả dik và djk đều chỉgồm một phần tử, khi đó độ tương tự của hai bộ bất kỳ chỉ có thể là một nếu hai bộ này cógiá trị trùng nhau ở mọi thuộc tính, nếu không độ tương tự của chúng phải bằng 0 Nhưvậy:
Thres(Dk)=Min{Ts [Dk (ti,tj)]}
∀i,j Một phụ thuộc hàm trong mô hình này là một mở rộng trực tiếp phụ thuộc hàm trongCSDLQH truyền thống
Định nghĩa 1.8 Nếu A và B là hai thuộc tính của một quan hệ r thì ta nói r thoả phụ thuộchàm A→B nếu với mọi bộ ti, tj: Ts[A(ti,tj)]≤Ts[B(ti,tj)]
Định nghĩa 1.9 Nếu X và Y là hai thuộc tính của một quan hệ r thì ta nói r thoả phụ thuộchàm X→Y nếu với mọi bộ ti, tj:
Khuynh hướng thứ nhất là sử dụng nguyên lý thay thế quan hệ đồng nhất thôngthường của các giá trị trong cùng một miền (giá trị thuộc tính) bởi các độ đo về sự “giốngnhau” giữa chúng Tính không chính xác của những giá trị dữ liệu ẩn trong việc sử dụng
Trang 8các quan hệ mờ được cho bởi những bảng tách riêng Khuynh hướng này cho phép coi mộttập các giá trị nào đó như một thể hiện có thể (hay một xấp xỉ về mặt ngữ nghĩa) của mộtđơn giá trị Mô hình CSDLQH được mở rộng theo khuynh hướng này có thêm khả nănglàm việc (lưu trữ và xử lý) với những thông tin không chính xác.
Khuynh hướng thứ hai là dùng phân phối khả năng như một rằng buộc mờ về các giátrị có thể lấy cho một bộ trên một thuộc tính Tính không chắc chắn của dữ liệu được thểhiện tường minh nhờ các phân phối khả năng Các mô hình CSDLQH được mở rộng theokhuynh hướng này cho phép biểu diễn không chỉ các thông tin chính xác, chắc chắn mà cả
những thông tin không chắc chắn, những giá trị null.
Tuy nhiên việc lưu trữ và thao tác trên những thông tin trong các mô hình CSDLQHđược mở rộng theo hai khuynh hướng này thực sự phức tạp với quá nhiều phép tính toán
Để có được những mô hình mở rộng của CSDLQH có khả năng mạnh mẽ trong việclưu trữ và xử lý cả những giá trị có thể không chính xác khi biểu diễn thông tin lẫn nhữnggiá trị thể hiện thông tin không chắc chắn, giải pháp đưa ra là phối hợp cả hai khuynhhướng trên Tuy có được một mô hình cho phép nắm bắt thông tin không đầy đủ ở tìnhhuống tổng quát song điều này càng làm cho mô hình trở nên phức tạp cả ở lưu trữ lẫn xửlý
Có thể nhận thấy rằng, mô hình của hai tác giả P.Buckles và E.Petry khác vớiCSDLQH truyền thống ở hai điểm quan trọng: giá trị tại mỗi thuộc tính của một đối tượng
có thể là một tập và trên mỗi một miền của thuộc tính có một quan hệ mờ thể hiện cấp độtương tự giữa các phần tử của miền Trong mô hình này, tuy giá trị của mỗi bộ tại mỗithuộc tính có thể chứa một hay nhiều phần tử của miền tương ứng, nhưng có một ràng buộc
là các phần tử trong cùng một giá trị thuộc tính (của cùng một đối tượng) phải đủ tương tựvới nhau nghĩa là cấp độ tương tự của một cặp bất kỳ các phần tử trong cùng giá trị thuộctính không nhỏ hơn ngưỡng tương tự đã xác định Cách mở rộng mô hình CSDL của haitác giả này thuộc khuynh hướng thứ nhất trong hai khuynh hướng cơ bản đã nêu ở trên,nhằm mục đích có được khả năng biểu diễn thông tin không chính xác Mặc dù giá trị của
Trang 9mỗi bộ tại mỗi thuộc tính là một tập nhưng các phần tử trong tập này đều được coi lànhững thể hiện (có thể không chính xác) của một giá trị đơn.
Chương II Mở rộng mô hình CSDLQH dựa trên tính tương tự
Chương này sẽ dành để trình bày mô hình CSDLQH dựa trên tính tương tự do TS
Hồ Cẩm Hà đề xuất Nội dung của chương được chia thành năm phần Phần thứ nhất sẽnêu lên các khái niệm cơ sở của mô hình, dựa trên các khái niệm đó trong phần hai sẽ trìnhbày các phép toán đại số quan hệ Phần ba sẽ nêu lên các quy tắc cập nhật dữ liệu, phầntiếp theo sẽ đề xuất một ngôn ngữ hỏi cho mô hình này và phần cuối cùng sẽ trình bày vềcác phụ thuộc dữ liệu
1 Mở rộng mô hình CSDLQH của P.Buckles và E.Petry
Như đã nêu trong phần nhận xét của Chương I, trong mô hình CSDLQH dựa trêntính tương tự của P.Buckles và E.Petry mặc dù giá trị của mỗi bộ tại mỗi thuộc tính là mộttập nhưng các phần tử trong tập này đều được coi là những thể hiện của một giá trị đơn.Trong công trình nghiên cứu của mình TS Hồ Cẩm Hà đã đưa ra một mô hình CSDLQH
kế thừa ý tưởng của hai tác giả trên, nhưng cho phép các phần tử của mỗi bộ tại mỗi giá trịthuộc tính không bị đòi hỏi đủ tương tự theo ngưỡng Điều này cho phép mỗi giá trị thuộctính chứa các phần tử biểu diễn những khả năng rất khác xa nhau có thể xảy ra bởi nhữnggiá trị không hề tương tự
Trang 10Khi mô hình hoá một CSDLQH theo cách này sẽ không chỉ cho phép nắm bắt nhữngthông tin không chính xác mà cả những thông tin không chắc chắn Sự phân tách thành cáckhả năng thực chất là nhờ vào độ đo tương tự trên mỗi miền và ngưỡng đặt ra Bởi vậynhững thông tin không chắc chắn thể hiện bằng sự tồn tại của những giá trị mà độ tương tựgiữa chúng nhỏ hơn ngưỡng đã cho chứ không biểu diễn bằng các phân phối khả năng.
Theo một nghĩa nào đó, nếu coi các phần tử đủ tương tự với nhau (theo ngưỡng chobiết) thuộc về cùng một khả năng có thể xảy ra thì mô hình của P.Buckles và E.Petry chỉcho phép nắm giữ thông tin của những đối tượng mà với những đối tượng này thông tinbiết được về mỗi thuộc tính chỉ thuộc về một khả năng (tương tự của một đơn giá trị) Tuynhiên trong cuộc sống có thể gặp những thông tin không chắc chắn về một đối tượng màtrên một thuộc tính có thể xảy ra nhiều khả năng
Mô hình mới đã khắc phục những hạn chế trên do có các đặc tính sau: mỗi miền trịthuộc tính được gắn với một độ đo “sự tương tự” của cặp hai phần tử bất kỳ của miền trịnày; thông tin về một đối tượng được thể hiện bởi một bộ trong quan hệ; giá trị của một bộtại một thuộc tính có thể là một tập gồm nhiều phần tử và được phân hoạch thành các lớptương đương bao gồm các phần tử “đủ” tương tự (theo ngưỡng); có thể quan niệm rằng cácphần tử trong một lớp tương đương là những thể hiện không chính xác của một giá trị đơnhoặc cũng có thể coi mỗi lớp tương đương thể hiện một khả năng có thể xảy ra
Ngữ nghĩa của mỗi bộ trong mô hình mới sẽ được trình bày trong phần dưới đây,một quan điểm tương ứng về dư thừa dữ liệu cũng được phát biểu Khai niệm về bộ dưthừa rất quan trọng vì nó là cơ sở để xây dựng các qui tắc cập nhật dữ liệu, các phép toánquan hệ và khái niệm các phụ thuộc hàm
1.1 Ngữ nghĩa của một bộ, quan niệm về các bộ thừa trong quan hệ
Cho một lược đồ quan hệ R(U), U là tập hữu hạn các thuộc tính, U = {A1, A2,…,Am} Dj là miền trị của Aj Trên mỗi miền trị Dj có một quan hệ tương tự (với tính chất bắccầu) sj Dùng kí hiệu 2Dj để chỉ tập tất cả các tập con khác rỗng của Dj Một quan hệ mờ r,
là một tập con của tập tích Đề-các 2D1×…×2Dm Một bộ t của một quan hệ mờ là một phần
Trang 11tử của tập 2D1×…×2Dm Một cách tổng quát, một bộ t ∈ r có dạng: t = (d1, d2,…, dm), dj⊆Dj.
Bộ t cung cấp thông tin về một đối tượng O
Giá trị dj của bộ t trên thuộc tính Aj là một tập hợp khác rỗng, sử dụng kí pháp tậphợp, chẳng hạn {a1,a2,…,ak}, trong đó ∀i = 1, 2,…, k, ai ∈ Dj Khi đó có một số cách hiểukhác nhau về ngữ nghĩa của bộ t (trên thuộc tính Aj) như sau:
1 Chỉ một trong số các phần tử của dj là thông tin đúng về O trên Aj (nhưng chưabiết được chính xác là tập con nào) và không có phần tử nào ngoài tập dj là thôngtin đúng về O trên Aj
2 Một tập khác rỗng các phần tử của dj là thông tin đúng về O trên Aj (nhưng chưabiết được chính xác là tập con nào) và không có tập con nào của (Dj-dj) là thôngtin đúng về O trên Aj
3 Thông tin đúng về O trên Aj chỉ có thể là một phần tử của Dj và có thể một trong
số các phần tử của dj là thông tin đúng về O trên Aj
4 Có thể một tập khác rỗng các phần tử của dj là thông tin đúng về O trên Aj
Với một ngưỡng αj của miền Dj, kí hiệu THRES(Dj)=αj, x, y∈Dj, nếu s(x, y)≥αj thìchúng ta viết x∼α jy Rõ ràng ∼α j là một quan hệ hai ngôi trên Dj và:
Bổ đề 2.1 ∼α j là một quan hệ tương đương trên Dj.
Khi đã có một ngưỡng αj xác định trên miền Dj và không sợ nhầm lẫn có thể viết
x∼y thay vì viết đầy đủ x∼α jy.
Trang 12ngưỡng tăng lên số khả năng sẽ không giảm và có thể tăng Với quan niệm về khả năngnhờ vào khái niệm xấp xỉ theo một ngưỡng tương tự giữa các phần tử như vậy, có một sốcách hiểu khác nhau về ngữ nghĩa của bộ t (trên thuộc tính Aj) như sau:
5 Chỉ một trong số các khả năng xuất hiện ở dj là thông tin đúng về O trên Aj(nhưng chưa biết được chính xác là khả năng nào) Không có khả năng nàokhông xuất hiện trong dj lại là thông tin đúng về O trên Aj
6 Một tập con khác rỗng của tập tất cả các khả năng xuất hiện ở dj là thông tin đúng
về O trên Aj (nhưng chưa biết chính xác là tập con nào) và không có tập con khảnăng nào là thông tin đúng về O trên Aj nếu như nó chứa khả năng không xuấthiện ở dj
7 Thông tin đúng về O trên Aj chỉ có thể là một khả năng trong Dj và có thể mộttrong số các khả năng xuất hiện ở dj là thông tin đúng về O trên Aj
8 Có thể một tập khác rỗng các khả năng xuất hiện ở dj là thông tin đúng về O trênAj
Dễ dàng nhận thấy rằng, nếu lấy ngưỡng αj=1.0 thì sẽ có các cách hiểu 1 và 5 trùngnhau, 2 và 6 trùng nhau
Ở đây chỉ xem xét mô hình mở rộng, giới hạn trong cách hiểu 6 đối với kí pháp tậphợp và phần tử trong tập hợp {a1, a2,…, ak}, kí pháp đã được dùng để biểu thị giá trị dj của
bộ t trên thuộc tính Aj
Qui ước:
Dùng d j để chỉ tập tất cả các lớp tương đương của dj được phân hoạch bởi ngưỡng
đã xác định cho Aj Nghĩa là d j={a i/ai∈dj}
Dùng 2D j để chỉ tập tất cả các tập con khác rỗng của tập thương (Dj/∼α j).
Định nghĩa 2.1 Với ngưỡng α=(α1, α2,…, αm) Một thể hiện khả năng theo α, Tα=(v1, v2,
…, vm) của một bộ t=(d1, d2,…, dm) là bất cứ phép gán nào sao cho ∀i=1, 2,…, m: ∅≠vi⊆d i
Trang 13
Định nghĩa 2.2 Ngữ nghĩa theo ngưỡng α của một bộ t, kí hiệu là Sp(t)α, là tập tất cả cácthể hiện khả năng theo α của bộ t.
Ví dụ 2.1:
Cho quan hệ t như dưới đây:
{a1, a2, a3} {b1, b2}
Giả sử với ngưỡng α đang xét thì a1=a3≠a2, b1≠b2 Khi đó sẽ có d A={a1,a2}={a
Trong một CSDL rõ, một bộ được coi là thừa nếu và chỉ nếu nó trùng hoàn toàn vớimột bộ khác Theo quan điểm của P.Buckles và E.Petry, một bộ là thừa nếu có thể trộn nóvới một số bộ khác mà vẫn không vi phạm ngưỡng tương tự đã cho, hay nói cách khác, nếu
nó có chung một thể hiện với một bộ khác Trong mô hình đang xem xét ở đây, hai bộđược coi là thừa với nhau nếu chúng có cùng một tập các khả năng trên mỗi thuộc tính Cóthể hình thức hoá điều này như sau:
Định nghĩa 2.3 Trong quan hệ mờ r, hai bộ ti=(di1, di2,…, dim) và tk=(dk1, dk2,…, dkm), i≠kđược gọi là thừa đối với nhau nếu ∀j=1, 2,…, m, ∀x∈dij ∃x’∈dkj: x∼α jx’ và ngược lại,nghĩa là ∀j=1, 2,…, m, ∀x∈dkj ∃x’∈dij: x∼α jx’ Dùng kí hiệu ti∼αtk để nói rằng ti là thừa đốivới tk theo ngưỡng α, trong đó α=(α1, α2,…,αm).
Trang 14Không có gì là mâu thuẫn khi dùng kí hiệu dij∼αdkj để nói rằng giá trị tương ứng củahai bộ ti, tk trên thuộc tính Aj là dij và dkj tương đương (hay thừa) với nhau Nếu không sợnhầm lẫn có thể viết dij≈dkj thay cho viết dij≈α jdkj.
Bổ đề 2.2 ≈α là quan hệ tương đương trên một quan hệ mờ r
Việc chứng minh tính đúng đắn của bổ đề này rất đơn giản
Như vậy quan hệ ≈α cho một phân hoạch trên r Có thể gọi hai bộ thừa đối với nhau(theo α) là hai bộ tương đương nhau (theo α)
Bổ đề 2.3 Cần và đủ để hai bộ là thừa đối với nhau (theo α) là ngữ nghĩa (theo α) củachúng bằng nhau
Ta cũng có thể dễ dàng chứng minh được bổ đề này
Ví dụ 2.2:
Các hình: Hình 2.1, Hình 2.2, Hình 2.3 dưới đây cho một quan hệ mờ với các quan
hệ tương tự trên các miền thuộc tính
Giả sử ngưỡng α=(0.0, 0.6, 0.8) khi đó ngưỡng của Dom(TÊN) là 0.0, ngưỡng củaDom(Màu xe) là 0.6, ngưỡng của Dom(Nghề nghiệp) là 0.8
Dom(Màu xe) được phân hoạch thành 3 lớp tương đương (ngưỡng 0.6):
{xanh đậm, xanh nhạt, xanh đen}, {hồng, tím, đỏ}, {trắng, kem}
t1t2t3t4t5
AnBìnhPhúcLộcThọ
xanh đậm, xanh nhạt, hồngxanh đen, tím đỏtrắng, hồnghồng, kemxanh đen, đỏ
nhà văn, giáo sưđạo diễn, giáo viênnhà thơnhà thơphi công
Hình 2.1 Một quan hệ mờ.
xanhđậm
xanhnhạt
xanhđen
Trang 15Hình 2.2 Quan hệ tương tự trên Dom(Màu xe).
nhà văn nhà thơ đạo diễn giáo viên giáo sư phi công
Hình 2.3 Quan hệ tương tự trên Dom(Nghề nghiệp).
Dom(Nghề nghiệp) cũng được phân hoạch thành 3 lớp tương đương (ngưỡng 0.8):{nhà văn, nhà thơ, đạo diễn}, {giáo viên, giáo sư}, {phi công}
Như vậy với ngưỡng α cho ở trên thì trong r1, t1 thừa đối với t2 và t3 thừa đối với t4.Việc loại trừ những bộ thừa theo một ngưỡng α trong một quan hệ r được tiến hànhbằng cách trộn những bộ thừa lại với nhau cho đến khi không còn tồn tại hai bộ thừa đốivới nhau nữa
Định nghĩa 2.4 Cho một quan hệ mờ r, hai bộ ti, tk∈r, ti=(di1,di2,…,dim) và tk=(dk1,dk2,
…,dkm) Kết quả của việc trộn hai bộ ti, tk là mộ bộ t sao cho t=(d1,d2,…,dm) và dj=dij∪dkj,
Với quan hệ r1 cho ở Hình 2.1, α=(0.0, 0.6, 0.8), ta có r2=Mα(r1) cho ở Hình 2.4
{An, Bình} {xanh đậm, xanh nhạt, xanh {nhà văn, giáo sư, đạo
Trang 16đen, hồng, tím đỏ} diễn, giáo viên}
Định lý 2.1 Cho một quan hệ mờ trên lược đồ R(U), nếu kết quả của phép trộn Mα trên tập
T gồm các bộ tương đương nhau theo α là một bộ t thì t ttương đương theo α với bất kỳ bộnào trong T
Như vậy, nếu có T={t1, t2, tk}⊆r sao cho ∀i, j∈{1, 2,…, m}: ti≈αtj và t=Mα(T) thì có
Cho r3 trong Hình 2.5, r2 trong Hình 2.4 Với α=(0.0,0.6,0.8), thì r3≅αr2
{An, Bình} {xanh đậm, xanh nhạt,
Trang 17{Thọ, Lộc} {xanh đen, đỏ} {phi công}
Hình 2.5 Quan hệ r 3
1.2 Các giá trị NULL
Trong nghiên cứu về CSDL theo mô hình quan hệ, thông tin không đầy đủ được biểudiễn bằng các giá trị null Nhiều người sử dụng thuật ngữ này với những ý nghĩa khácnhau Nói chung có các trường hợp như sau:
1) Những giá trị không tồn tại, thường kí hiệu là ⊥ Nếu ⊥ xuất hiện ở bộ t ứng vớimột thuộc tính A thì điều đó được thể hiểu là bất cứ một phần tử nào ở Dom(A)cũng không thể là giá trị của bộ t trên thuộc tính A Nói cách khác, bộ t là thôngtin về một đối tượng mà đối tượng này không thể xét thuộc tính A Ví dụ, khôngthể có tên cơ quan của một người đang thất nghiệp
2) Những giá trị tồn tại nhưng chưa biết tại thời điểm đang xét, thường kí hiệu là D.Nếu D xuất hiện ở bộ t tương ứng với một thuộc tính A thì điều đó được hiểu làbất cứ một phần tử nào thuộc Dom(A) cũng có thể là giá trị của bộ t trên thuộctính A Nói cách khác, biết rằng bộ t có một giá trị trên thuộc tính A nhưng giá trị
đó là gì thì chưa xác định được Ví dụ biết An đi làm bằng xe của anh ta nhưngkhông hề biết xe anh ta màu gì
3) Không có thông tin về một thuộc tính A của bộ t, chúng ta không biết một giá trịxác định, lại cũng không rơi vào tình huống nào trong hai loại null kể trên Chẳnghạn chúng ta không biết nhà An có điện thoại hay không khi xét thuộc tính điệnthoại của An
Để tăng cường khả năng biểu diễn thông tin không đầy đủ cho mô hình đã đề xuất,chúng ta sử dụng hai kí hiệu null D và ⊥ cho trường hợp 1) và 2) Có thể dùng <D, ⊥> đểnói rằng có hai khả năng 1) và 2) cho giá trị trên thuộc tính đang xét, không xác định đượcthực tế rơi vào tình huống nào, đây chính là trường hợp 3)
Ví dụ 2.4:
Quan hệ rnull cho trong Hình 2.6 sẽ giải thích rõ hơn ý nghĩa của hai kí hiệu null đã
sử dụng ở trên
Trang 18TÊN MÀU XE NGHỀ NGHIỆP
An xanh đậm, xanh nhạt, hồng bác sĩ, nha sĩ, kế toán
Hình 2.6 Quan hệ r null
Nhìn vào quan hệ rnull, có thể thấy rõ được ý nghĩa của các kí hiệu null đã sử dụng
Cụ thể, những thông tin trong bảng trên cho biết Bắc có thể không có xe mô tô và cũng cóthể có, nếu có thì xe của anh ta phải có màu xanh đậm hoặc xanh nhạt Không biết Bắc cónghề nghiệp hay không (thất nghiệp) Yến có xe nhưng không biết một chút gì về màu xecủa cô ấy, Yến không có nghề nghiệp
Ở đây, giới hạn rằng các kí hiệu null không được xuất hiện trong các giá trị củathuộc tính là khoá Và khi cho phép sử dụng kí hiệu null trong các giá trị thuộc tính, cầnthiết phải xác định lại qui tắc cú pháp viết giá trị của một bộ trên một thuộc tính cùng vớingữ nghĩa tương ứng
Định nghĩa 2.6 (Biểu thức trị của một bộ trên một thuộc tính Aj)
∀a∈Dj, {a} là một biểu thức tập hợp của Dj,
Nếu M là một biểu thức tập hợp của Dj thì ∀a∈Dj, M∪{a} là một biểu thức tập hợpcủa Dj,
.M ọi biểu thức tập hợp của Dj đều là biêu thức trị trên Aj,
.Nếu M là một biểu thức tập hợp của Dj thì <M, ⊥> là biểu thức trị trên Aj,
.<D> là biểu thức trị trên Dj, <⊥> là biểu thức trị trên Aj,
.<D, ⊥> là biểu thức trị trên Aj
Định nghĩa 2.7 (Thể hiện khả năng của một bộ trên một thuộc tính Aj)
Một thể hiện khả năng của một bộ t trên một thuộc tính Aj theo ngưỡng αj được xácđịnh một cách tương ứng trong các trường hợp của biểu thức trị dj của bộ t trên thuộc tính
Aj như sau:
Nếu dj là một biểu thức tập hợp M của Dj, thì ∀v, ∅≠v⊆M , v là một thể hiện khảnăng của t trên Aj theo αj, với M =M/∼α j,
Trang 19Nếu dj=<M, ⊥>, trong đó M là biểu thức tập hợp của Di thì ∀v, ∅≠v⊆M, v là mộtthể hiện khả năng của t trên Aj và {∅} cũng là một thể hiện khả năng của t trên Aj,
Nếu dj=<D> thì ∀v∈2Dj, v là một thể hiện khả năng của t trên Aj,
.Nếu dj=<⊥> thì {∅} là một thể hiện khả năng của t trên Aj,
.Nếu dj=<D, ⊥> thì ∀v∈2Dj, v là một thể hiện khả năng của t trên Aj và {∅} cũng làmột thể hiện khả năng của t trên Aj
Định nghĩa 2.8 (Thể hiện khả năng của một bộ)
Với ngưỡng α=(α1, α2,…, αm) Một thể hiện khả năng theo α, Tα=(v1, v2,…, vm) củamột bộ t=(d1, d2,…, dm) là bất cứ phép gán nào sao cho ∀i=1, 2,…, m: vi là một thể hiệnkhả năng của bộ t trên Ai (theo αi).
Định nghĩa 2.9 Ngữ nghĩa theo ngưỡng α của một bộ t, kí hiệu là Sp (t)α, là tập tất cả cácthể hiện khả năng theo α của bộ t
Ví dụ 2.5:
Cho quan hệ sau:
t a1, a2 b1, b2, ⊥
Giả sử với ngưỡng α đang xét thì a1=a2, b1≠b2
Các thể hiện khả năng theo α có thể có của bộ t là:
1) ({a1}, {b1, b2})
2) ({a1}, {b1})
3) ({a1}, {b2})
4) ({a1}, ∅)
Như vậy ngữ nghĩa Sp(t)α là tập gồm 4 thể hiện khả năng kể trên
Nếu cho phép kí hiệu null xuất hiện trong biểu thức trị của một bộ trên một thuộctính thì khái niệm hai bộ thừa (hay tương đương) với nhau trước đây cần được mở rộng.Định nghĩa 2.10 (Hai bộ tương đương với nhau trên một thuộc tính)
Trong quan hệ mờ r, hai bộ t=(d1, d2,…, dm) và t’=(d1’, d2’,…, dm’) được coi là tươngđương đối với nhau trên Aj theo αj nếu rơi vào một trong những trường hợp sau:
Trang 20dj và dj’ đều là các biểu thức tập hợp của Dj thoả mãn điều kiện sau đây: ∀x∈dj’
∃x’∈dj: x ∼α jx’ và ngược lại, nghĩa là ∀x∈dj ∃x’∈dj’: x ∼α jx’.
dj và dj’ đều chỉ chứa kí hiệu null và cùng chứa các kí hiệu null như nhau Cụ thể là:dj=dj’=<D> hoặc dj=dj’=<⊥> hoặc dj=dj’=<D, ⊥>
dj=<M, ⊥> và dj’=<M’, ⊥> trong đó M và M’ đều là biểu thức tập hợp trên Dj và
M∼α jM’ (theo(1)).
Dùng kí hiệu dj≈α jdj’ để nói rằng dj tương đương (thừa) đối với dj’ trên Aj theongưỡng αj.
Định nghĩa 2.11 (Hai bộ tương đương với nhau)
Trong quan hệ mờ r, hai bộ t=(d1, d2,…, dm) và t’=(d1, d2,…, dm) được coi là thừa đốivới nhau theo ngưỡng α=(α1, α2,…, αm) nếu ∀j=1, 2,…, m, dj≈α jdj’ Dùng kí hiệu t≈αt’ đểnói rằng t thừa đối với t’
Theo các định nghĩa 2.9 và 2.11 có thể dễ dàng chứng minh được phát biểu của bổ
đề 2.3 vẫn đúng trong trường hợp cho phép kí hiệu null xuất hiện
Bổ đề 2.6 Cần và đủ để hai bộ là thừa đối với nhau (theo α) là ngữ nghĩa (theo α) củachúng là bằng nhau
Nội dung của Định lý 2.1 phát biểu cho trường hợp không có kí hiệu null, rằng việctrộn các bộ tương đương với nhau sẽ cho kết quả là một bộ tương đương với một bộ bất kỳ
đã tham gia vào phép trộn, vẫn đúng trong trường hợp có kí hiệu null
2 Mở rộng các phép toán quan hệ
2.1 Mở rộng phép hợp
Cho r1 và r2 là hai quan hệ trên cùng một lược đồ R(U) Hợp theo ngưỡng α của r1 và r2
là một quan hệ kí hiệu là r1∪αr2 được xác định như sau:
r1∪αr2=Mα(r1∪r2)
Tính chất của phép hợp:
Trang 21Từ định nghĩa của phép hợp (với ngưỡng α) trên đây, kết hợp với bổ đề 2.3 về kếtquả trộn các bộ thừa với nhau không phụ thuộc thứ tự trộn, dễ suy ra phép hợp có tính giaohoán và kết hợp Nghĩa là:
r∪αs=s∪αr
(r1∪αr2)∪αr3=r1∪α(r2∪αr3)
2.2 Mở rộng phép giao
Cho r1 và r2 là hai quan hệ trên cùng một lược đồ R(U) Giao theo ngưỡng α của r1, r2
là một quan hệ kí hiệu là r1∩αr2 được xác định như sau:
αr2): t1≈αt’ Thật vậy, giả sử có t’∈(r1-αr2) sao cho t1≈αt’, khi đó do tính bắc cầu của ≈α
chúng ta có t2≈αt’, điều này mâu thuẫn với giả sử phản chứng t’∈(r1-αr2) Như vậy
∀t∈r1∩αr2, ∃t1∈(r1-α(r1-αr2): t ≈α t1.
b) Với t∈(r1-α(r1-αr2)) thì:
Trang 22Ví dụ 2.6:
Cho 2 quan hệ r1 (Hình 2.10) và r2 (Hình 2.11) trên lược đồ R(A, B, C), và các quan
hệ tương tự trên các miền ở các hình : Hình 2.7, Hình 2.8, Hình 2.9
Trang 24Hình 2.15 r 2 ,α[B].
2.5 Mở rộng phép tích Đề-các
Cho r và s là hai quan hệ tương ứng trên các lược đồ R(A1, A2,…, Am) và S(A’1, A’2,
…, A’n ) Tích Đề-các theo ngưỡng α của r và s là một quan hệ trên lược đồ (A1, A2,…,
Am, A’1, A2,…, An) kí hiệu là r×αs, được xác định như sau:
r×αs=Mα(r×s)
2.6 Mở rộng phép chọn
Định nghĩa phép giao khả năng
Cho di và di’ là hai biểu thức tập hợp trên Di, giao khả năng của di và di’ theo ngưỡng
αi là một biểu thức tập hợp trên Di hoặc là tập ∅, kí hiệu là di∩P
α idi’, được xác định nhưsau:
di∩P
α idi’={a∈di/∃a’∈di’: a∼α ia’}∪{a’∈di: a ∼α ia’}.
Có thể chứng minh được rằng nếu (di∩P
α idi’) là biểu thức tập hợp trên Di (nghĩa là ≠∅) thìngữ nghĩa của nó chính là ngữ nghĩa (theo αi) của di giao với ngữ nghĩa (theo αi) của di’.
Định nghĩa biểu thức của phép chọn
Trang 251) Một phát biểu fi có dạng (αi.Ai : d) là một biểu thức với αi∈[0, 1], Ai là tên mộtthuộc tính, Di là miền tương ứng của thuộc tính Ai, d⊆Di.
2) Một phát biểu fi có dạng NOT(αi.Ai : d) là một biểu thức với αi ∈[0, 1], Ai là tên
một thuộc tính, Di là miền tương ứng của thuộc tính Ai, d⊆Di
3) Nếu P, Q là hai biểu thức thì P AND Q là biểu thức, P OR Q là biểu thức
Cho r là một quan hệ trên lược đồ R, phép chọn trên r với biểu thức chọn đã chođược xác định như sau:
4) Nếu F có dạng (P OR Q) thì σF (r)= σP(r)∪σQ(r)
Trang 26Dễ dàng thấy rằng, nếu quan hệ r không có bộ thừa theo ngưỡng β=(β1, β2,…, βm) thìcác quan hệ kết quả σF(r) và σF(r) được xác định như trên cũng không có bộ thừa theongưỡng β.
Ví dụ 2.7:
Cho quan hệ mờ r3 như ở Hình 2.16 cùng các quan hệ tương tự trên các miền tươngứng cho trong Hình 2.2 và Hình 2.3
t1 An xanh đậm, xanh nhạt, hồng nhà văn, giáo sưt2 Bình xanh đen, tím đỏ đạo diễn, giáo viên
Hình 2.16 Quan hệ r 3
F1=(0.8 Màu xe: {xanh đậm, đỏ}) AND (0.8 Nghề nghiệp: {nhà văn, giáo viên}).F2=(0.8 Màu xe: {xanh đậm, đỏ}) OR (0.8 Nghề nghiệp: {nhà văn, giáo viên}).F3=(0.8 Màu xe: {xanh đậm, đỏ}) AND (NOT (0.8 Nghề nghiệp: {nhà văn, giáoviên}))
có thể tương tự với nghề “nhà văn” hay nghề “giáo viên”
Chọn chặt σF2(r3) chon thông tin về những người mà màu xe chỉ có thể là hai màutương tự với màu “xanh đậm” và màu “màu đỏ” và những người nghề nghiệp chỉ có thể là
Trang 27tương tự với nghề “nhà văn” hay “giáo viên” Trong khi đó chọn không chặt σF2(r3) sẽ chọnnhững người có khả năng màu xe tương tự với màu “xanh đậm” hay “màu đỏ” và nhữngngười có khả năng nghề nghiệp tương tự với nghề “nhà văn” hay nghề “giáo viên”.
2.7 Mở rộng phép kết nối tự nhiên
Tương ứng với hai phép chọn, có hai phép kết nối tự nhiên: kết nối tự nhiên chặt(gọi tắt là phép kết nối hay phép kết nối tự nhiên) và kết nối tự nhiên không chặt (gọi tắt làphép kết nối không chặt)
Cho r và s là hai quan hệ tương ứng trên hai lược đồ R(U1) và R(U2), U1∩U2≠∅ ĐặtU=U1∪U2, X=U1∩U2, X1=U1-X, X2=U2-X
b) Kết nối tự nhiên không chặt:
Kết nối tự nhiên không chặt theo αX của r với s là một quan hệ trên lược đồ R(U) kíhiệu là rαXs, được xác định như sau:
Hình 2.17 Quan hệ r 4
Trang 28Căn cứ vào các quan hệ tương tự cho ở Hình 2.7, 2.8, 2.9 sự phân lớp tương đươngtrên miền trị các thuộc tính A, B, C theo các ngưỡng tương ứng 0.4, 0.6, 0.8 được biểu diễn
ở Hình 2.18 Hình 2.19 cho sự phân lớp tương đương trên miền trị của thuộc tính D, E
Hình 2.19 Các lớp tương đương trên miền trị của D, E.
Với các quan hệ r1 ở Hình 2.10, quan hệ r4 ở Hình 2.17, tích đề các của r1 với r4 theongưỡng α=(αA, αB, αC, αD, αE)=(0.4, 0.6, 0.8, 0.7, 0.9) là quan hệ r6 ở Hình 2.20.
a1 b1, b3 c1, c2 d1, d2 e1, e3a1 b1, b3 c1, c2 d2, d3 e2
Trang 29Tính chất của phép kết nối tự nhiên:
Cả hai phép kết nối chặt và không chặt đều có tính kết hợp và giao hoán
2.8 Phép tính quan hệ trong trường hợp có kí hiệu NULL
Khi xem xét các phép tính quan hệ ở trường hợp có sử dụng kí hiệu null trong cácgiá trị thuộc tính, có một số nhận xét sau:
1) Giá trị của một bộ trên một thuộc tính, chẳng hạn {a1, a2,…, at} có thể đã kể hếtcác lớp tương đương do ngưỡng αj phân hoạch Dj, nghĩa là về mặt ngữ nghĩa có thể coi {a1,a2,…, at} tương đương với {D}, trong khi đó hệ thống coi {a1, a2,…, at} không tươngđương với {D} Như vậy, trong trường hợp có kí hiệu null D, các định nghĩa về phép hợp,giao, hiệu, chiếu, tích Đề-các, chọn chặt và kết nối chặt nếu giữ nguyên như đã phát biểu(cho trường hợp không có kí hiệu null) có thể có một số nhược điểm sau:
• Kết quả của phép hợp, phép Đề-các, phép chiếu có thể chứa những bộ thừa đốivới nhau (tương đương về ngữ nghĩa) như đã nêu
• Kết quả của phép giao có thể sẽ thiếu mặt một số bộ vì hệ thống coi {a1, a2,…,at} không tương đương với {D}
• Tương tự, việc thực hiện phép hiệu có thể sẽ còn lưu lại một số bộ đáng lẽ bịloại bỏ
• Phép chọn chặt, kết nối chặt có thể sẽ bỏ qua một số bộ do hệ thống coi {a1, a2,
…, at} không tương đương với {D}
2) Nếu giá trị của một bộ trên một thuộc tính là {D}, về mặt ngữ nghĩa có thể coi làgiá trị này đã kể hết các lớp tương đương do ngưỡng αj phân hoạch Dj Nghĩa là các khảnăng chung của một giá trị không chứa kí hiệu null như {a1, a2,…, at} và giá trị {D} chính
là tất cả các khả năng do {a1, a2,…, at} đưa ra Trong khi đó hệ thống đã tính {a1, a2,…,
Trang 30at}∩α j{D}=∅ Như vậy, trong trường hợp có kí hiệu null D, các định nghĩa về phép chọnkhông chặt và phép kết nối không chặt nếu giữ nguyên như đã phát biểu, thì sẽ bỏ qua một
số bộ mà đáng lẽ về mặt ngữ nghĩa những bộ này xứng đáng thuộc quan hệ kết quả
Tương ứng với nhận xét trên, có thể khắc phục như sau:
1) Bổsung cho hệ thống khả năng kiểm tra và quyết định rằng một giá trị {a1, a2,…,at} trên Dj có chứa hết mọi khả năng (với ngưỡng αj) hay không Nghĩa là kiểm tra vàquyết định rằng {a1, a2,…, at} có tương đương với {D} hay không
2) Cần xác định việc lấy giao ∩P
α Ai của hai biểu thức trị trên một thuộc tính (nghĩa làbao gồm trường hợp có kí hiệu null)
Định nghĩa phép giao khả năng (của hai biểu thức trị):
Trên miền trị Di của thuộc tính Ai xét ngưỡng tương tự αi Cho di, di’ tương ứng làbiểu thức trị của t và t’ trên Ai, phép giao khả năng của di và di’ kí hiệu là ∩P
Hình 2.24 Kết quả biểu thức trị trên thuộc tính A i
Qua kiểm tra thấy được rằng biểu thức trị (di∩P
α Aidi’) trên Ai được xác định theobảng trên có ngữ nghĩa (theo αAi) chính là giao của hai ngữ nghĩa của hai biểu thức trị di vàdi’ Tính kết hợp của phép kết nối tự nhiên vẫn còn đúng trong trường hợp có kí hiệu null.2.9 Nhận xét
Các phép toán quan hệ đã được trình bày ở trên thực sự là mở rộng của các phéptoán quan hệ trong CSDLQH truyền thống Khi trở lại điều kiện đơn trị cho mỗi giá trịthuộc tính và lấy ngưỡng tương tự là 1.0, sẽ có lại mô hình cổ điển với đại số quan hệtruyền thống Đặc biệt phép chọn và phép kết nối được chia thành hai mức chặt và khôngchặt cho phép khai thác sự mở rộng về mặt ngữ nghĩa của mỗi bộ trong mô hình mới
Trang 31Trường hợp mọi giá trị thuộc tính được khẳng định chỉ có một khả năng (theo một ngưỡng
đã xác định) thì hai mức chặt và không chặt sẽ trùng nhau
1) Một phép cập nhật cho một quan hệ có trong lưu trữ gốc có thể kích hoạt việc cậpnhật cho Mα(r)
2) Người dùng quan hệ Mα(r) yêu cầu cập nhật một số thông tin để khai thác phục
vụ cho ứng dụng của mình mà những thông tin này không cần hoặc không đượcghi vào lưu trữ gốc
Trong CSDLQH truyền thống, các phép cập nhật thường được đề cập đến là: thêmmột bộ, xoá đi một bộ vốn có trong quan hệ, thay đổi giá trị của một bộ đã có trong quan
hệ, phép thay đổi một bộ có thể biểu diễn qua phép xoá và thêm bộ Khác với CSDLQHtruyền thống, tuy vẫn được nhận diện qua khoá, song mỗi bộ trong quan hệ ở mô hìnhCSDLQH mở rộng đang xem xét thường chứa thông tin không chính xác và không chắcchắn Do vậy giá trị của một bộ đang có mặt trong quan hệ có thể bị thay đổi trong hai tìnhhuống sau:
1) Thực hiện phép CHANGE(r, t[K], t*[K]) Ngữ nghĩa của phép cập nhật này làcác giá trị của bộ t trên các thuộc tính không khoá t[U-K] được đổi thành t*[U-K] Bộ t của quan hệ r được nhận diện bởi giá trị trên khoá t[K] (K là khoá của r).Việc thực hiện phép CHANGE(r, t[K], t*[U-K]) tương với việc thực hiện lần lượt
Trang 32hai phép cập nhật: phép xoá bộ t trong r, phép thêm bộ t’=(t[K], t*[U-K]) vào r.Phép CHANGE(r, t[K], t*[U-K]) được sử dụng khi người dùng coi thông tintrong bộ t’ là mới hơn, phản ánh đúng đắn hơn về chính đối tượng mà thông tintrong bộ t vốn đang thể hiện.
2) Thực hiện phép UPDATE(r, t[K], t’[U-K]) Ngữ nghĩa của phép cập nhật này là:các giá trị của t trên các thuộc tính không khoá t[U-K] được đổi thành t*[U-K].Các giá trị trên thuộc tính không khoá t*[U-K] được hình thành kho đối chiếut[U-K] với t’[U-K], với mục đích chứa những thông tin nói chung là chính xáchơn, chắc chắn hơn so với những thông tin cung cấp bởi bộ t vốn có cũng nhưnhững thông tin cung cấp bởi bộ t’=(t[K], t’[U-K]) mới xuất hiện trong lệnhUPDATE Phép UPDATE(r, t[K], t’[U-K]) được sử dụng khi người dùng coithông tin về một đối tượng (được xác định nhờ khoá) trong hai bộ t và t’ là bìnhđẳng và chính xác về độ chắc chắn
Việc xoá đi một bộ vốn có trong quan hệ hay thêm một bộ mới vào quan hệ đượctiến hành bình thường (như CSDLQH truyền thống) Bộ được xoá phải được chỉ định bởicác giá trị trên các thuộc tính khoá Như vậy chỉ có quy tắc cho phép cập nhật UPDATE làđáng bàn, còn các phép cập nhật còn lại khá đơn giản
Giả sử trên một lược đồ R đã xác định một khoá K (gồm k thuộc tính khoá, khôngmất tính tổng quát giả sử đó là các thuộc tính A1, A2,…, Ak tương ứng với các miền D1, D2,
…, Dk) Đó là tập các thuộc tính mà bất cứ hai bộ nào ”đủ tương tự” trên khoá cũng ”đủtương tự” trên các thuộc tính còn lại
Qui tắc 2.1 (Cho thao tác thêm một bộ vào quan hệ)
Cho INS<(d1, d2,…, dm), (α1, α2,…, αm), r> là một câu lệnh thêm một bộ t=(d1, d2,…,dm) vào quan hệ r của lược đồ R theo ngưỡng tương tự α=(α1, α2,…, αm).
Hệ thống sẽ kiểm tra và thực hiện tương ứng như sau:
1) Nếu trong quan hệ r không có bộ t’ nào để t[K]≈α Kt’[K] thì thêm t vào r,
2) Không xảy ra 1) thì không làm gì cả
Qui tắc 2.2 (Cho thao tác xóa một bộ trong quan hệ)
Trang 33Cho DEL<(d1, d2,…, dm), (α1, α2,…, αm), r> là một câu lệnh xoá khỏi quan hệ r bộ tvới t[K]≈α(d1, d2,…, dm) và ngưỡng tương tự α=(α1, α2,…, αm).
Hệ thống sẽ kiểm tra và thực hiện tương ứng như sau:
1) Nếu trong quan hệ r có bộ t để t[K]≈α(d1, d2,…, dm) thì loại bỏ t khỏi quan hệ r,2) Không xảy ra 1) thì không làm gì cả
Qui tắc 2.3 (Cho thao tác thay đổi giá trị một bộ trong quan hệ)
Cho CHANGE<(d1, d2,…, dm), (α1, α2,…, αm), r> là một câu lệnh thay đổi bộ t trongquan hệ r trên những thuộc tính không khoá, với t được xác định bởi t[K]≈α(d1, d2,…, dk)theo ngưỡng tương tự α=(α1, α2,…, αk)
Hệ thống sẽ kiểm tra và thực hiện tương ứng như sau:
1) Nếu trong quan hệ r có bộ t để t[K]≈α(d1, d2,…, dk) thì lần lượt thực hiện hai phépcập nhật sau:
DEL<(d1, d2,…, dk), (α1, α2,…, αk), r>,
INS<(d1, d2,…, dm), (α1, α2,…, αm), r>.
2) Nếu không xảy ra trường hợp 1) thì không là gì cả
Như đã nói ở trên, phép UPDATE(r, t[K], t’[U-K]) cho quan hệ r nhờ một bột’=(t[K], t’[U-K]) được dùng khi trong quan hệ r đã có bộ t’ cũng cung cấp thông tin vềmột đối tượng O nào đó, giờ đây lại biết thêm bộ t’ cũng cung cấp thông tin về O và coinhư t và t’ bình đẳng về độ chính xác cũng như độ chắc chắn Vì t và t’ là hai bộ thể hiệnthông tin về cùng một đối tượng nên yêu cầu của mô hình này là thông tin trên các thuộctính khoá của hai bộ này phải tương đương: t[K]≈α Kt’[K] Với ngữ nghĩa của một bộ trong
mô hình CSDL đang được xem xét thì: trên mỗi thuộc tính A, bộ t khẳng định rằng thôngtin về O chỉ có các khả năng đã trình nằm trong các khả năng đã trình ra trong t[A], khôngthể xảy ra khả năng nào nằm ngoài những khả năng t[A] đã đưa ra Mỗi khả năng đượct[A] thể hiện bởi một hay một số giá trị xấp xỉ với nhau hiểu theo nghĩa “đủ tương tự” vàcũng có nghĩa là xấp xỉ về tương tự (ở một ngưỡng nào đó) với giá trị chính xác trên thực
tế Tương tự đối với t’ Với một cặp bộ (t, t’) như vậy có 2 khả năng xảy ra: