khái quát về csdlqh với thông tin không đầy đủ

66 422 0
khái quát về csdlqh với thông tin không đầy đủ

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Giới thiệu Trong những năm gần đây, các ứng dụng máy tính cho quản lý ngày càng nhiều. Cách mạng về máy vi tính đã tạo điều kiện để máy tính hỗ trợ tích cực các nhà quản lý, họ có thể truy cập đến hàng ngàn cơ sở dữ liệu ở nhiều vị trí khác nhau để thu thập các thông tin cần thiết. Hầu hết các tổ chức, các công ty đều dùng phân tích có tính toán trong quyết định của mình. Hệ trợ giúp quyết định ngày càng đóng một vai trò quan trọng trong quá trình ra quyết định của các nhà quản lý. Hiện nay mô hình dữ liệu được sử dụng trong các hệ trợ giúp quyết định phổ biến vẫn là mô hình cơ sở dữ liệu quan hệ (CSDLQH) truyền thống. Trong mô hình CSDLQH truyền thống các dữ liệu được lưu trữ đều là dữ liệu rõ. Các phép toán trên CSDL đều được xây dựng dựa trên cơ sở các phép so sánh đơn giản như =, >, ≥, ≤, <, ≠. Trong đó các phép so sánh dùng để so sánh giữa hai biến là hai thuộc tính hoặc giữa một biến là một thuộc tính và một hằng, kết quả cho giá trị “TRUE” hoặc “FALSE” tùy theo mối quan hệ của chúng. Như vậy miền giá trị của biến được so sánh là miền các giá trị rõ và việc so sánh là so sánh chính xác. Tuy nhiên thông tin về thế giới thực cần lưu trữ hay xử lý thường có thể là thông tin không đầy đủ, chúng có thể có nhiều dạng chẳng hạn như: không biết một số thông tin về một đối tượng, thông tin lưu trữ có thể không chính xác, thông tin lưu trữ có thể không chắc chắn hay mờ. Do đó, các nhà quản lý thường phải đối mặt với vấn đề thiếu thông tin trong quá trình ra quyết định, họ phải dùng đến những thông tin không hoàn toàn đầy đủ để rút ra các tri thức tổng hợp, hỗ trợ cho việc ra quyết định. Việc cần thiết phải có một mô hình cơ sở dữ liệu thích hợp để cho phép lưu trữ và xử lý cả những thông tin đầy đủkhông đầy đủ đã được nhiều nhà khoa học quan tâm nghiên cứu. Hiện tại đã có nhiều cách tiếp cận mở rộng đưa dữ liệu mờ vào lý thuyết quan hệ với mong muốn tìm được những mô hình chấp nhận thông tin không đầy đủ, cho phép biểu diễn và khai thác thông tin một cách tốt hơn, tiện lợi hơn trong những lớp bài toán thực tế nào đó. 1 Với mục đích tìm hiểu các mô hình đã được sử dụng để mở rộng CSDLQH, đồ án này sẽ đề cập đến một số cách tiếp cận mờ để mở rộng CSDLQH trong Chương I, trong đó nhấn mạnh vào mô hình CSDLQH dựa trên tính tương tự của hai tác giả P.Buckles và E.Petry. Chương II sẽ trình bày mô hình CSDLQH dựa trên tính tương tự của TS.Hồ Cẩm Hà. Dựa trên các tài liệu tham khảo và các kiến thức đã được học trong môn cơ sở dữ liệu I, trong Chương III tác giả đồ án sẽ mở rộng lý thuyết thiết kế CSDLQH truyền thống để chuẩn hoá lược đồ CSDLQH dựa trên tính tương tự. Cuối cùng, Chương IV sẽ trình bày việc cài đặt một mô đun cho phép thực hiện các thao tác xử lý dữ liệu theo mô hình được đề cập trong Chương II. Chương I. Khái quát về CSDLQH với thông tin không đầy đủ Mô hình quan hệ mặc không phải là mô hình quản trị cơ sở dữ liệu (CSDL) xuất hiện đầu tiên và cũng không phải là mô hình quản trị CSDL tiên tiến nhất nhưng lại đóng vai trò quan trọng và được sử dụng phổ biến nhất hiện nay. Chính vì vậy, việc áp dụng lý thuyết mờ vào mô hình CSDLQH là một trong những xu hướng đã được rất nhiều nhà nghiên cứu quan tâm. Chương này gồm hai phần chính, phần thứ nhất sẽ trình bày tóm tắt một số hướng tiếp cận CSDLQH mờ, phần thứ hai sẽ trình bày tương đối chi tiết cách tiếp cận dựa trên cơ sở tính tương tự của hai tác giả P.Buckles và E.Petry. 1. Một số cách tiếp cận CSDLQH mờ Tiếp cận dựa trên cơ sở quan hệ mờ (The fuzzy relation – based approach) Tiếp cận này do Bladwin và Zhou đưa ra đầu tiên vào năm 1984, Zvieli đưa ra năm 1986. Theo đó quan hệ mờ R⊆D 1 ×D 2 × ×D n được đặc trưng bởi hàm thuộc: µ R : D 1 ×D 2 × ×D n →[0,1]. 2 Như vậy, mỗi bộ của R có dạng t=(u 1 ,u 2 , ,u n ,µ R (u 1 ,u 2 , ,u n )), trong đó u i ∈D i với i=1,2, ,n, µ R (u 1 ,u 2 , ,u n ) chỉ mức độ thuộc quan hệ R của t. Với cách tiếp cận này, khái niệm một bộ thuộc về một quan hệ là một khái niệm mờ trong khi các giá trị cụ thể của các thuộc tính lại là giá trị không mờ hoặc cũng có thể là các biến ngôn ngữ nhưng được xử lý như một đơn giá trị. Tiếp cận trên cơ sở tính khả năng (The possibility – based approach) Tiếp cận này do Prade và Testemale đưa ra đầu tiên vào năm 1983, Zemankova đưa ra năm 1984. Theo đó các giá trị thuộc tính bị mờ hoá bằng việc cho phép các phân phối khả năng xuất hiện như một giá trị thuộc tính. Nghĩa là: Một quan hệ R là một tập con của Π(D 1 )×Π(D 2 )× ×Π(D n ), với Π(D i )={π|π là một phân phối khả năng của A i trên D i }. Một n bộ t∈R có dạng (π 1 , π 2 ,…, π n ), π Ai ∈Π(D i ). Ngoài ra còn có thêm phần tử đặc biệt e để chỉ những giá trị không thể áp dụng. Như vậy π Ai được định nghĩa là một hàm xác định từ (D i ∪e) lên [0,1]. Theo mô hình này các giá trị thuộc tính được làm mờ hóa bằng việc cho phép các phân phối khả năng xuất hiện như một giá trị thuộc tính. Vào năm 1989 và 1991, Rundensteiner, Hawkes, Bandler và Chen đã mở rộng mô hình này bằng cách thêm vào một quan hệ c i xác định trên mỗi miền D i thể hiện mối quan hệ “gần nhau” giữa các phần tử của miền, c i : D i ×D i →[0,1] là một quan hệ mờ hai ngôi trên D i thỏa các tính chất: Phản xạ: c i (x,x)=1. Đối xứng : c i (x,y)=c i (y,x). Tiếp cận dựa trên xấp xỉ ngữ nghĩa (The semantic proximity approach) Cách tiếp cận này do Wei-Yi-Lin đưa ra để đo mức độ xấp xỉ về mặt ngữ nghĩa giữa hai giá trị. Hàm xấp xỉ SP có các tính chất sau: 0 ≤ SP(f 1 , f 2 ) ≤ 1, SP(f 1 , f 2 ) = SP(f 2 , f 1 ), 3 SP(f 1 , f 1 ) ≥ SP(f 1 , f 2 ), Tác giả đưa ra tiêu chuẩn để xây dựng hàm đo xấp xỉ ngữ nghĩa trên số mờ dạng khoảng: Cho f 1 =[a 1 ,b 1 ], f 2 =[a 2 ,b 2 ], g 1 =[c 1 ,d 1 ], g 2 =[c 2 ,d 2 ], SP(f 1 ,f 2 )=1 ⇔ a 1 =b 1 =a 2 =b 2 , SP(f 1 ,f 2 )=0 ⇔ f 1 ∩f 2 =∅, Nếu a 1 =a 2 , b 1 =b 2 , c 1 =c 2 , d 1 =d 2 và |d 1 -c 1 |>|b 1 -a 1 | thì SP(f 1 ,f 2 )≥SP(g 1 ,g 2 ). Đối với mô hình này, khi so sánh hai bộ thì phải so sánh về mặt ngữ nghĩa. Nói cách khác, hai bộ được gọi là bằng nhau nếu độ xấp xỉ ngữ nghĩa của chúng vượt quá một ngưỡng nào đó. Tiếp cận phối hợp (The combined approach) Với cách tiếp cận này, sẽ áp dụng việc mờ hoá cả trong sự thuộc vào một quan hệ của một bộ cũng như tính mờ trong các giá trị thuộc tính hay mối quan hệ giữa các phần tử của miền. Theo Van Schooten và Kere (1988), giá trị thuộc tính là các phân phối khả năng và mỗi bộ được gán cho một cặp (p, n) để biểu diễn một cách tương ứng các khả năng có thể thuộc quan hệ và khả năng không thể thuộc quan hệ của bộ này. Như vậy một n-bộ có dạng: (π A1 , π A2 , π An , p t , n t ), π Ai ∈ Π(D i ). Ở đây, giá trị tại các thuộc tính không cần phải là giá trị nguyên tố, một đơn giá trị, nhưng phải được đánh giá “gần nhau” ở cấp độ nào đó. 2. Mô hình CSDLQH dựa trên tính tương tự Mô hình CSDLQH dựa trên tính tương tự do P.Buckles và E.Petry đưa ra lần đầu tiên vào năm 1983. Đây là việc mở rộng và làm mờ hoá CSDLQH truyền thống đã được Codd đưa ra vào cuối những năm 70. Trong mô hình này, các miền giá trị của CSDL hoặc là vô hướng rời rạc, hoặc là tập số rời rạc lấy từ những tập vô hạn hay hữu hạn. Giá trị miền (giá trị tại một thuộc tính) của một bộ cũng có thể là một giá trị vô hướng (đơn) hay một dãy gồm nhiều giá trị vô hướng. Quan hệ bằng nhau ở đây được thay thế bởi một quan hệ tương tự được mô tả tường minh 4 mà quan hệ bằng nhau trong mô hình CSDLQH truyền thống chỉ là một trường hợp riêng của nó. 2.1. Những định nghĩa cơ sở Định nghĩa 1.1. Một quan hệ tương tự S D (x, y), trên một miền D, là một ánh xạ mọi cặp phần tử của miền vào khoảng đóng [0, 1] thoả ba tính chất sau với mọi x, y, z∈D: 1.Phản xạ S D (x, x)=1 2.Đối xứng S D (x, y) =S D (y, x) 3.Bắc cầu S D (x, z) ≥ Max y (Min[S D (x, y), S D (y, z)]) Một giá trị thuộc tính d ij , trong đó i là chỉ số của bộ thứ i, được định nghĩa là một tập con không rỗng của miền tương ứng D j . Dùng kí hiệu 2 Dj để chỉ tập tất cả các tập con không rỗng của D j . Định nghĩa 1.2. Một quan hệ mờ r, là một tập con của tích Đề-các 2 D1 ×…×2 Dm . Định nghĩa 1.3. Một bộ t của một quan hệ mờ là một phần tử của tập 2 D1 ×…×2 Dm . Một cách tổng quát, một bộ t i ∈r có dạng: t i =(d i1 , d i2 ,…, d im ), d ij ⊆D j . Định nghĩa 1.4. Một thể hiện ℑ={a 1 , a 2, …, a m } của một bộ t i =(d i1 , d i2 …, d im ) là bất cứ một phép gán nào sao cho a j ∈d ij ∀j=1, 2,…, m. Không gian thể hiện là D 1 × D 2 × × D m và bị giới hạn bởi tập các bộ hợp lệ trong quan hệ mờ. Các bộ hợp lệ được xác định dưới ngữ nghĩa của quan hệ này. Trong CSDLQH truyền thống thì bộ t trùng với thể hiện của chính nó. Định nghĩa 1.5. Ngưỡng tương tự của một miền D j của một quan hệ (mờ) được kí hiệu là Thres(D j ) và được xác định như sau: Thres(D j )≤min{min[s j (x,y)]} i x,y∈d ij trong đó i=1, 2, là chỉ số của bộ. Có thể thấy được rằng, CSDLQH truyền thống chính là trường hợp đặc biệt của CSDL mờ khi ngưỡng Thres(D j )=1 với mọi j. 5 Trên cơ sở các ngưỡng tương tự đã cho trên mỗi miền trị thuộc tính, tính thừa dữ liệu của một quan hệ trong mô hình này được xác định và đại số quan hệ được xây dựng. Định nghĩa 1.6. Trong quan hệ mờ r, hai bộ t i =(d i1 , d i2 ,…, d im ) và t k =(d k1 , d k2 ,…, d km ), i≠k được coi là thừa đối với nhau nếu ∀j=1, 2,…,m: Thres(D j )≤min[s j (x,y)] x,y∈d ij ∪d kj trong đó: Thres(D j )≤min{min[s j (x,y)]}, i=1, 2,… là chỉ số của bộ. i x,y∈d ij Như vậy, mỗi bộ có thể tương ứng với một số lớn các thể hiện. Tuy nhiên, với quan niệm về thừa dữ liệu như trên, mô hình CSDLQH này vẫn tương thích với CSDLQH truyền thống. Ở đây, không cho phép tồn tại hai bộ có chung một thể hiện. 2.2. Đại số quan hệ Các phép toán quan hệ mờ cũng gồm bốn thành phần (toán tử quan hệ, thuộc tính, tên quan hệ, điều kiện) như trong mô hình quan hệ truyền thống thêm vào đó là một câu xác định ngưỡng tương tự áp dụng cho phép toán này. Kết quả cuối cùng của phép toán quan hệ là một quan hệ đạt được bằng việc trộn các bộ thừa (tức là hợp các giá trị thuộc tính tương ứng) cho đến khi không còn bộ thừa. Một bộ được coi là nằm trong quan hệ kết quả của phép giao hai quan hệ sẽ là một bộ thuộc một trong hai quan hệ này và có thể được trộn với một bộ nào đó thuộc quan hệ kia mà không vi phạm các ngưỡng tương tự đã cho trước. Phép hợp hai quan hệ cho kết quả là một quan hệ đạt được sau khi đã loại bỏ các bộ thừa của tập gồm tất cả các bộ thuộc quan hệ này và tất cả các bộ thuộc quan hệ kia. Các phép chiếu, hợp và giao cho kết quả duy nhất. Phép chiếu và phép hợp chỉ khác CSDLQH truyền thống ở cách thức loại bỏ các bộ thừa. 2.3. Phụ thuộc hàm Để mở rộng khái niệm phụ thuộc hàm cho CSDLQH dựa trên tính tương tự, trước hết khái niệm về độ tương tự giữa hai bộ cần phải được xác định. 6 Định nghĩa 1.7. Cho một miền D k của một quan hệ r, độ tương tự của hai bộ t i và t j trên D k được định nghĩa là: T s [D k (t i ,t j )]=Min(s k (p,q)) p,q ∈ d ik ∪d jk Ở đây d ik và d jk là giá trị của bộ t i và bộ t j trên thuộc tính thứ k của quan hệ r, có nghĩa là d ik và d jk đều là tập con của D k . Trong CSDLQH truyền thống cả d ik và d jk đều chỉ gồm một phần tử, khi đó độ tương tự của hai bộ bất kỳ chỉ có thể là một nếu hai bộ này có giá trị trùng nhau ở mọi thuộc tính, nếu không độ tương tự của chúng phải bằng 0. Như vậy: Thres(D k )=Min{T s [D k (t i ,t j )]} ∀i,j Một phụ thuộc hàm trong mô hình này là một mở rộng trực tiếp phụ thuộc hàm trong CSDLQH truyền thống. Định nghĩa 1.8. Nếu A và B là hai thuộc tính của một quan hệ r thì ta nói r thoả phụ thuộc hàm A→B nếu với mọi bộ t i , t j : T s [A(t i ,t j )]≤T s [B(t i ,t j )]. Định nghĩa 1.9. Nếu X và Y là hai thuộc tính của một quan hệ r thì ta nói r thoả phụ thuộc hàm X→Y nếu với mọi bộ t i , t j : Min{T s [A(t i ,t j )]}≤Min{T s [B(t i ,t j )]} ∀A,A∈X ∀B,B∈Y 3. Nhận xét Việc sử dụng lý thuyết mờ, một mở rộng của lý thuyết tập hợp thông thường, để mở rộng khả năng biểu diễn thông tin mơ hồ, không chính xác trong CSDL là một điều tự nhiên và hợp lý. Có thể thấy có hai khuynh hướng chủ yếu đã được sử dụng để mờ hóa thông tin: Khuynh hướng thứ nhất là sử dụng nguyên lý thay thế quan hệ đồng nhất thông thường của các giá trị trong cùng một miền (giá trị thuộc tính) bởi các độ đo về sự “giống nhau” giữa chúng. Tính không chính xác của những giá trị dữ liệu ẩn trong việc sử dụng 7 các quan hệ mờ được cho bởi những bảng tách riêng. Khuynh hướng này cho phép coi một tập các giá trị nào đó như một thể hiện có thể (hay một xấp xỉ về mặt ngữ nghĩa) của một đơn giá trị. Mô hình CSDLQH được mở rộng theo khuynh hướng này có thêm khả năng làm việc (lưu trữ và xử lý) với những thông tin không chính xác. Khuynh hướng thứ hai là dùng phân phối khả năng như một rằng buộc mờ về các giá trị có thể lấy cho một bộ trên một thuộc tính. Tính không chắc chắn của dữ liệu được thể hiện tường minh nhờ các phân phối khả năng. Các mô hình CSDLQH được mở rộng theo khuynh hướng này cho phép biểu diễn không chỉ các thông tin chính xác, chắc chắn mà cả những thông tin không chắc chắn, những giá trị null. Tuy nhiên việc lưu trữ và thao tác trên những thông tin trong các mô hình CSDLQH được mở rộng theo hai khuynh hướng này thực sự phức tạp với quá nhiều phép tính toán. Để có được những mô hình mở rộng của CSDLQH có khả năng mạnh mẽ trong việc lưu trữ và xử lý cả những giá trị có thể không chính xác khi biểu diễn thông tin lẫn những giá trị thể hiện thông tin không chắc chắn, giải pháp đưa ra là phối hợp cả hai khuynh hướng trên. Tuy có được một mô hình cho phép nắm bắt thông tin không đầy đủ ở tình huống tổng quát song điều này càng làm cho mô hình trở nên phức tạp cả ở lưu trữ lẫn xử lý. Có thể nhận thấy rằng, mô hình của hai tác giả P.Buckles và E.Petry khác với CSDLQH truyền thống ở hai điểm quan trọng: giá trị tại mỗi thuộc tính của một đối tượng có thể là một tập và trên mỗi một miền của thuộc tính có một quan hệ mờ thể hiện cấp độ tương tự giữa các phần tử của miền. Trong mô hình này, tuy giá trị của mỗi bộ tại mỗi thuộc tính có thể chứa một hay nhiều phần tử của miền tương ứng, nhưng có một ràng buộc là các phần tử trong cùng một giá trị thuộc tính (của cùng một đối tượng) phải đủ tương tự với nhau nghĩa là cấp độ tương tự của một cặp bất kỳ các phần tử trong cùng giá trị thuộc tính không nhỏ hơn ngưỡng tương tự đã xác định. Cách mở rộng mô hình CSDL của hai tác giả này thuộc khuynh hướng thứ nhất trong hai khuynh hướng cơ bản đã nêu ở trên, nhằm mục đích có được khả năng biểu diễn thông tin không chính xác. Mặc giá trị của 8 mỗi bộ tại mỗi thuộc tính là một tập nhưng các phần tử trong tập này đều được coi là những thể hiện (có thể không chính xác) của một giá trị đơn. Chương II. Mở rộng mô hình CSDLQH dựa trên tính tương tự Chương này sẽ dành để trình bày mô hình CSDLQH dựa trên tính tương tự do TS. Hồ Cẩm Hà đề xuất. Nội dung của chương được chia thành năm phần. Phần thứ nhất sẽ nêu lên các khái niệm cơ sở của mô hình, dựa trên các khái niệm đó trong phần hai sẽ trình bày các phép toán đại số quan hệ. Phần ba sẽ nêu lên các quy tắc cập nhật dữ liệu, phần tiếp theo sẽ đề xuất một ngôn ngữ hỏi cho mô hình này và phần cuối cùng sẽ trình bày về các phụ thuộc dữ liệu. 1. Mở rộng mô hình CSDLQH của P.Buckles và E.Petry Như đã nêu trong phần nhận xét của Chương I, trong mô hình CSDLQH dựa trên tính tương tự của P.Buckles và E.Petry mặc giá trị của mỗi bộ tại mỗi thuộc tính là một tập nhưng các phần tử trong tập này đều được coi là những thể hiện của một giá trị đơn. Trong công trình nghiên cứu của mình TS. Hồ Cẩm Hà đã đưa ra một mô hình CSDLQH kế thừa ý tưởng của hai tác giả trên, nhưng cho phép các phần tử của mỗi bộ tại mỗi giá trị thuộc tính không bị đòi hỏi đủ tương tự theo ngưỡng. Điều này cho phép mỗi giá trị thuộc tính chứa các phần tử biểu diễn những khả năng rất khác xa nhau có thể xảy ra bởi những giá trị không hề tương tự. 9 Khi mô hình hoá một CSDLQH theo cách này sẽ không chỉ cho phép nắm bắt những thông tin không chính xác mà cả những thông tin không chắc chắn. Sự phân tách thành các khả năng thực chất là nhờ vào độ đo tương tự trên mỗi miền và ngưỡng đặt ra. Bởi vậy những thông tin không chắc chắn thể hiện bằng sự tồn tại của những giá trị mà độ tương tự giữa chúng nhỏ hơn ngưỡng đã cho chứ không biểu diễn bằng các phân phối khả năng. Theo một nghĩa nào đó, nếu coi các phần tử đủ tương tự với nhau (theo ngưỡng cho biết) thuộc về cùng một khả năng có thể xảy ra thì mô hình của P.Buckles và E.Petry chỉ cho phép nắm giữ thông tin của những đối tượng mà với những đối tượng này thông tin biết được về mỗi thuộc tính chỉ thuộc về một khả năng (tương tự của một đơn giá trị). Tuy nhiên trong cuộc sống có thể gặp những thông tin không chắc chắn về một đối tượng mà trên một thuộc tính có thể xảy ra nhiều khả năng. Mô hình mới đã khắc phục những hạn chế trên do có các đặc tính sau: mỗi miền trị thuộc tính được gắn với một độ đo “sự tương tự” của cặp hai phần tử bất kỳ của miền trị này; thông tin về một đối tượng được thể hiện bởi một bộ trong quan hệ; giá trị của một bộ tại một thuộc tính có thể là một tập gồm nhiều phần tử và được phân hoạch thành các lớp tương đương bao gồm các phần tử “đủ” tương tự (theo ngưỡng); có thể quan niệm rằng các phần tử trong một lớp tương đương là những thể hiện không chính xác của một giá trị đơn hoặc cũng có thể coi mỗi lớp tương đương thể hiện một khả năng có thể xảy ra. Ngữ nghĩa của mỗi bộ trong mô hình mới sẽ được trình bày trong phần dưới đây, một quan điểm tương ứng về thừa dữ liệu cũng được phát biểu. Khai niệm về bộ thừa rất quan trọng vì nó là cơ sở để xây dựng các qui tắc cập nhật dữ liệu, các phép toán quan hệ và khái niệm các phụ thuộc hàm. 1.1. Ngữ nghĩa của một bộ, quan niệm về các bộ thừa trong quan hệ Cho một lược đồ quan hệ R(U), U là tập hữu hạn các thuộc tính, U = {A 1 , A 2 ,…, A m }. D j là miền trị của A j . Trên mỗi miền trị D j có một quan hệ tương tự (với tính chất bắc cầu) s j . Dùng kí hiệu 2 Dj để chỉ tập tất cả các tập con khác rỗng của D j . Một quan hệ mờ r, là một tập con của tập tích Đề-các 2 D1 ×…×2 Dm . Một bộ t của một quan hệ mờ là một phần 10 [...]... con nào) và không có phần tử nào ngoài tập d j là thông tin đúng về O trên Aj 2 Một tập khác rỗng các phần tử của dj là thông tin đúng về O trên Aj (nhưng chưa biết được chính xác là tập con nào) và không có tập con nào của (D j-dj) là thông tin đúng về O trên Aj 3 Thông tin đúng về O trên A j chỉ có thể là một phần tử của D j và có thể một trong số các phần tử của dj là thông tin đúng về O trên Aj... là thông tin đúng về O trên Aj (nhưng chưa biết chính xác là tập con nào) và không có tập con khả năng nào là thông tin đúng về O trên A j nếu như nó chứa khả năng không xuất hiện ở dj 7 Thông tin đúng về O trên Aj chỉ có thể là một khả năng trong Dj và có thể một trong số các khả năng xuất hiện ở dj là thông tin đúng về O trên Aj 8 Có thể một tập khác rỗng các khả năng xuất hiện ở d j là thông tin. .. Nếu không xảy ra trường hợp 1) thì không là gì cả Như đã nói ở trên, phép UPDATE(r, t[K], t’[U-K]) cho quan hệ r nhờ một bộ t’=(t[K], t’[U-K]) được dùng khi trong quan hệ r đã có bộ t’ cũng cung cấp thông tin về một đối tượng O nào đó, giờ đây lại biết thêm bộ t’ cũng cung cấp thông tin về O và coi như t và t’ bình đẳng về độ chính xác cũng như độ chắc chắn Vì t và t’ là hai bộ thể hiện thông tin về. .. phép cập nhật này là: các giá trị của t trên các thuộc tính không khoá t[U-K] được đổi thành t*[U-K] Các giá trị trên thuộc tính không khoá t*[U-K] được hình thành kho đối chiếu t[U-K] với t’[U-K], với mục đích chứa những thông tin nói chung là chính xác hơn, chắc chắn hơn so với những thông tin cung cấp bởi bộ t vốn có cũng như những thông tin cung cấp bởi bộ t’=(t[K], t’[U-K]) mới xuất hiện trong... cho thông tin về những người mà màu xe chỉ có thể là hai màu tương tự với màu “xanh đậm” và “màu đỏ” còn nghề nghiệp chỉ có thể là tương tự với nghề “nhà văn” và nghề “giáo viên” Trong khi đó chọn không chặt σF1(r3) sẽ chọn những người có khả năng là màu xe tương tự với màu “xanh đậm” hay “màu đỏ” và nghề nghiệp có thể tương tự với nghề “nhà văn” hay nghề “giáo viên” Chọn chặt σF2(r3) chon thông tin về. .. hiện bởi một hay một số giá trị xấp xỉ với nhau hiểu theo nghĩa đủ tương tự” và cũng có nghĩa là xấp xỉ về tương tự (ở một ngưỡng nào đó) với giá trị chính xác trên thực tế Tương tự đối với t’ Với một cặp bộ (t, t’) như vậy có 2 khả năng xảy ra: 33 1) Thông tin không mâu thuẫn: (t[A]∩Pαt’[A]≠∅), nghĩa là tồn tại khả năng được cả t và t’ cùng đưa ra Nếu thông tin ở cả hai bộ đều đúng thì những khả... quan niệm về khả năng nhờ vào khái niệm xấp xỉ theo một ngưỡng tương tự giữa các phần tử như vậy, có một số cách hiểu khác nhau về ngữ nghĩa của bộ t (trên thuộc tính Aj) như sau: 5 Chỉ một trong số các khả năng xuất hiện ở d j là thông tin đúng về O trên Aj (nhưng chưa biết được chính xác là khả năng nào) Không có khả năng nào không xuất hiện trong dj lại là thông tin đúng về O trên Aj 6 Một tập con... thông tin (trên thuộc tính A) được cung cấp bởi t và t’ là mâu thuẫn, so với thực tế thì ít nhất thông tin (trên A) của một trong hai bộ là sai Không biết bộ nào trong hai bộ đó là sai, cũng không loại trừ khả năng cả hai bộ cùng sai Khi kết hợp thông tin của hai bộ t và t’ về cùng một đối tượng, thì cũng có nghĩa là đã lưu được thông tin mới phong phú hơn (theo nghĩa chính xác hơn, chắc chắn hơn) Qui tắc... cũng không rơi vào tình huống nào trong hai loại null kể trên Chẳng hạn chúng ta không biết nhà An có điện thoại hay không khi xét thuộc tính điện thoại của An Để tăng cường khả năng biểu diễn thông tin không đầy đủ cho mô hình đã đề xuất, chúng ta sử dụng hai kí hiệu null D và ⊥ cho trường hợp 1) và 2) Có thể dùng để nói rằng có hai khả năng 1) và 2) cho giá trị trên thuộc tính đang xét, không. .. các kí hiệu null đã sử dụng Cụ thể, những thông tin trong bảng trên cho biết Bắc có thể không có xe mô tô và cũng có thể có, nếu có thì xe của anh ta phải có màu xanh đậm hoặc xanh nhạt Không biết Bắc có nghề nghiệp hay không (thất nghiệp) Yến có xe nhưng không biết một chút gì về màu xe của cô ấy, Yến không có nghề nghiệp Ở đây, giới hạn rằng các kí hiệu null không được xuất hiện trong các giá trị của . nhiên thông tin về thế giới thực cần lưu trữ hay xử lý thường có thể là thông tin không đầy đủ, chúng có thể có nhiều dạng chẳng hạn như: không biết một số thông tin về một đối tượng, thông tin. Chương II. Chương I. Khái quát về CSDLQH với thông tin không đầy đủ Mô hình quan hệ mặc dù không phải là mô hình quản trị cơ sở dữ liệu (CSDL) xuất hiện đầu tiên và cũng không phải là mô hình. biểu diễn không chỉ các thông tin chính xác, chắc chắn mà cả những thông tin không chắc chắn, những giá trị null. Tuy nhiên việc lưu trữ và thao tác trên những thông tin trong các mô hình CSDLQH được

Ngày đăng: 02/05/2014, 14:46

Từ khóa liên quan

Mục lục

  • Giới thiệu

  • Chương I. Khái quát về CSDLQH với thông tin không đầy đủ

    • 1. Một số cách tiếp cận CSDLQH mờ

    • 2. Mô hình CSDLQH dựa trên tính tương tự

      • 2.1. Những định nghĩa cơ sở

      • 2.2. Đại số quan hệ

      • 2.3. Phụ thuộc hàm

      • 3. Nhận xét

      • Chương II. Mở rộng mô hình CSDLQH dựa trên tính tương tự

        • 1. Mở rộng mô hình CSDLQH của P.Buckles và E.Petry

          • 1.1. Ngữ nghĩa của một bộ, quan niệm về các bộ thừa trong quan hệ

          • 1.2. Các giá trị NULL

          • 2. Mở rộng các phép toán quan hệ

            • 2.1. Mở rộng phép hợp

            • 2.2. Mở rộng phép giao

            • 2.3. Mở rộng phép hiệu

            • 2.4. Mở rộng phép chiếu

            • 2.5. Mở rộng phép tích Đề-các

            • 2.6. Mở rộng phép chọn

            • 2.7. Mở rộng phép kết nối tự nhiên

            • 2.8. Phép tính quan hệ trong trường hợp có kí hiệu NULL

            • 2.9. Nhận xét

            • 3. Cập nhật dữ liệu

              • 3.1. Các qui tắc cập nhật dữ liệu

              • 3.2. Nhận xét

              • 4. Ngôn ngữ hỏi SQL S/P

                • 4.1. Biểu thức điều kiện sau WHERE

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan