MỞ ĐẦU1 NỘI DUNG2 1. Giới thiệu2 2. Thông tin không đầy đủ trong mô hình CSDL5 2.1 Thông tin sai lệch5 2.2 Thông tin thiếu chính xác5 2.3 Thông tin không chắc chắn6 3. Tập mờ6 3.1 Tập mờ7 3.2 Các phép toán trên tập mờ7 3.3 Tổng quát hoá ba phép toán cơ bản trên tập mờ8 3.4 Biến ngôn ngữ9 4. Mô hình biểu diễn dữ liệu mờ với ngữ nghĩa của đại số gia tử10 4.1 Đại số gia tử10 4.2 Đại số gia tử tuyến tính đầy đủ10 5. Mô hình CSDL hướng đối tượng mờ10 5.1 Đối tượng mờ11 5.2 Lớp mờ12 5.3 Giá trị thuộc tính13 5.4 Phương thức14 5.5 Quan hệ lớp đối tượng mờ15 5.6 Quan hệ kế thừa mờ16 5.7 Mô hình lớp đối tượng mờ17 6. Ngôn ngữ truy vấn dữ liệu21 KẾT LUẬN21
Trang 1MỤC LỤC
MỞ ĐẦU 1
NỘI DUNG 2
1 Giới thiệu 2
2 Thông tin không đầy đủ trong mô hình CSDL 5
2.1 Thông tin sai lệch 5
2.2 Thông tin thiếu chính xác 5
2.3 Thông tin không chắc chắn 6
3 Tập mờ 6
3.1 Tập mờ 7
3.2 Các phép toán trên tập mờ 7
3.3 Tổng quát hoá ba phép toán cơ bản trên tập mờ 8
3.4 Biến ngôn ngữ 9
4 Mô hình biểu diễn dữ liệu mờ với ngữ nghĩa của đại số gia tử 10
4.1 Đại số gia tử 10
4.2 Đại số gia tử tuyến tính đầy đủ 10
5 Mô hình CSDL hướng đối tượng mờ 10
5.1 Đối tượng mờ 11
5.2 Lớp mờ 12
5.3 Giá trị thuộc tính 13
5.4 Phương thức 14
5.5 Quan hệ lớp đối tượng mờ 15
5.6 Quan hệ kế thừa mờ 16
5.7 Mô hình lớp đối tượng mờ 17
6 Ngôn ngữ truy vấn dữ liệu 21
KẾT LUẬN 21
Trang 2và chính xác Điều này không hoàn toàn phù hợp với thực tế, bởi thông tin vềcác đối tượng trong thế giới thực có thể mơ hồ, không chắc chắn, không đầy đủ.
Hệ quả là các ứng dụng dựa trên mô hình CSDL HĐT truyền thống khôngbiểu diễn được các đối tượng mà thông tin về chúng không được xác định mộtcách chắc chắn và chính xác Chẳng hạn, các ứng dụng mô hình CSDL truyền thốngkhông thể trả lời các truy vấn như “tìm tất cả những bệnh nhân trẻ có tiền sử bệnhviêm thanh quản”; hoặc “tìm tất cả các gói bưu kiện có thể tích khoảng 25000 cm3”.trong đó trẻ và khoảng 25000 cm3 là những khái niệm và giá trị không chính xác Đểkhắc phục được các hạn chế như vậy, các nghiên cứu gần đây đã tập trung nghiên cứu
mô hình CSDL HĐT có khả năng biểu diễn và xử lý được các đối tượng mà thông tin
về chúng có thể không chắc chắn và không chính xác
Chúng em xin chân thành cảm ơn sự dạy bảo, định hướng nghiên cứu, cungcấp tài liệu và hướng dẫn của Thầy TS Nguyễn Công Hào đã giúp chúng em hoànthành tiểu luận này Chúng em cũng xin chân thành cảm ơn các đồng nghiệp, anhchị em học viên đã đóng góp ý kiến cho chúng em trong tiểu luận này Do thờigian cũng như kiến thức có hạn nên chắc chắn không tránh khỏi những thiếu sót,rất mong nhận được sự góp ý của Thầy và các bạn học viên trong lớp để tiểu luậnnày hoàn thiện hơn
Trang 3NỘI DUNG
1 Giới thiệu
Trong những năm gần đây, mô hình CSDL HĐT với thông tin mờ và khôngchắc chắn được nhiều tác giả trong và ngoài nước quan tâm nghiên cứu Tất cảcác cách tiếp cận nhằm mục đích nắm bắt và xử lý một cách thỏa đáng trên mộtluận điểm nào đó các thông tin không chính xác, không chắc chắn hay khôngđầy đủ Dưới đây, chúng tôi tóm tắt lại một số mô hình CSDL HĐT mờ theocác cách tiếp cận và các kết quả đạt được trên các mô hình đã được đề xuất.Trước hết, một số nghiên cứu cho phép giá trị thuộc tính đối tượng là mộttập các giá trị mờ kết hợp với một quan hệ tương tự trên miền giá trị thuộc tínhnày Tùy theo ngữ cảnh, tập giá trị thuộc tính được định nghĩa như là tuyển hoặchội logic của các giá trị này Ngữ nghĩa của các giá trị tập mờ được xác địnhthông qua các quan hệ tương tự trên các miền giá trị thuộc tính tương ứng Cácphép toán đại số trên các lớp đối tượng như chọn, chiếu, kết nối, v.v , dựa trên
độ đo tương tự đã được xây dựng làm ngôn ngữ thao tác truy vấn đối tượng
Vì các giá trị thuộc tính đối tượng có thể là những tập mờ, nên các lớp đốitượng cũng trở nên mờ Trong các mô hình này, sự phân loại, phân cấp các lớp là
mờ nên mức độ thành viên lớp của các đối tượng cũng được mờ hóa theo Các độ
đo tương ứng được sử dụng để tính toán mức độ bao hàm lớp và mức độ thànhviên lớp Độ đo bao hàm lớp con trong lớp cha được xác định bởi mức độ tương
tự tương ứng của các miền giá trị các thuộc tính của lớp con đối với lớp cha
Độ đo thành viên lớp của mỗi đối tượng được định nghĩa thông qua mức độtương tự giữa giá trị tương ứng của mỗi thuộc tính của đối tượng với tập giá trịcủa miền giá trị thuộc tính lớp
Ngoài ra, mô hình này được Yazici và George mở rộng bằng một tập luật chophép suy diễn trên các thông tin mờ về các đối tượng trong CSDL Nhóm tác giảYazici, George và Aksoy (1999) đã đề xuất các vấn đề về thiết kế và thực hiệncác mô hình hướng đối tượng mờ dựa trên quan hệ tương tự Các tác giả nàycũng đã xây dựng một hệ thống CSDL mờ dựa trên tính tương tự cho phép thaotác và truy vấn thông tin mờ của các đối tượng thực tế
Như các mô hình CSDL quan hệ mờ, trong các mô hình CSDL HĐT mờ,
Trang 4phương pháp biểu diễn giá trị thuộc tính đối tượng bởi các phân bố khả năngcũng được nghiên cứu rộng rãi Các đề nghị theo tiếp cận này rất đa dạng và khảnăng mô hình hóa các đối tượng mờ cũng rất khác nhau Bordogna, Lucarella vàPasi (1994) đã đề nghị một mô hình dữ liệu hướng đối tượng dựa trên đồ thị,trong đó giá trị thuộc tính được biểu diễn bởi các phân bố khả năng, bao hàmcác lớp con trong lớp cha được biểu diễn bởi các tập mờ Mức độ thành viên mờcủa các đối tượng được xác định thông qua mức độ bao hàm lớp và mức độ baohàm giá trị thuộc tính của đối tượng trong miền giá trị thuộc tính tương ứng củalớp Một ngôn ngữ truy vấn đối tượng dựa trên các độ đo khả năng đã được xâydựng cho mô hình này và khả năng áp dụng của các tính chất lớp là chắc chắn.Nhóm tác giả này tiếp tục mở rộng bằng cách kết hợp giá trị thuộc tính đốitượng với một giá trị trong khoảng [0, 1] để biểu diễn mức độ không chắc chắn
về giá trị mà thuộc tính có thể nhận
Nhóm tác giả Rossazza, Duboi và Prade (1997) định nghĩa lớp như một tậpthuộc tính mà giá trị cũng như miền giá trị của thuộc tính có thể là các tập mờ Baohàm và phân cấp lớp mờ đã được định nghĩa trên cơ sở logic mờ và lý thuyết khảnăng, thừa kế được xem xét khi quan hệ lớp thực sự là quan hệ lớp cha lớp con Đathừa kế của một thuộc tính là lấy giao của các miền giá trị thuộc tính mờ tương ứngcủa các lớp cha
Van Gyseghem và De Caluwe (1997) định nghĩa lớp như một tập các thuộctính và phương thức xác định các đối tượng mờ của lớp Mỗi phương thức đượcbiểu diễn như một hàm thao tác trên các giá trị tập mờ của thuộc tính đối tượng.Trong mô hình này, khả năng không chắc chắn các tính chất lớp của các đốitượng đã được đề cập, nhưng mức độ áp dụng của mỗi tính chất không được địnhnghĩa hình thức trong biểu diễn lớp Bao hàm và phân cấp lớp mờ được xác địnhthông qua bao hàm các miền trị thuộc tính tương ứng của các lớp Thừa kếkhông chắc chắn thuộc tính lớp được tính toán thông qua mức độ bao hàm lớpcon trong lớp cha
Marin, Pons và Vila (2001), Berzal và cộng sự (2005a) đã áp dụng lý thuyếtkhả năng để xây dựng một tập các độ đo cho các quan hệ trên các tập mờ làm
cơ sở để các thao tác và truy vấn đối tượng Các phương thức lớp cũng đã đượcđịnh nghĩa hình thức để biểu diễn thao tác của các đối tượng De Tre và De
Trang 5Caluwe (2005) đã biểu diễn dữ liệu mờ của đối tượng như các ràng buộc trên cáctính chất của chúng Một truy vấn được kết hợp với các ràng buộc, và các đốitượng được chọn nếu thỏa mãn các ràng buộc này.
Eiter và cộng sự (2001) đã mở rộng mô hình CSDL HĐT xác suất của matzky và Shimony (1994) và gọi là mô hình POB (Probabilistic Object Base).Đây là một mô hình cơ sở đối tượng xác suất dựa trên thủ tục Theo đó, giá trịthuộc tính của đối tượng được biểu diễn như một tập, kết hợp với hai hàm phân
Kor-bố xác suất cận dưới và cận trên để đo độ không chắc chắn về giá trị trong tập
mà thuộc tính có thể nhận
Kết hợp tập mờ và xác suất, Baldwin và cộng sự (2000), Cao và Rossiter (2003) đã
đề xuất một mô hình CSDL HĐT xác suất mờ dựa trên cơ sở logic Trong đó, lớpđược định nghĩa bởi một tập tính chất được diễn dịch như các vị từ mờ kết hợp vớimột khoảng xác suất biểu diễn khả năng áp dụng không chắc chắn của chúng đối vớilớp Các vị từ không có tiền điều kiện biểu diễn thuộc tính, ngược lại chúng biểu diễnphương thức của một lớp Mỗi tính chất đối tượng có thể nhận một giá trị tập mờ vớimột xác suất thuộc về khoảng xác suất được suy dẫn từ mức độ áp dụng của nó đối vớiđối tượng
Năm 2013, Vũ Đức Quảng đã thực hiện các nghiên cứu về các phụ thuộc dữliệu của các đối tượng mờ trên mô hình CSDL hướng đối tượng mờ với dữ liệuđược biểu diễn bởi phân bố khả năng được đề xuất bởi ZongMin Ma Trên môhình mà Zong Min Ma đề xuất ngoài việc đảm bảo các khái niệm, tính chất cốtlõi của mô hình CSDL hướng đối tượng rõ, nó còn giải quyết được tương đối đầy
đủ tính mờ của đối tượng, lớp, tính mờ trong mối quan hệ giữa đối tượng vàlớp, giữa lớp cha và lớp con
Như đã trình bày ở trên, các hướng tiếp cận nghiên cứu mô hình CSDL HĐT vớithông tin mờ và không chắc chắn cũng đã chứng tỏ được khả năng mô hình hóathông tin mờ, không chính xác và không chắc chắn về các đối tượng Tuy nhiên,
do sự đa dạng của những loại thông tin không đầy đủ, do những khó khăn khi phảithao tác trên những thông tin như vậy nên còn rất nhiều vấn đề cần được tiếp tụcnghiên cứu Trong những năm gần đây đại số gia tử được nhiều tác giả nghiên cứu
và đã có được những kết quả đáng kể trong các nghiên cứu về CSDL mờ Vì vậy,mặc dù có nhiều kết quả nghiên cứu về CSDL HĐT mờ, theo chiều hướng đó cách
Trang 6tiếp cận nghiên cứu CSDL HĐT mờ với ngữ nghĩa dựa trên đại số gia tử vẫn có thểđược xem là một vấn đề nghiên cứu mới Trong phần sau, một số khái niệm ĐSGT
và ĐSGT tuyến tính đầy đủ, các mệnh đề, định lý liên quan được trình bày làm
cơ sở nghiên cứu trên mô hình này
2 Thông tin không đầy đủ trong mô hình CSDL
Một trong những lĩnh vực nghiên cứu chủ yếu trong CSDL là tiếp tục pháttriển các kết quả đã đạt được trong các mô hình CSDL truyền thống với một tậpcác khái niệm có ngữ nghĩa mở rộng Một trong các yêu cầu không được giải quyếtđầy đủ bởi các các mô hình truyền thống, đó là việc biểu diễn và xử lý thông tinkhông chính xác và không chắc chắn Các mô hình truyền thống giả định rằng môhình cơ sở dữ liệu phản ánh một cách chính xác thế giới thực, dữ liệu được lưu trữ
là được xác định, chính xác và đầy đủ Tuy nhiên, trong thực tế cuộc sống, nhiềukhi các giả định này không được thỏa đáng Vì vậy trong những năm gần đây,các mô hình dữ liệu khác nhau được đề xuất để giải quyết các loại đặc trưngcủa dữ liệu
Trong các hệ thống CSDL, chúng ta thường quan tâm đến ba loại thông tinkhông hoàn hảo (imperfect) sau: thông tin sai lệch, thông tin không chính xác,thông tin không chắc chắn
2.1 Thông tin sai lệch
Thông tin sai lệch là loại thông tin không hoàn hảo đơn giản nhất Thông tincủa cơ sở dữ liệu là sai lệch khi nó khác với “thông tin thực” (true information).Mọi sai số lớn hay nhỏ của thông tin đều làm ảnh hưởng đến tính toàn vẹn củaCSDL, đó là vấn đề không thể chấp nhận và cần được xem xét trong các
hệ CSDL Một loại thông tin sai lệch quan trọng là sự không nhất quán.Đôi khi cùng một khía cạnh của thế giới thực được biểu diễn nhiều lần trongcùng một CSDL hay trong nhiều CSDL khác nhau Khi các biểu diễn đó là đốilập không thể kết hợp được, dẫn đến thông tin là không nhất quán Trong việctích hợp thông tin từ nhiều CSDL khác nhau, các vấn đề về sự không nhất quáncủa thông tin phải được quan tâm một cách đầy đủ
2.2 Thông tin thiếu chính xác
Thông tin trong CSDL là thiếu chính xác khi nó biểu diễn một tập các giá trị cóthể, và giá trị thực là một phần tử của tập đó Như vậy, thông tin thiếu chính xác
Trang 7không phải là thông tin sai lệch và không làm ảnh hưởng tới tính toàn vẹn củaCSDL Sau đây là một số thông tin thiếu chính xác đặc trưng:
- Thông tin tuyển, chẳng hạn tuổi của Nam hoặc là 35 hoặc là 36
- Thông tin âm, chẳng hạn tuổi của Nam không phải là 30
- Thông tin khoảng/miền, chẳng hạn tuổi của Nam nằm trong khoảng từ 35 đến
40 hoặc tuổi của Nam lớn hơn 35
- Thông tin với các cận sai số, chẳng hạn tuổi của Nam là 30 ± 1
Hai loại thông tin không chính xác cực biên là thông tin chính xác (ứng vớitrường hợp tập các giá trị có thể là một phần tử) và các giá trị null (được hiểutheo nghĩa là thông tin không chính xác, trong đó tập các giá trị có thể bao gồmtoàn bộ miền các giá trị hợp lệ)
2.3 Thông tin không chắc chắn
Tri thức của chúng ta về thế giới thực (chính xác hoặc không chính xác), đôikhi không thể được phát biểu với một mức độ chân lý tuyệt đối, và đòi hỏi taphải xác định giá trị chân lý về thông tin được phát biểu Thông tin với độ chắcchắn nhất định không phải là thông tin sai lệch và không làm ảnh hưởng tới tínhnhất quán của CSDL
Trong phát biểu “tuổi của Nam hoặc là 35 hoặc là 36 ” thể hiện tính khôngchính xác, phát biểu “tuổi của Nam có khả năng là 35 ” lại thể hiện tính khôngchắc chắn
3 Tập mờ
Mỗi lĩnh vực khoa học kỹ thuật đều có một miền ứng dụng của nó Khoahọc kỹ thuật lấy tính “chính xác” làm cơ sở để xây dựng, phát triển và cũng cónhững giới hạn xác định không thể vượt qua, chúng chỉ có khả năng mô phỏngđược một phần thế giới thực Câu hỏi đặt ra ở đây là liệu có một lý thuyết toánhọc nào cho phép mô hình hóa phần thế giới thực mà con người vẫn chỉ có thểnhận thức, mô tả bằng ngôn ngữ tự nhiên vốn hàm chứa những thông tin khôngchính xác (inexact), không chắc chắn (uncertain)
Lý thuyết tập mờ được Zadeh đề xuất năm 1965 bằng cách mở rộng khái niệmtập cổ điển, với ý tưởng đầu tiên là giúp biểu diễn và đo ngữ nghĩa các khái niệmkhông chính xác, mơ hồ trong thực tế Ngày nay, sau hơn 40 năm, một thời gian rất
Trang 8ngắn so với lịch sử toán học, lý thuyết tập mờ không chỉ đã phát triển bùng nổ vượtbậc mà còn đặt nền móng cho việc xây dựng một loạt các lý thuyết quan trọng nhưlogic mờ, lý thuyết khả năng, lý thuyết xác suất mờ v.v Nhu cầu phát triển của lýthuyết tập mờ là tìm kiếm các công cụ để mô hình hóa tính không chắc chắn, không
rõ ràng, rất phổ biến trong thực tế mà nếu chỉ dùng lý thuyết xác suất không đủ.Toán học dựa trên lý thuyết tập mờ phát triển chủ yếu bằng cách mở rộng hầu hếtcác khái niệm và lý thuyết của toán học cổ điển như logic, số học, quan hệ, độ đov.v thành logic, số học, hay độ đo mờ v.v Lý thuyết tập mờ, với những khảnăng như đã nói, là cơ sở toán học được ứng dụng rộng rãi trong thực tế nói chung
và khoa học kỹ thuật nói riêng, đặc biệt là khoa học máy tính, khi xây dựng các hệthống tính toán biết phân tích, xử lý và ra quyết định thông minh
3.1 Tập mờ
Trước hết chúng ta xuất phát từ tập hợp kinh điển Cho U là một tập hợp
và F là một tập con của U Nếu một phần tử x thuộc F, ký hiệu x ∈ F , ngược
lại x ∈/ F Như vậy, để mô tả khái niệm “thuộc” ta sử dụng hàm thuộc µF :
Rõ ràng, trong tập hợp kinh điển, hàm thuộc của một phần tử nào đó của Fchỉ nhận giá trị trong {0,1}
Trong tập mờ, hàm thuộc của một phần tử nào đó của F không chỉ nhận giátrị trong {0,1} mà có thể nhận giá trị trong [0,1]
3.2 Các phép toán trên tập mờ
Tương tự như lý thuyết tập hợp, trên các tập mờ cũng định nghĩa một sốphép toán: bằng nhau, bao nhau, giao, hợp .[1] là sự mở rộng các định nghĩatrên lý thuyết tập hợp
Định nghĩa 1.5 Cho F và F1 là hai tập mờ trên U
(1): F bằng F1, ký hiệu F = F1, nếu µF (x) = µF1 (x), x ∀x ∈ U
(2): F chứa trong F1, ký hiệu F ⊆ F1, nếu µF (x) ≤ µF1 (x), x ∀x ∈ U
(3): Hợp của hai tập mờ F và F1, ký hiệu F ∪ F1, là một tập mờ trên U với
F X X
1 ) (
Trang 9hàm thuộc xác định bởi: µF ∪F1 (x) = M ax{µF (x), µF1 (x)}, x ∀x ∈ U
(4): Giao của hai tập mờ F và F1, ký hiệu F ∩ F1, là một tập mờ trên U với hàm thuộc xác định bởi: µF ∩F1 (x) = Min{µF (x), µF1 (x)}, x ∀x ∈ U
(5): Phần bù của tập mờ F, ký hiệu F là một tập mờ trên U với hàm thuộc xác định bởi: µF (x) = 1 − µF (x), x ∀x ∈ U
Định nghĩa 1.6 [1] Cho F và F1 là hai tập mờ trên U
3.3 Tổng quát hoá ba phép toán cơ bản trên tập mờ
Ngoài ba phép toán cơ bản min, max và phần bù được dùng thao tác trêncác tập mờ, để tổng quát hơn có thể định nghĩa họ các toán tử T là t-norm,t-conorm và N-Negation cho các phép toán trên
Định nghĩa 1.7 Hàm T: [0,1] x [0,1] → [0,1] được gọi là t-norm khi và chỉ
(2) S(x,y) ≤ S(x,z), y ∀x ≤ z (3) S(x,S(y,z)) = S(S(x,y),z) (4) S(x,0) = 0.
Định nghĩa 1.9 Hàm N : [0, 1] → [0, 1] được gọi là hàm phủ định khi và chỉ
khi N thoả mãn x, y [0,1]:∀x, y ∈ [0,1]: ∈ [0,1]:
Trang 10Nói tóm lại, ý trên đây đã khái quát cho khái niệm biến ngôn ngữ Một cáchhình thức biến ngôn ngữ được định nghĩa như sau.
Định nghĩa 1.10 Biến ngôn ngữ là một bộ năm (X, T (X), U, R, M ), trong đó X
là tên biến, T (X) là tập các giá trị ngôn ngữ của biến X, U là không gian tam chiếucủa biến cơ sở u, mỗi giá trị ngôn ngữ xem như là một biến mờ trên U kết hợp vớibiến cơ sở u, R là một qui tắc cú pháp sinh các giá trị ngôn ngữ của T (X), M là quitắc ngữ nghĩa gán mỗi giá trị ngôn ngữ trong T (X) với một tập mờ trên U
Các đặc trưng của biến ngôn ngữ
Trong thực tế có rất nhiều biến ngôn ngữ khác nhau về các giá trị nguyên
thủy, chẳng hạn như biến ngôn ngữ SỐ NGÀY LÀM VIỆC có giá trị nguyên thuỷ là ít, nhiều, biến ngôn ngữ LƯƠNG có giá trị nguyên thủy là thấp, cao, .
Tuy nhiên, những kết quả nghiên cứu đối với một miền trị của một biến ngônngữ cụ thể vẫn giữ được ý nghĩa về mặt câu trúc đối với miền giá trị của cácbiến còn lại Đặc trưng này được gọi là tính phổ quát của biến ngôn ngữ
Ngữ nghĩa của các gia tử và các liên từ hoàn toàn độc lập với ngữ cảnh, điềunày khác với giá trị nguyên thủy của các biến ngôn ngữ lại phụ thuộc vào ngữ
cảnh Ví dụ, ta nói LƯƠNG của cán bộ An là rất cao, khi đó được hiểu rằng
LƯƠNG khoảng trên 8.000.000 đồng, nhưng ta nói CHIỀU CAO của cán bộ An là
Trang 11rất cao thì được hiểu rằng CHIỀU CAO khoảng trên 1.8m Do đó, khi tìm
kiếm mô hình cho các gia tử và các liên từ chúng ta không quan tâm đến giá trị
nguyên thuỷ của biến ngôn ngữ đang xét Đặc trưng này được gọi là tính độc lập
ngữ cảnh của gia tử và liên từ.
Các đặc trưng trên cho phép chúng ta sử dụng cùng một tập các gia tử vàxây dựng một cấu trúc toán học cho miền giá trị của các biến ngôn ngữ khácnhau
4 Mô hình biểu diễn dữ liệu mờ với ngữ nghĩa của đại số gia tử
4.1 Đại số gia tử
Vấn đề sử dụng tập mờ để biểu diễn các giá trị ngôn ngữ và dùng các phép
toán trên tập mờ để biểu thị các gia tử ngôn ngữ như µ rattre = (µ tre)2, µ itnhieutre =
(µ tre)1/2, đã cho phép thực hiện các thao tác dữ liệu mờ, đáp ứng nhu cầu thực
tế của con người Tuy nhiên, theo cách sử dụng tập mờ ta thấy có nhiều nhượcđiểm do việc xây dựng các hàm thuộc và xấp xỉ các giá trị ngôn ngữ bởi cáctập mờ còn mang tính chủ quan, phụ thuộc nhiều vào ý kiến chuyên gia chonên dễ mất mát thông tin Mặc khác, bản thân các giá trị ngôn ngữ có mộtcấu trúc thứ tự nhưng ánh xạ gán nghĩa sang tập mờ, không bảo toàn cấu trúc
đó nữa
Do đó, vấn đề đặt ra là cần có một cấu trúc toán học để mô phỏng được chínhxác hơn cấu trúc ngữ nghĩa của một khái niệm mờ Trong N.C.Ho và cộng sự đãđưa ra ĐSGT và ĐSGT mở rộng, đề xuất ĐSGT tuyến tính đầy đủ đã giải đáp đầy
đủ cho bài toán trên
4.2 Đại số gia tử tuyến tính đầy đủ
Cho một ĐSGT tuyến tính đầy đủ AX = (X, G, H, Σ, Φ, ≤), trong đó Dom(X ) =
X là miền các giá trị ngôn ngữ của thuộc tính ngôn ngữ X được sinh tự do từ tập cácphần tử sinh G = {1, c−, W, c+, 0} bằng việc tác động tự do các phép toán một ngôitrong tập H, Σ và Φ là hai phép tính với ngữ nghĩa là cận trên đúng và cận dưới đúngcủa tập H(x), tức là Σx = supermumH(x) and Φx = infimumH(x), trong đó H(x) làtập các phần tử sinh ra từ x, còn quan hệ ≤ là quan hệ sắp thứ tự tuyến tính trên Xcảm sinh từ ngữ nghĩa của ngôn ngữ
5 Mô hình CSDL hướng đối tượng mờ
Trang 12Trong phần trước đã trình bày tổng quan về các hướng tiếp cận cho việc nghiêncứu mô hình CSDL HĐT với thông tin mờ và không chắc chắn Các nghiên cứu,phát triển trên mô hình CSDL HĐT mờ dựa trên mô hình CSDL HĐT truyền thốngthường tập trung vào các vấn đề sau:
1 Biểu diễn giá trị thuộc tính không chắc chắn hoặc không chính xác của cácđối tượng
2 Biểu diễn và thực thi các phương thức lớp
3 Mô hình hóa khả năng áp dụng không chắc chắn của các tính chất (thuộctính hoặc phương thức) lớp
4 Mô hình hóa các quan hệ lớp và định nghĩa mức độ không chắc chắn củacác đối tượng
5 Xác định cơ chế thừa kế không chắc chắn của các đối tượng
Như đã đề cập ở trên, các nghiên cứu về mô hình CSDL hướng đối tượng
mờ chủ yếu tập trung vào việc mở rộng mô hình dữ liệu rõ đã có theo các cáchtiếp cận khác nhau và cho phép biểu diễn, thao tác trên dữ liệu mờ Do đó, các
mô hình CSDL mờ này cũng chỉ thống nhất trên một tập các khái niệm chungnhất (tập lõi) trong mô hình hạt nhân của ODMG Có thể thấy rằng, các kếtquả nghiên cứu trên CSDL HĐT mờ luôn được xem xét với một mô hình cụ thể,các kết quả này sẽ giải quyết cho một lớp các bài toán với một tập con các kháiniệm, tính chất đặc trưng hướng đối tượng đã được cài đặt trên mô hình
Nhờ những ưu điểm của cấu trúc ĐSGT như đã trình bày trong phần mở đầu,chúng tôi xem các giá trị trên miền của thuộc tính đối tượng là một cấu trúc ĐSGT
và các giá trị này được sinh ra từ hai phần tử dương và âm trong ĐSGT Ngoài ra,chúng tôi xem mỗi phương thức được biểu diễn như một hàm thao tác trên các giátrị tập mờ của thuộc tính đối tượng Trong mô hình này, chúng tôi dựa trên tínhtoán lân cận tương tự, độ đo ngữ nghĩa và các quan hệ đối sánh của chúng để đưa
ra các phụ thuộc dữ liệu của đối tượng mờ và các vấn đề liên quan, một số phéptoán đại số, tích hợp nhiều đại số gia tử để thực hiện việc thao tác và truy vấn dữliệu trên mô hình CSDL HDT với thông tin ngôn ngữ mờ
5.1 Đối tượng mờ
Các đối tượng được dùng để đặc tả các thực thể trong thế giới thực hoặc cáckhái niệm trừu tượng Các đối tượng có các thuộc tính hay các mối quan hệ giữa