Để mô phỏng các thuộc tính mờ, Medina et al đã chia dữ liệu ra làm hai loại: Miền có thứ tự và miền không có thứ tự. Trong miền có thứ tự có thể biểu diễn bất cứ loại phân bố khả năng hoặc tập mờ nào, tóm lại có thể kết hợp các loại phân bố khả năng sau: dạng hình thang, các nhãn ngữ nghĩa (đƣợc kết hợp với các phân bố khả năng cụ thể), các giá trị xấp xỉ (phân bố khả năng dạng hình tam giác), và các đoạn của khả năng (intervals of possibility). Trong miền không có thứ tự có các vô hƣớng đơn và phân bố khả năng trên các vô hƣớng. Cả hai loại dữ liệu này đều cho phép định nghĩa các giá trị Unknown, Undefined và Null.
Với các khái niệm đó, các thuộc tính mờ, theo Medina et al (1994) và Galindo (1999) [10] đƣợc phân thành 4 loại sau:
Các thuộc tính mờ loại 1: Lƣu trữ với các dữ liệu chính xác hoặc rõ. Tuy nhiên có thể định nghĩa các nhãn ngữ nghĩa trên các thuộc tính này và có thể sử dụng chúng trong các truy vấn mờ. Kiểu dữ liệu này đƣợc biểu diễn nhƣ những dữ liệu chính xác nhƣng có thể đƣợc chuyển đổi hoặc đƣợc thao tác sử dụng các điều kiện mờ. Nó thực sự hữu ích cho việc mở rộng các cơ sở dữ liệu truyền thống khi xây dựng các truy vấn mờ trên dữ liệu chính xác. Ví dụ một truy vấn : “Hãy cho biết các nhân viên có mức lƣơng lớn hơn rất nhiều mức lƣơng tối thiểu”. Các thuộc tính mờ loại 1 đƣợc biểu diễn giống các thuộc tính rõ vì chúng không cho phép lƣu trữ các giá trị mờ.
Các thuộc tính mờ loại 2: Đây là những thuộc tính có thể chứa những dữ liệu không chính xác trên một miền có thứ tự. Nó cho phép lƣu trữ cả dữ liệu rõ và dữ liệu mờ theo dạng phân bố khả năng trên cùng một miền có thứ tự. Thuộc tính này là mở rộng của thuộc tính mờ loại 1 trong đó cho phép lƣu trữ các thông tin không
chính xác. Ví dụ “Lƣơng của Nam khoảng 2000USD/ tháng”. Để biểu diễn một thuộc tính mờ loại 2 cần 5 thuộc tính truyền thống nhƣ trong bảng sau:
Loại giá trị Các thuộc tính trong CSDL với mỗi thuộc tính mờ loại 2
FT F1 F2 F3 F4
UNKNOWN 0 NULL NULL NULL NULL
UNDEFINED 1 NULL NULL NULL NULL
NULL 2 NULL NULL NULL NULL
Giá trị rõ d 3 d NULL NULL NULL
Nhãn 4 FUZZY_ID NULL NULL NULL
[n, m] 5 n NULL NULL m Giá trị xấp xỉ #d 6 d d – cận giới hạn d + cận giới hạn cận giới hạn Hình thang 7 α β γ δ Giá trị xấp xỉ d± m 8 d d-m d-m m Phân bố khả năng -2 9 p1 d1 p2 d2 Phân bố khả năng -4 10 d1 d2 d3 d4
Bảng 4-6: Biểu diễn bên trong của thuộc tính mờ loại 2 (Cho mỗi thuộc tính mờ F)
Trong đó:
FT: Lƣu kiểu giá trị tƣơng ứng với kiểu dữ liệu, nhƣ 0 cho UNKNOWN, 1cho UNDEFINED ,... 10 cho Phân bố khả năng -4.
F1, F2, F3, F4: Các thuộc tính đƣợc thêm vào, lƣu các miêu tả cho các tham số.
Các thuộc tính mờ loại 3: Lƣu trữ dữ liệu của miền vô hƣớng rời rạc (data of discrete nonordered dominion with analogy). Trong các thuộc tính này một số nhãn đƣợc định nghĩa, ví dụ nhƣ màu sắc (“đỏ”, “xanh đen”, “vàng”, ... ) là các vô hƣớng đối với một quan hệ tƣơng tự, quan hệ này chỉ ra phạm vi mỗi cặp nhãn tƣơng đƣơng nhau. Chúng cũng cho phép lƣu trữ các phân phối khả năng (hoặc tập mờ) ví
dụ nhƣ giá trị (1/đen, 0.4/nâu) cho biết một màu gần giống màu đen hơn màu nâu. Các thuộc tính mờ loại3 đƣợc biểu diễn bởi một số các thuộc tính rõ.
Loại giá trị Các thuộc tính trong CSDL với mỗi thuộc tính mờ loại 3 hoặc 4
FT FP1 F1 .... FPn Fn
UNKNOWN 0 NULL NULL ... NULL NULL
UNDEFINED 1 NULL NULL ... NULL NULL
NULL 2 NULL NULL ... NULL NULL
Vô hƣớng đơn 3 P d ... NULL NULL Phân bố khả năng 4 p1 d1 ... pn dn
Bảng 4-7: Biểu diễn bên trong của thuộc tính mờ loại 3 hoặc 4 (Cho mỗi thuộc tính mờ F)
Trong đó:
FT: Lƣu kiểu giá trị tƣơng ứng với kiểu dữ liệu, nhƣ 0 cho UNKNOWN, 1cho UNDEFINED ,... 4 cho Phân bố khả năng.
FT = 3: Trong trƣờng hợp này, việc biểu diễn chỉ cần thêm 2 thuộc tính FP1 và F1, trong đó F1 lƣu định danh nhãn và FP1 lƣu mức phân bố của nhãn.
FT = 4: Trong trƣờng hợp này, việc biểu diễn cần một danh sách 2n với n>1 thuộc tính theo từng cặp (giá trị khả năng/định danh nhãn). Mỗi cặp lƣu FPj/Fj với j = 1 ....n.
Các thuộc tính mờ loại 4: Chúng đƣợc định nghĩa giống các thuộc tính mờ loại 3 nhƣng không xây dựng quan hệ tƣơng tự giữa các nhãn. Trong trƣờng hợp này, cấp độ đƣợc kết hợp với mỗi nhãn riêng lẻ và không đánh giá độ tƣơng tự giữa các nhãn.