Các lớp trong mô hình dữ liệu UML thường tương ứng với các lớp trong lược đồ cơ sở dữ liệu hướng đối tượng và các thuộc tính của các lớp trong mô hình dữ liệu UML tương ứng với các thuộc tính của các lớp trong lược đồ cơ sở dữ liệu hướng đối tượng. Nếu các lớp trong mô hình dữ liệu UML là lớp con hoặc lớp cha trong lược đồ cơ sở dữ liệu hướng đối tượng, cấu trúc phân cấp kế thừa của các lớp được tạo ra bởi các lớp UML này phải được định nghĩa.
Để chuyển đổi từ mô hình dữ liệu UML mờ sang lược đồ cơ sở dữ liệu hướng đối tượng mờ, trước tiên ta xem các lớp trong mô hình dữ liệu UML không phải là lớp con cũng không phải là lớp cha. Sau đó, ta có thể phân biệt bốn loại lớp cơ bản trong mô hình UML mờ như sau.
a) Các lớp không phải là lớp mờ;
b) Các lớp chỉ có độ mờ ở cấp độ thứ ba; c) Các lớp có độ mờ chỉ ở cấp độ thứ hai; d) Các lớp chỉ có độ mờ ở cấp độ đầu tiên.
44
Khi chuyển đổi các lớp của mô hình dữ liệu UML mờ thành các lớp của lược đồ cơ sở dữ liệu hướng đối tượng mờ, việc chuyển đổi các lớp có ba mức mờ, ta cần chú ý các trường hợp sau: Đối với các lớp trong trường hợp (b), các thuộc tính nhận giá trị mờ có kiểu giá trị mờ được ký hiệu là FUZZY TYPE OF. Đối với các lớp trong trường hợp (c), một thuộc tính bổ sung ký hiệu là pD nên được thêm vào mỗi lớp để biểu thị khả năng các đối tượng của lớp. Đối với các lớp trong trường hợp (d), các lớp hay các thuộc tính của chúng có thể được liên kết với các mức thành viên. Đồng thời, các lớp và thuộc tính đã biến đổi trong lược đồ cơ sở dữ liệu hướng đối tượng mờ được liên kết với các mức thành viên, nếu có. Mức thành viên được sử dụng để chỉ ra khả năng lớp được tạo thuộc về lược đồ cơ sở dữ liệu hoặc các thuộc tính của lớp được tạo thuộc về lớp đó.
Dựa trên ba kiểu cơ bản của lớp mờ ở trên (tức là trường hợp (b), (c), (d)), một số kiểu kết hợp của lớp mờ có thể được cài đặt. Đối với các lớp có độ mờ ở cả cấp ba và cấp hai (ký hiệu là (e)), phép biến đổi của chúng là sự kết hợp đơn giản của các phép biến đổi trên trong trường hợp (b) và (c). Đối với các lớp có độ mờ ở cả cấp ba và cấp một (ký hiệu là (f)), phép biến đổi của chúng là sự kết hợp đơn giản của các phép biến đổi trên trong trường hợp (b) và (d). Đối với các lớp có độ mờ ở cả cấp hai và cấp một (ký hiệu là (g)), phép biến đổi của chúng là sự kết hợp đơn giản của các phép biến đổi trên trong trường hợp (c) và (d). Đối với các lớp có độ mờ ở cả ba cấp (ký hiệu là (h)), phép biến đổi của chúng là sự kết hợp đơn giản của các phép biến đổi trên trong các trường hợp (b), (c), và (d).
Hình 1.8 thực hiện việc chuyển đổi của các lớp trong mô hình dữ liệu UML mờ sang lược đồ cơ sở dữ liệu hướng đối tượng mờ. Để đơn giản hóa, một số thành phần trong định nghĩa lớp của lược đồ hướng đối tượng mờ như DOMAIN, WEIGHT, METHODS và CONSTRAINTS không được cài đặt.
45
Hình 1.8: Chuyển đổi các lớp trong UML mờ sang lược đồ cơ sở dữ liệu hướng đối tượng mờ
Giả sử rằng các lớp của mô hình dữ liệu UML mờ là các lớp cha có thể thuộc bất kỳ kiểu lớp nào được cài đặt trong trường hợp (a) - (h) ở trên. Việc chuyển đổi các lớp như vậy thành các lớp của lược đồ cơ sở dữ liệu hướng đối tượng mờ cũng giống như việc chuyển đổi các lớp của mô hình dữ liệu UML mờ đã cho ở trên. Các lớp của mô hình dữ liệu UML mờ là các lớp con và có thể thuộc bất kỳ kiểu nào (a) - (h) có thể được chuyển đổi thành các lớp của lược đồ cơ sở dữ liệu hướng đối tượng mờ theo các nguyên tắc tương tự của phép biến đổi lớp đã cho ở trên. Tuy nhiên, trong lược đồ cơ sở dữ liệu hướng đối tượng mờ, phân cấp kế thừa của các lớp được tạo ra (lớp con) phải được định nghĩa đầy đủ.
Hình 1.9 cho thấy sự chuyển đổi của các lớp con trong mô hình dữ liệu UML mờ sang lược đồ cơ sở dữ liệu hướng đối tượng mờ.
Đối tác tốt ID Vị trí FUZZY Địa vị 𝜇 Ghế văn phòng WITH 0.6 DEGREE Mã Trọng lượng WITH 0.6 DEGREE FUZZY Màu 𝜇 CLASS Đối tác tốt ATTRIBUTES
Id: TYPE OF String Vị trí : TYPE OF String
Địa vị: FUZZY TYPE OF String pD: DOMAIN [0, 1] TYPE OF number
END
CLASS Ghế văn phòng WITH DEGREE 0.6
ATTRIBUTES
Mã: TYPE OF String
Trọng lượng: TYPE OF Number
WITH DEGREE OF 0.5 Màu: FUZZY TYPE OF String
46
Hình 1.9: Chuyển đổi các lớp con trong UML mờ sang lược đồ cơ sở dữ liệu hướng đối tượng mờ
1.3.10.4 Chuyển đổi quan hệ kết tập
Tập hợp xác định mối quan hệ toàn bộ giữa các bộ phận cấu thành và tổng thể là một lớp đại diện cho tổng thể. Trong mô hình dữ liệu UML mờ, tập hợp (mờ) có thể được chuyển đổi thành một lớp trong lược đồ cơ sở dữ liệu hướng đối tượng mờ, được gọi là lớp tổng hợp, theo sự biến đổi của các lớp đã cho ở trên. Ngoài ra, mỗi phần cấu thành, là một lớp (mờ), có thể được chuyển đổi thành một lớp trong lược đồ cơ sở dữ liệu hướng đối tượng mờ, được gọi là lớp thành phần. Lưu ý rằng các thuộc tính của lớp tổng hợp bao gồm tất cả các thuộc tính từ lớp tổng hợp cũng như tất cả các lớp thành phần dưới dạng thuộc tính lớp phức tạp.
Hình 1.10 cho thấy sự chuyển đổi các tập hợp trong mô hình dữ liệu UML mờ sang lược đồ cơ sở dữ liệu hướng đối tượng mờ.
CLASS Tuổi trẻ
ATTRIBUTES
…
pD: DOMAIN [0; 1] TYPE OF number
END
CLASS Sinh viên trẻ
INHERIT tuổi trẻ
ATTRIBUTES
…
pD: DOMAIN [0; 1] TYPE OF number
END
CLASS Giảng viên trẻ
INHERIT Tuổi trẻ
ATTRIBUTES
…
pD: DOMAIN [0; 1] TYPE OF number
END
Tuổi trẻ
Sinh viên trẻ Giảng viên trẻ
47
Hình 1.10. Chuyển đổi các tập hợp trong UML mờ sang lược đồ cơ sở dữ liệu hướng đối tượng mờ
1.3.10.5 Chuyển đổi quan hệ kết hợp
Quan hệ kết hợp trong mô hình dữ liệu UML được chuyển đổi thành quan hệ kết hợp trong lược đồ đối tượng, mô tả các thuộc tính trong một lớp kết hợp tham chiếu tường minh đến một lớp khác. Trong mô hình dữ liệu UML mờ, có thể phân biệt ba loại kết hợp cơ bản, như sau:
a) Các kết hợp không có bất kỳ độ mờ nào; b) Các kết hợp chỉ có độ mờ ở cấp độ thứ hai; c) Các kết hợp chỉ có độ mờ ở cấp độ đầu tiên.
Cho lớp c1 và lớp c2 được liên kết với nhau bằng mối quan hệ kết hợp R, trong đó R có thể là mối quan hệ một-một, một-nhiều hoặc nhiều-nhiều. Ngoài ra, giả sử rằng c1
và c2 có các thuộc tính k1 và k2, tương ứng với các giá trị dùng định danh đối tượng. Sau đó, theo quá trình biến đổi của các lớp đã cho ở trên, c1 và c2 có thể được chuyển thành các lớp trong lược đồ cơ sở dữ liệu hướng đối tượng mờ. Tuy nhiên, ảnh hưởng của R đến sự kết hợp của c2 (hoặc c1) với c1 (hoặc c2) phải được xem xét khi c1 (hoặc c2) được chuyển thành một lớp của lược đồ cơ sở dữ liệu hướng đối tượng mờ. Ở đây,
CLASS Xe ô tô cũ
ATTRIBUTES
Động cơ cũ
Đầu CD WITH 0.4 DEGREE Khung xe
…
pD: DOMAIN [0; 1] TYPE OF number
END
CLASS Động cơ cũ
ATTRIBUTES
…
pD: DOMAIN [0; 1] TYPE OF number
END
CLASS Đầu CD WITH 0.4 DEGREE
ATTRIBUTES … END CLASS Khung xe ATTRIBUTES … END Xe ô tô cũ Động cơ cũ Khung xe 0.4/Đầu CD
48
k2 (hoặc k1) được thêm vào lớp c1 (hoặc c2) và xem như một khóa ngoại, giống như cơ sở dữ liệu quan hệ. Nếu ràng buộc của cardinality là quan hệ một-một, thì R là quan hệ một-một từ c1 đến c2, k2 là thuộc tính đơn trị trong c1 và k1 là thuộc tính đơn giá trị trong c2. Tuy nhiên, nếu R là quan hệ một-nhiều từ c1 đến c2, thì k2 là thuộc tính đa trị trong c1 và k1 là thuộc tính đơn trị trong c2. Rõ ràng, k2 là thuộc tính đa trị trong c và k1 là thuộc tính đa trị trong c2 nếu R là một quan hệ nhiều-nhiều từ c1 đến c2.
Đối với mối quan hệ R trong trường hợp (b), khả năng một đối tượng có mối quan hệ thuộc về R nên được ánh xạ thành khả năng một đối tượng thuộc về c1 hoặc c2. Do đó, các thuộc tính bổ sung biểu thị khả năng các thể hiện của lớp thuộc về lớp tương ứng nên được thêm vào c1 và c2 tương ứng. Đối với mối quan hệ R trong trường hợp (c), tức là, các mối quan hệ với mức thành viên, k2 trong c1 và k1 trong c2 phải là các thuộc tính có mức thành viên, cho biết khả năng khóa ngoại được bao gồm trong lớp đã tạo.
Tiếp theo các phép biến đổi ở trên trong trường hợp (b) và (c), không khó để xử lý mối quan hệ R trong trường hợp các liên kết có độ mờ cả ở cấp độ đầu tiên và cấp độ thứ hai, với phép biến đổi được thực hiện như một tổ hợp đơn giản của các phép biến đổi trong trường hợp (b) và (c).
Hình 1.11 thể hiện sự chuyển đổi của các quan hệ kết hợp.
Lưu ý rằng chúng ta chỉ xét một liên kết cô lập (mờ) trong phép biến đổi của liên kết. Có nghĩa là, chúng ta giả định rằng không có lớp nào trong hai lớp liên kết được liên kết với các lớp khác ngoài mối quan hệ kết hợp đã cho. Tuy nhiên, trong các ứng dụng thực, có thể một lớp có thể được liên kết với nhiều hơn một lớp.
Ví dụ 1.12: Các lớp Người trẻ và Xe mới được kết nối bằng mối quan hệ liên kết
như, trong khi Xe mới và Nhà sản xuất được kết nối với mối quan hệ liên kết được thực hiện. Lớp Xe Mới là một lớp hội liên kết với lớp Người Trẻ và cũng có một hội khác. Về mặt hình thức, để các lớp c1 và c2 được kết nối với mối quan hệ kết hợp R12
và các lớp c2 và c3 được kết nối với mối quan hệ kết hợp R23. Giả sử rằng ngoài lớp c2, các lớp c1 và c3 không được kết nối với bất kỳ lớp nào khác. Cũng giả sử rằng c1, c2 và c3 có các thuộc tính k1, k2 và k3 tương ứng, các giá trị của chúng dùng để nhận dạng đối tượng. Sau đó, c1 và c3 được chuyển thành lớp c1 với một thuộc tính bổ sung k2 và lớp c3 với một thuộc tính bổ sung k2, tương ứng, trong lược đồ cơ sở dữ liệu
49
hướng đối tượng mờ. Tuy nhiên, c2 được chuyển thành lớp c2 với hai thuộc tính bổ sung k1 và k3 trong lược đồ cơ sở dữ liệu hướng đối tượng mờ.
CLASS 𝑐1′ ATTRIBUTES
k1:
k2: DOMAIN set values …
pD: DOMAIN [0; 1] TYPE OF number
END
CLASS 𝑐2′ ATTRIBUTES
k2:
k1: DOMAIN single values …
pD: DOMAIN [0; 1] TYPE OF number
END
Hình 1.11: Chuyển đổi các liên kết trong UML mờ sang lược đồ cơ sở dữ liệu hướng đối tượng mờ
1.3.10.6 Chuyển đổi các quan hệ phụ thuộc
Trong mối quan hệ phụ thuộc mờ, lớp khách hàng phụ thuộc mờ vào lớp nhà cung cấp. Có một số kỹ thuật chung để biến đổi mối quan hệ phụ thuộc (mờ). Kỹ thuật thứ nhất là bàn về lớp độc lập, trong đó các lớp khách hàng và nhà cung cấp được chuyển đổi bằng cách sử dụng các phương pháp chuyển đổi của các lớp đã cho ở trên và mối quan hệ phụ thuộc được nêu trong các lớp được chuyển đổi như một loại ràng buộc. Kỹ thuật thứ hai là bàn về mối quan hệ kết tập trong đó lớp khách hàng được coi là một phần cấu thành của lớp nhà cung cấp và được chuyển thành thuộc tính lớp phức của lớp kết tập. Ở đây, lớp kết tập được chuyển đổi từ lớp nhà cung cấp theo các cách tiếp cận chuyển đổi của các kết tập đã cho ở trên. Kỹ thuật cuối cùng là bàn về sự kết
CLASS 𝑐1′ ATTRIBUTES
k1:
k2 WITH μ DEGREE: DOMAIN set values
…
pD: DOMAIN [0; 1] TYPE OF number
END
CLASS 𝑐2′
ATTRIBUTES
k2:
k1 WITH μ DEGREE: DOMAIN set values …
pD: DOMAIN [0; 1] TYPE OF number
END C1 C2 R 1 1..* C1 C2 𝜇(𝑅)𝑅 1 1..*
50
hợp trong đó các lớp khách hàng và nhà cung cấp được chuyển đổi tương tự nhau bằng cách sử dụng các phương pháp tiếp cận chuyển đổi của các kết hợp được đưa ra ở trên với một sự khác biệt nhỏ được lưu ý dưới đây.
Gọi các lớp c1 và c2 là các lớp nhà cung cấp và lớp khách hàng. Giả sử rằng các giá trị của thuộc tính k1 trong c1 và thuộc tính k2 trong c2 đóng vai trò là định danh đối tượng. Sau đó, c1 và c2 có thể được chuyển đổi thành các lớp trong lược đồ cơ sở dữ liệu hướng đối tượng mờ. Tuy nhiên, sự phụ thuộc của c2 vào c1 phải được xem xét khi c2 được chuyển thành một lớp của lược đồ cơ sở dữ liệu hướng đối tượng mờ. Ở đây, k1 được thêm vào lớp 𝑐2′ được tạo từ lớp c2. Lưu ý rằng khác với phép biến đổi kết hợp, k2 không được thêm vào lớp 𝑐1′ được tạo từ c1.
1.3.11 Truy vấn mờ FOQL
Dựa trên mô hình lớp mờ và lược đồ mờ trên, ta xây dựng cấu trúc xử lý truy vấn mờ FOQL có dạng tổng quát như sau.
SELECT < attribute list >
FROM <Class_1 WITH threshold_1;
... ;
Class_m WITH threshold_m>
WHERE < query condition > THOLD threshold
Trong đó, <Query condition> là một điều kiện mờ và tất cả các ngưỡng là dãy số thuộc [0; 1]. Bằng cách sử dụng FOQL như vậy, người ta có thể có được các đối tượng này thuộc về lớp dưới ngưỡng nhất định và cũng đáp ứng các điều kiện truy vấn dưới ngưỡng cho cùng một điều kiện. Lưu ý rằng các mục THOLD threshold
ngưỡng có thể được bỏ qua. Trong trường hợp này mặc định của ngưỡng chính xác là 1.
1.4 Giải pháp cho bài toán
Việc ứng dụng toán học mờ vào các mô hình cơ sở dữ liệu nói chung và mô hình CSDL HĐT nói riêng là rất cần thiết để xử lý thông tin không chắc chắn, mơ hồ, hay không rõ ràng. Luận án đề xuất ba giải pháp sau:
- Tiền xử lý dữ liệu: Nhằm tăng tính hiệu quả cho quá trình lưu trữ và xử lý dữ liệu, luận án đề xuất phương pháp gom cụm và so sánh tính tương tự giữa hai đối tượng. Bên cạnh đó, luận án đề xuất thuật toán phân cụm EMC được cải tiến dựa trên thuật
51
toán Expectation Maximization (EM) bằng cách bổ sung bước (C) vào thuật toán để tăng độ mềm dẻo và giảm tối ưu hóa cục bộ và tăng tối ưu hóa toàn cục trong quá trình phân cụm. Kết quả của thuật toán gom cụm EMC được tiếp tục xử lý mờ hóa dữ liệu bằng phương pháp phân khoảng mờ.
- Xử lý truy vấn mờ: Thông qua các kết quả từ tiền xử lý dữ liệu, luận án đề xuất một số phương pháp xử lý truy vấn mờ mới dựa vào độ đo tương tự và gom cụm dữ liệu - Đề xuất đại số kết hợp mờ mới: luận án tập trung định nghĩa các phép toán kết hợp mờ như (Phép chọn mờ, phép nối mờ, phép chiếu mờ, phép chia mờ, phép trừ mờ, phép hợp mờ và phép giao mờ làm cơ sở cho việc xây dựng đại số truy vấn mờ cho mô hình cơ sở dữ liệu hướng đối tượng mờ. Luận án đề xuất kiến trúc xử lý và tối ưu hóa truy vấn mờ. Cụ thể, luận án phát triển thuật toán heuristic tối ưu hóa đại số đối tượng mờ dựa trên các quy tắc của phép biến đổi tương đương. Phân tích trên một số