Với các dạng chuẩn mờ đã nêu trong phần trên, phần này sẽ mở rộng các thuật toán được áp dụng cho quá trình chuẩn hoá CSDLQH truyền thống để chuẩn hoá một lược đồ CSDLQH dựa trên tính tương tự.
Để có thể trình bày các thuật toán chuẩn hoá trong ngữ cảnh của mô hình mới, trước hết cần phải định nghĩa lại một số khái niệm về bao đóng của tập phụ thuộc hàm mờ, bao đóng của tập các thuộc tính đối với tập các phụ thuộc hàm mờ, hai tập phụ thuộc hàm mờ tương đương, tập phụ thuộc hàm mờ tối thiểu. Các khái niệm này sẽ lần lượt được phát biểu lại dưới đây.
Định nghĩa 3.7. Cho lược đồ quan hệ R trên tập thuộc tính U={A1, A2,…, Am} với ngưỡng tương tự α=(α1, α2,…, αm) cho trước, F là một tập phụ thuộc hàm mờ trên U. Bao đóng của tập phụ thuộc hàm mờ F được định nghĩa là tập tất cả các phụ thuộc hàm mờ được suy ra từ F bằng cách áp dụng các luật suy dẫn.
Định nghĩa 3.8. Cho lược đồ quan hệ R trên tập thuộc tính U={A1, A2,…, Am} với ngưỡng tương tự α cho trước, F là tập phụ thuộc hàm mờ trên U tương ứng với ngưỡng tương tự α. X⊆U, X+ gọi là bao đóng của X được định nghĩa là X+={A∈U/ X≈→A∈F+}.
Định nghĩa 3.9. Cho lược đồ quan hệ R(U), U={A1, A2,…, Am} với ngưỡng tương tự α cho trước. Cho hai tập phụ thuộc hàm mờ F và G trên U tương ứng với ngưỡng α. Ta nói F tương đương với G nếu F+=G+.
Định nghĩa 3.10. Cho lược đồ quan hệ R(U), U={A1, A2,…, Am} với ngưỡng tương tự α cho trước. F là tập phụ thuộc hàm mờ trên U tương ứng với ngưỡng α. F được gọi là tập phụ thuộc hàm mờ tối thiểu nếu:
i) Vế phải của các phụ thuộc hàm mờ của F chỉ chứa một thuộc tính. F={Li≈→Ai/ Li⊆U, Ai là một thuộc tính của U, i=1,2,…,m} ii) F không dư thừa một phụ thuộc hàm mờ nào.
∀i=1,2,…,m có (F\{Li ≈→Ai})+≠F+. iii) F không dư thừa một thuộc tính nào.
∀i= 1,2,…,m, xét Li≈→Ai với Li=Ai1Ai2…Ain (n>1) thì ∀j=1,2,…,n (F\ {Li≈→Ai})∪{Li\Aij≈→Ai} không tương đương với F.
Với các khái niệm trên, tiếp theo đây sẽ lần lượt nêu các thuật toán cần thực hiện trong quá trình chuẩn hoá một lược quan hệ dựa trên tính tương tự. Trong các thuật toán này cần phải qui ước rằng tập phụ thuộc hàm mờ F trên tập thuộc tính U là tương ứng với một ngưỡng tương tự α đã xác định trước nếu không đề cập đến. Thuật toán 3.1. (Thuật toán tính X+)
Đầu vào: Tập hữu hạn các thuộc tính U, tập phụ thuộc hàm mờ F trên U tương ứng với ngưỡng α cho trước, tập thuộc tính X⊆U.
Đầu ra: X+, bao đóng của X đối với F.
Cách tính: Tính liên tiếp tập các thuộc tính X0, X1,… theo qui tắc: Bước 0: Đặt X0=X.
Bước i: Xi+1=Xi∪A nếu ∃(Y≈→A)∈F, A∈Z và Y⊆Xi. Ngược lại thì Xi+1=Xi. Do X=X0⊆ …⊆U, U là hữu hạn cho nên sẽ tồn tại một chỉ số i nào đó mà Xi=Xi+1, khi đó thuật toán sẽ dừng và đặt X+=Xi.
Định lý 3.1. Thuật toán 3.1 tính X+ là đúng.
Việc chứng minh định lý này tương tự như trường hợp cổ điển. Bổ đề 3.1. X≈→Y nếu và chỉ nếu Y⊆X+.
Thuật toán 3.2. Kiểm tra X≈→Y∈F+.
Vào: tập thuộc tính U, tập phụ thuộc hàm mờ F, X⊆U, Y⊆U. Ra: X≈→Y∈F+ đúng hay sai.
Cách tính:
Bước 1: Tính X+ theo Thuật toán 3.1.
Bước 2: Kiểm tra Y⊆X+ đúng hay sai, nếu đúng thì X≈→Y∈F+ còn sai thì X≈→Y∉F+.
Thuật toán 3.3. Kiểm tra tính tương đương của hai tập phụ thuộc hàm. Vào: F, G – các tập phụ thuộc hàm mờ trên U.
F={Li≈→Ri/ i=1,2,…,m}, G={Lj’≈→Rj’/ j=1,2,…,n}.
Ra: kết luận F tương đương với G hoặc F không tương đương với G.
F tương đương với G khi và chỉ khi F+=G+ tức là đồng thời F+⊆G+ và G+⊆F+. Cách làm:
Bước 1: ∀i=1,2,…,m kiểm tra Li≈→Ri∈G+ đúng hay sai theo Thuật toán 3.2, nếu đúng thì thực hiện Bước 2 còn nếu sai thì kết luận F không tương đương với G.
Bước 2: ∀j=1,2,…,n kiểm tra Lj’≈→Rj’∈F+ đúng hay sai theo Thuật toán 3.2, nếu đúng thì kết luận F tương đương với G còn nếu ngược lại thì kết luận F không tương đương với G.
Thuật toán 3.4. Tìm phủ không dư thừa.
Vào: tập phụ thuộc hàm mờ F trên tập thuộc tính U.
Ra: F’ tương đương với F và F’ không dư thừa một phụ thuộc hàm mờ nào. Cách làm:
Bước 0: đặt F0=F.
Bước i: Tính Fi=Fi-1\{Li≈→Ri}nếu Li≈→Ri∈(Fi-1\{Li≈→Ri})+. Ngược lại Fi=Fi-1.
Do F là hữu hạn cho nên sẽ tồn tại một chỉ số i nào đó mà Fi+1=Fi, khi đó thuật toán sẽ dừng và cho F’=Fi.
Thuật toán 3.5. Tìm phủ tối thiểu.
Vào: F - tập phụ thuộc hàm mờ trên U, F={Li≈→Ri/ i=1,2,…,m}. Ra: F’ tương đương với F và F’ là tập phụ thuộc hàm mờ tối thiểu. Cách làm:
Bước 1: ∀i=1,2,…,m, nếu Ri=Ai1Ai2…Aik, k>1 thì thay Li≈→Ri bởi Li≈→Aij, j=1,2,..k. Khi đó sẽ được F1={Li≈→Ai/ i=1,2,..,m1}
Bước 2: Tìm phủ không dư thừa của F1 theo Thuật toán 3.4. kết quả được F2={Li≈→Ai/ i=1,2,…,m2}.
Bước 3: ∀i=1,2,…,m2, nếu Li=Ai1Ai2…Aik, k>1: 1) Đặt Li0=Li.
2) Lặp Lij= Lij-1\Aij nếu Lij-1\Aij≈→Ai. Ngược lại Lij=Lij-1. Khi nào tồn tại chỉ số j mà Lij+1=Lij thì dừng và đặt Li =Lij.
Kết quả cuối cùng được F3={Li≈→Ai/ i=1,2,..,m3}, đặt F’=F3 là tập phụ thuộc hàm mờ tối thiểu.
Thuật toán 3.6. Chuẩn hoá sơ đồ quan hệ về dạng chuẩn mờ thứ hai bảo toàn tập phụ thuộc hàm mờ.
Vào: Lược đồ quan hệ R trên tập thuộc tính U và tập phụ thuộc hàm mờ F.
Ra: Phép tách t chuẩn hoá R về dạng chuẩn mờ thứ hai bảo toàn tập phụ thuộc hàm mờ.
Cách làm:
Bước1: Tính U0=U\ m
i∪=1LiAi.
Bước 2: Kiểm tra nếu ∃Li≈→Ai∈F mà LiAi=U\U0 thì t=<U\U0> và dừng thuật toán.
Bước 3: Với mọi phụ thuộc hàm mờ xét ∀i=1,2,..,m nếu Li≈→Ai1,…, Li≈→Aik thì Si=<LiAi1…Aik>, Fi={Li≈→Ai1,…, Li≈→Aik}.
Cuối cùng được phép tách t={Si}
Thuật toán 3.7. Tìm một khoá tối thiểu.
Vào: Tập thuộc tính U={A1, A2,…, An} và tập phụ thuộc hàm mờ F trên U. Ra: K – Khoá tối thiểu.
Cách làm:
Bước 0: Đặt K0=U.
Bước 2: Lặp Ki=Ki-1\{Ai} nếu Ki-1\{Ai}≈→U. Ngược lại thì Ki=Ki-1, và bước lặp sẽ dừng. Đặt K=Ki.
Thuật toán 3.8. Chuẩn hoá lược đồ quan hệ R về dạng chuẩn mờ thứ hai không làm mất mát thông tin và bảo toàn tập phụ thuộc hàm mờ.
Vào: Lược đồ quan hệ mờ R trên tập thuộc tính U và tập phụ thuộc hàm mờ F. Ra: Phép tách không mất mát thông tin và bảo toàn tập phụ thuộc hàm mờ sao cho mỗi lược đồ con đều ở dạng chuẩn mờ thứ hai.
Bước 1: Tìm phép tách t bảo toàn tập phụ thuộc hàm mờ theo Thuật toán 3.6. Bước 2: Tìm một khoá tối thiểu theo Thuật toán 3.7.
Bước 3: t’=<Si>, nếu tồn tại Si mà K⊆Ui thì t=t’ ngược lại thì t=t’∪<K>. 3. Kết luận
Như vậy chương này đã trình bày hai dạng chuẩn của một lược đồ CSDLQH dựa trên tính tương tự. Hai dạng chuẩn này tương ứng với hai dạng chuẩn một và chuẩn hai trong mô hình CSDLQH truyền thống. Về các dạng chuẩn hoá có thể tiếp tục nghiên cứu các dạng tương ứng với dạng chuẩn bốn và dạng chuẩn Boye-Codd.
Chương này cũng đã đưa ra những thuật toán để tiến hành chuẩn hoá một lược đồ quan hệ dựa trên tính tương tự khi trên lược đồ đó đã xác định một ngưỡng tương tự α và một tập các phụ thuộc hàm mờ tương ứng với ngưỡng α đó.
Chương IV. Cài đặt thử nghiệm
Chương này trình bày phần cài đặt một mô đun cho phép thực hiện các thao tác xử lý với các dữ liệu của các quan hệ trên một lược đồ thuộc mô hình đang xem
xét, tiếp theo sẽ sử dụng mô đun đó để thao tác thử nghiệm trên CSDL được sử dụng minh hoạ trong Chương II.