Luận văn tốt nghiệp Tiếp cận lý thuyết tập thô do Z.Pawlak Lý thuyết tập thô được nhà logoc học Balan Zdzilaw Pawlak đề xuất ra vào đầu những năm 80 của thế...
Luận văn tốt nghiệp Tiếp cận lý thuyết tập thô Z.Pawlak Mục lục Danh mục thuật ngữ Bảng ký hiệu Danh sách bảng Phần mở đầu Chương Các khái niệm 10 1.1 Giới thiệu 10 1.2 Hệ thống thông tin tập thô 11 1.2.1 Hệ thống thông tin 11 1.2.2 Quan hệ không phân biệt 12 1.2.3 Các tập xấp xỉ 13 1.2.4 Các tính chất xấp xỉ 15 1.2.5 Độ xác xấp xỉ 16 1.3 Bảng định 16 1.3.1 Rút gọn lõi 17 1.3.2 Ma trận hàm phân biệt 18 1.3.3 Luật định 23 1.4 Phụ thuộc xấp xỉ 24 1.4.1 Hàm thành viên thô 24 1.4.2 Phụ thuộc hàm xấp xỉ 25 1.4.3 Rút gọn xấp xỉ 28 Chương Một số thuật tốn tìm tập rút gọn 31 2.1 Mở đầu 31 2.2 Thuật toán sử dụng phép toán đại số 32 2.2.1 Tập lõi bảng định 32 2.2.2 Đặc trưng tập rút gọn 36 2.2.3 Các thuật toán 39 2.3 Thuật toán dựa vào số cặp phân biệt 43 2.3.1 Một số ký hiệu 43 2.3.2 Cơ sở toán học 45 2.3.3 Thuật toán 47 2.4 Thuật tốn tìm rút gọn xấp xỉ 52 2.4.1 Đặt vấn đề 52 2.4.2 Sai số rút gọn xấp xỉ 52 2.4.3 Các thuật tốn tìm rút gọn xấp xỉ Chương Khám phá phụ thuộc đa trị 54 58 3.1 Mở đầu 58 3.2 Khảo sát phụ thuộc Ma trận phụ thuộc 60 3.2.1 Phụ thuộc phụ thuộc xấp xỉ 60 3.2.2 Đặc trưng phụ thuộc ma trận phụ thuộc 63 3.3 Thuật toán kiểm định tìm kiếm phụ thuộc 69 3.3.1 Thuật tốn tính độ dầy đặc dãy ma trận 69 3.3.2 Thuật toán kiểm định phụ thuộc xấp xỉ 73 3.3.3 Thuật tốn tìm kiếm phụ thuộc tối tiểu vế phải 75 3.4 Mở rộng phụ thuộc hàm phụ thuộc đa trị 77 3.4.1 Quan hệ tương tự 78 3.4.2 Phụ thuộc mở rộng tính chất 81 3.4.3 Đặc trưng β−phụ thuộc ma trận phụ thuộc 84 3.4.4 Thuật toán kiểm định β−phụ thuộc đa trị 88 3.5 Kết luận 91 Phần Kết luận 92 Tài liệu 94 Chương DANH MỤC CÁC THUẬT NGỮ Hệ thống thông tin () Tập thô (Rough Set) Quan hệ không phân biệt Tập xấp xỉ Tập xấp xỉ Bảng định Rút gọn Lõi Ma trận phân biệt Hàm phân biệt Luật định Phụ thuộc hàm Phụ thuộc đa trị Phụ thuộc xấp xỉ Chương BẢNG CÁC KÝ HIỆU A = (U, A): Hệ thống thông tin u(a): Giá trị đối tượng u thuộc tính a IND(B): Quan hệ B−khơng phân biệt IND(B|V ): Quan hệ B−không phân biệt cảm sinh tập V [u]B : Lớp tương đương chứa u quan hệ IND(B) U/B: Tập hợp thương quan hệ IND(B) V /B: Tập hợp thương quan hệ IND(B|V ) BV : B−xấp xỉ V BV : B−xấp xỉ V POSB (D) : B−miền khẳng định D T = (U, C ∪ D): Bảng định Lower[B]/[D] : B−xấp xỉ tương ứng với D U Upper[B]/[D] : B−xấp xỉ tương ứng với D U Boundary[B]/[D] : B−biên tương ứng với D U k(R, D): Độ phụ thuộc tập thuộc tính định D vào tập thuộc tính điều kiện R m(cj , R): Khả đóng góp thuộc tính cj vào R V ωB (cj ): Số cặp đối tượng V tập thuộc tính B khác thuộc tính cj V ωB (D): Số cặp đối tượng V tập thuộc tính B khác tập thuộc tính D ω V (cj ): Số cặp đối tượng V khác thuộc tính cj ω V (D): Số cặp đối tượng V khác tập thuộc tính D ωB (cj ): Số cặp đối tượng U tập thuộc tính B khác thuộc tính cj ωB (D): Số cặp đối tượng U tập thuộc tính B khác tập thuộc tính D X →: Y khơng phụ thuộc hàm vào X U Y X → Y : Y không phụ thuộc đa trị vào X U / → X→V Y : Y phụ thuộc hàm vào X tập V ⊆ U X→→V Y : Y phụ thuộc đa trị vào X tập V ⊆ U α,β X −→ Y : Y (α, β)− phụ thuộc hàm vào X U α,β X →→ Y : Y (α, β)− phụ thuộc đa trị vào X U Danh sách bảng 1.1 Bảng liệu đồ chơi 13 1.2 Các triệu chứng bệnh nhân 14 1.3 Bảng định bệnh cúm 1.4 Bảng rút gọn thứ hệ thống bệnh cúm (R1 ) 19 1.5 Bảng rút gọn thứ hai hệ thống bệnh cúm (R2 ) 19 1.6 Dữ liệu bảng định 20 1.7 Ma trận phân biệt M 21 1.8 Bảng chọn ứng cử viên vào ngạch giảng dạy 24 1.9 Bảng liệu 26 2.1 Bảng thông tin xe 35 2.2 Bảng liệu đồ chơi 45 2.3 Bảng chọn lựa giáo viên 49 2.4 Bảng liệu cho ví dụ rút gọn xấp xỉ 54 3.1 Bảng liệu sinh viên 62 3.2 Dữ liệu hệ thống 67 3.3 Bảng liệu lập trình viên 80 18 3.4 Quan hệ tương tự Ib 80 3.5 Quan hệ tương tự Ic 80 3.6 Dữ liệu hệ thống 83 3.7 Các quan hệ tương tự IX , IY IZ 83 3.8 Bảng liệu 86 3.9 Các quan hệ tương tự IY IZ 86 Chương PHẦN MỞ ĐẦU Lý thuyết tập thô Zdzisaw Pawlak [24] đề xuất vào năm đầu thập niên tám mươi kỷ hai mươi áp dụng ngày rộng rãi nhiều lĩnh vực khoa học máy tính Lý thuyết tập thơ phát triển tảng toán học vững cung cấp cơng cụ hữu ích để giải toán phân lớp liệu, phát luật v.v đặc biệt thích hợp tốn chứa liệu mơ hồ không chắn Mười lăm năm trở lại đánh dấu phát triển mạnh mẽ lĩnh vực khai phá liệu phát tri thức sở liệu Trong xu đó, nhiều nhóm khoa học giới nghiên cứu, phát triển lý thuyết tập thô vào lĩnh vực nghiên cứu ứng dụng bật Về phương diện nghiên cứu phát triển ứng dụng lý thuyết tập thô vào lĩnh vực ngân hàng, tài chính, sinh học (biểu thị gen), kể đến cơng trình nghiên cứu [7, 8, 9, 10, 11, 12, 13, 18, 19, 20, 23, 27] Về phương diện nghiên cứu phát triển mơ hình giải pháp theo tiếp cận tập thơ kể đến cơng trình [14, 26] quan tâm đến tốn tính tốn lõi rút gọn, cơng trình [15, 16, 17, 25, 31, 32] nghiên cứu tìm kiếm ràng buộc liệu Lý thuyết tập thơ cho phép trình diễn mơ hình hình thức tri thức từ bảng liệu đơn Mô hình xác định họ mối quan hệ "không 87 3.4.3 Đặc trưng β−phụ thuộc ma trận phụ thuộc Trong Mục 3.2 để nghiên cứu phụ thuộc đa trị, thiết lập ma trận phụ thuộc dựa vào phân hoạch giá trị thuộc tính chứng minh rằng, X →→ Y ma trận phụ thuộc dầy đặc, tức phần tử ma trận có giá trị Trong trường hợp ma trận phụ thuộc gần đặc (tức chứa phần lớn số 1), ta nhận phụ thuộc đa trị xấp xỉ (tức bỏ số đối tượng bảng liệu nhận phụ thuộc đúng) Trên sở kết này, thuật toán kiểm chứng phụ thuộc phụ thuộc xấp xỉ dựa vào ma trận phụ thuộc thiết lập Phát triển ý tưởng đó, xây dựng ma trận có vai trị tương tự việc xác định β−phụ thuộc đa trị 1,β Giả sử X, Y ⊆ A U/X = {U1 , U2 , · · · , Um } Rõ ràng, X →→ Y 1,β U X →→ Y Ui Do đó, ta hạn chế việc kiểm tra phụ thuộc Ui cố định Ký hiệu Z = A \ (X ∪ Y ) Giả sử dom(Ui , Y ) = {ξ1 , ξ2 , · · · , ξp(i) } dom(Ui , Z) = {η1 , η2 , · · · , ηq(i) } Với ξj , ηk ta ký hiệu Ej := {t(Z) | t ∈ Ui ; t(Y ) = ξj } ⊆ dom(Ui , Z); Fk := {t(Y ) | t ∈ Ui ; t(Z) = ηk } ⊆ dom(Ui , Y ) Ta gọi ma trận phụ thuộc mở rộng, tương ứng với lớp Ui , Di = (djk )p(i)×q(i) , với thành phần djk xác định bởi: djk := max{µ(ξj , Fk ), µ(ηk , Ej )} Ma trận Di gọi β−dầy đặc với j, k ta có djk ≥ β, hay, cách tương đương: ξj ∈β Fk ηk ∈β Ej Tương tự phụ thuộc đa trị kinh điển, β−phụ thuộc đa trị đặc trưng hoàn toàn họ ma trận phụ thuộc mở rộng Di Điều khẳng định định lý sau 88 Định lý 3.6 Y β−phụ thuộc đa trị vào X Di β−dầy đặc, với ≤ i ≤ m Chứng minh 1,β Giả sử X →→ Y Chúng ta chứng minh Di ma trận β−dầy đặc Thật vậy, với ≤ j ≤ p(i) ≤ k ≤ q(i), tồn hai đối tượng u, v ∈ Ui cho u(Y ) = ξj v(Z) = ηk Vì u v thuộc lớp Ui nên u(X) = v(X) Theo định nghĩa β−phụ thuộc đa trị, tồn đối tượng t ∈ Ui thoả mãn hai điều kiện sau a) t(Y ) = u(Y ) = ξj t(Z) =β v(Z) = ηk , b) t(Y ) =β u(Y ) = ξj t(Z) = v(Z) = ηk Nếu trường hợp a) xãy t(Z) ∈ Ej ηk =β t(Z) Do đó, µ(ηk , Ej ) ≥ β Tương tự, b) xãy µ(ξj , Fk ) ≥ β Cả hai trường hợp dẫn đến djk ≥ β Vì điều với djk nên Di ma trận β−dầy đặc Ngược lại, giả sử Di ma trận β− dầy đặc Cho hai đối tượng tuỳ ý u, v ∈ U thoả mãn u(X) = v(X) Lúc đó, u v phải thuộc lớp tương đương Ui Đặt ξj = u(Y ) ηk = v(Z) Do djk ≥ β nên ta có i) µ(ξj , Fk ) ≥ β, ii) µ(ηk , Ej ) ≥ β Nếu i) tồn t ∈ Ui cho t(Z) = ηk = v(Z) t(Y ) =β ξj = u(Y ), cịn ii) tồn t ∈ Ui cho t(Y ) = ξj = u(Y ) t(Z) =β ηk = v(Z) 1,β Trong hai trường hợp, t thoả mãn điều kiện Định nghĩa 3.3 Vậy X →→ Y định lý chứng minh Ví dụ 3.4 Xét hệ thống A = (U, {X, Y, Z}) cho Bảng 3.8, quan hệ tương tự VY VZ cho Bảng 3.9 89 U X Y Z t1 x1 y1 z1 t2 x1 y2 z1 t3 x1 y3 z2 t4 x1 y1 z2 t5 x1 y3 z3 t6 x1 y2 z3 t7 x2 y1 z1 t8 x2 y1 z2 Bảng 3.8: Bảng liệu Y y1 y2 y3 Z z1 z2 z3 y1 0.5 0.7 z1 0.6 0.7 y2 05 0.9 z2 06 0.8 y3 0.7 0.9 z3 0.7 0.8 Bảng 3.9: Các quan hệ tương tự IY IZ 90 1, 0.8 Khi đó, ta có X →→ Y U/X = {U1 , U2 }, với U1 = {t1 , t2 , t3 , t4 , t5 , t6 } U2 = {t7 , t8 } Trên lớp U1 ta có dom(U1 , Y ) = {y1 , y2 , y3 }, dom(U1 , Z) = {z1 , z2 , z3 } E1 = {t(Z) | t ∈ U1 , t(Y ) = y1 } = {z1 , z2 }; E2 = {t(Z) | t ∈ U1 , t(Y ) = y2 } = {z1 , z3 }; E3 = {t(Z) | t ∈ U1 , t(Y ) = y3 } = {z2 , z3 }; F1 = {t(Y ) | t ∈ U1 , t(Z) = z1 } = {y1 , y2 }; F2 = {t(Y ) | t ∈ U1 , t(Z) = z2 } = {y1 , y3 }; F3 = {t(Y ) | t ∈ U1 , t(Z) = z3 } = {y2 , y3 } Từ phần tử ma trận D1 xác định bởi: d11 = max{µ(y1 , F1 ), µ(z1 , E1 )} = max{1; 1} = 1; d12 = max{µ(y1 , F2 ), µ(z2 , E1 )} = max{1; 1} = 1; d13 = max{µ(y1 , F3 ), µ(z3 , E1 )} = max{0.7; 0.8} = 0.8; d21 = max{µ(y2 , F1 ), µ(z1 , E2 )} = max{1; 1} = 1; d22 = max{µ(y2 , F2 ), µ(z2 , E2 )} = max{0.9; 0.8} = 0.9; d23 = max{µ(y2 , F3 ), µ(z3 , E2 )} = max{1; 1} = 1; d31 = max{µ(y3 , F1 ), µ(z1 , E3 )} = max{0.9; 0.7} = 0.9; d32 = max{µ(y3 , F2 ), µ(z2 , E3 )} = max{1; 1} = 1; d33 = max{µ(y3 , F3 ), µ(z3 , E3 )} = max{1; 1} = Tương tự, lớp U2 ta có dom(U2 , Y ) = {y1 }, dom(U2 , Z) = {z1 , z2 } tính tốn đơn giản ta thu phần tử ma trận D2 d11 = d12 = Tóm lại, ta 91 1 0.8 D1 = 0.9 , 0.9 1 D2 = 1 Rõ ràng với β ≤ 0.8 hai ma trận D1 D2 β−dầy đặc Do 1,β X →→ Y , với β ≤ 0.8 Trong đó, β > 0.8 D1 khơng β−dầy đặc nên 1,β X → Y / → 3.4.4 Thuật toán kiểm định β−phụ thuộc đa trị 1,β Từ Định lý 3.6, thấy việc kiểm tra phụ thuộc dạng X →→ Y thực chất kiểm tra tính β−dầy đặc tất ma trân phụ thuộc mở rộng Di Vì trước hết cần xây dựng thuật tốn tính ma trận Di sau thiết lập thuật tốn kiểm định β−phụ thuộc Cũng cần lưu ý họ lớp tương đương U/X = {U1 , U2 , · · · , Um } nhận sau phép xếp đối tượng U theo thứ tự giá trị dom(X) Vì vậy, thuật tốn sau tính Di Ui cho trước Thuật tốn 3.4 Tính Di Input: Tập thuộc tính A, tập X, Y ⊆ A, Lớp tương đương thứ i quan hệ IND(X): Ui , Các quan hệ tương tự thuộc tính Output: Di = (djk )p(i)×q(i) Method: Tính dom(Ui , Y ) = {ξ1 , ξ2 , · · · , ξp(i) }; dom(Ui , Z) = {η1 , · · · , ηq(i) }; For j := to p(i) For k := to q(i) 92 Begin d1 := 1; { µ(ξj , Fk )} d2 := 1; { µ(ηk , Ej )} For t ∈ Ui Begin If (t(Z) = ηk ) and (S(ξj , t(Y )) < d1) then d1 := S(ξj , t(Y )); 10 If (t(Y ) = ξj ) and (S(ηk , t(Z)) < d2) then 11 d2 := S(ηk , t(Z)); 12 13 End djk := max{d1 , d2 }; 14 15 End Để tính dom(Ui , Y ) = {ξ1 , ξ2 , · · · , ξp(i) }; dom(Ui , Z) = {η1 , · · · , ηq(i) }; thực thao tác sau: Khởi tạo p(i) = q(i) = 0; dom(Ui , Y ) = dom(Ui , Z) = {}; For t ∈ Ui Begin If t(Y ) ∈ dom(Ui , Y ) then Begin inc(p(i)); ξp(i) := t(Y ); dom(Ui , Y ) := dom(Ui , Y ) ∪ {ξp(i) }; End; 93 10 If t(Z) ∈ dom(Ui , Z) then 11 Begin 12 inc(q(i)); 13 ηq(i) := t(Z); 14 dom(Ui , Z) := dom(Ui , Z) ∪ {ηq(i) }; 15 End; 16 End Sử dụng Thuật toán 3.4 ta nhận thuật toán kiểm định β−phụ thuộc đa trị sau: Thuật toán 3.5 Kiểm định β−phụ thuộc đa trị Input: Tập đối tượng U , Tập thuộc tính A, tập X, Y ⊆ A, Các quan hệ tương tự thuộc tính, Mức β ∈ [0, 1] 1,β Output: X →→ Y ? Method: Phân hoạch U/X = {U1 , U2 , · · · , Um }; OK:=True; i:=0; Repeat inc(i); Tính Di ; If Di khơng β−dầy đặc then OK:=False; 94 Until (Not OK) or (i = m) 3.5 Kết luận Như vậy, hai cách tiếp cận khác nhau, chương mở rộng khái niệm phụ thuộc hàm phụ thuộc đa trị định nghĩa mở rộng khái niệm phụ thuộc kinh điển Các phụ thuộc nói chung phụ thuộc xấp xỉ hệ thống Cách thứ nhất, thu hẹp miền tác động phụ thuộc hàm phụ thuộc đa trị, miền "đủ lớn" phụ thuộc tương ứng chấp nhận kèm theo đánh giá "sai số" Cách thứ hai, sử dụng quan hệ tương tự giá trị thuộc tính, theo cách tiếp cận này, đưa khái niệm (α, β)− phụ thuộc hàm phụ thuộc đa trị, Việc đưa khái niệm thực có ý nghĩa thực tế nhiều lý khác Ngồi việc chứng minh số tính chất phụ thuộc mở rộng, dựa vào ma trận phụ thuộc, chúng tơi cịn đưa tiêu chuẩn đại số để xác định phụ thuộc hàm, phụ thuộc đa trị đồng thời đưa thuật tốn tìm tất phụ thuộc tối tiểu Đối với phụ thuộc theo nghĩa mở rộng, cách sử dụng họ ma trận phụ thuộc, chúng tơi đưa thuật tốn kiểm định phụ thuộc xấp xỉ (1, β)− phụ thuộc đa trị Đối với trường hợp α < 1, việc kiểm chứng phụ thuộc đa trị phức tạp dùng họ ma trận phụ thuộc Bởi họ xây dựng dựa lớp tương đương quan hệ không phân biệt X, với α < quan hệ α−tương tự khơng cịn quan hệ tương đương Vì vấn đề nghiên cứu mở rộng phụ thuộc đa trị, việc xây dựng tiêu chuẩn kiểm định (α, β)−phụ thuộc với α β tuỳ ý tốn cịn tiếp tục nghiên cứu 95 Chương PHẦN KẾT LUẬN Phát luật theo tiếp cận lý thuyết tập thô Z Pawlak [24] đề xuất phương pháp nhiều nhà khoa học nghiên cứu sử dụng trình khai phá tri thức từ liệu Do liệu thực tế thường đa dạng, không đầy đủ, thiếu xác mà lại dư thừa nên việc chọn lọc thuộc tính đặt nhằm loại bỏ thuộc tính dư thừa mà giữ đầy đủ ý nghĩa bảng liệu xét Ngoài ra, việc phát mối ràng buộc vốn có liệu cho nhà nghiên cứu quản lý có nhìn đầy đủ với liệu họ có Đó vấn đề luận án nghiên cứu Kết luận án trình bày tóm lược sau: Xây dựng thuật tốn heuristic tìm tập rút gọn bảng định với độ phức tạp theo thời gian đa thức Các thuật toán xây dựng sở đưa tiêu chuẩn đánh giá tập thuộc tính điều kiện tập rút gọn Hai thuật toán đầu dựa độ phụ thuộc tập thuộc tính điều kiện khả đóng góp thuộc tính tính tốn phép toán đại số quan hệ Thuật toán thứ ba dựa vào số cặp đối tượng phân biệt tập thuộc tính cho trước Ý tưởng thuật toán dựa ma trận phân biệt Tuy nhiên, kích thước ma trận lớn bảng liệu lớn, việc tìm kiếm tập rút gọn theo ma trận 96 phương pháp trình bày [26, 27] khó thực Thuật tốn luận án đề nghị khơng tính tốn phần tử ma trận Xây dựng thuật tốn tìm tập rút gọn xấp xỉ dựa vào thuật toán Phần Thiết lập đặc trưng phụ thuộc hàm phụ thuộc đa trị ma trận phụ thuộc Đưa điều kiện cần đủ cho phụ thuộc đa trị dựa vào quan hệ “khơng phân biệt được“, từ xây dựng thuật toán kiểm định phụ thuộc phụ thuộc đa trị xấp xỉ Xây dựng thuật toán tìm kiếm phụ thuộc đa trị tối tiểu vế phải Mở rộng phụ thuộc hàm phụ thuộc đa trị dựa vào quan hệ tương tự tập giá trị thuộc tính đưa tính chất phụ thuộc mở rộng Đặc trưng β−phụ thuộc ma trận phụ thuộc đưa thuật tốn kiểm định β−phụ thuộc đa trị Các hướng tiếp tục nghiên cứu Đưa giải pháp rút gọn bảng liệu thiếu thông tin Xây dựng tiêu chuẩn đại số kiểm định phụ thuộc đa trị mở rộng trường hợp tổng quát 97 Tài liệu tham khảo [1] Hoàng Thị Lan Giao (2005), “Một số thuật tốn tìm tập rút gọn bảng định sử dụng phép toán đại số quan hệ“, Tạp chí Khoa học, Khoa học Tự nhiên Công nghệ, Đại học Quốc gia Hà Nội, T.XXI (2PT), 41-48 [2] Hồ Thuần, Hoàng Thị Lan Giao (2005), “Một thuật tốn tìm tập rút gọn sử dụng ma trận phân biệt được“, Chun san Các cơng trình nghiên cứu triển khai Viễn thông CNTT, (15), tr 83-87 [3] Hồ Thuần, Hoàng Thị Lan Giao (2006), “Khám phá phụ thuộc đa trị dựa vào ma trận phụ thuộc“, Tin học điều khiển(1), tr [4] Hồ Thuần, Hoàng Thị Lan Giao (2006), “Mở rộng phụ thuộc hàm phụ thuộc đa trị“, Tin học điều khiển (đã gửi đăng) [5] Hoàng Thị Lan Giao (2006), “Khai phá luật theo tiếp cận tập thô“, Đề tài NCKH cấp Bộ trọng điểm B2005-07-02 , nghiệm thu tháng 3/2006 [6] Hà Quang Thuỵ (1996), Tập thô đánh giá hệ thơng tin nền, Tạp chí Khoa học Đại học Quốc gia Hà Nội, KHTN, XII (3) Tài liệu tiếng Anh [7] Ho Tu Bao (1996), Introduction to Knowledge Discovery and Data Mining, Institude of Information Technology National Center for Natural Science and Technology 98 [8] Shrabonti Ghosh, S.S.Alam (2003), “Generalized Rough Approach to Reduction of a Decíion Table“, International Journal of Intelligent Systems Vol 18, 499-508 [9] Shrabonti Ghosh, Ranjit Biswas, S.S Alam (2004), “Reduction of the Decision Table: A Roughset Approach“, International Journal of Intelligent Systems, Vol 19 [10] Paolo Guidici (2003), Applied Data Mining, Statistical Methods for Business and Industry, Faculty of Economics, University of Pavia, Italy [11] Jiawei Han, Micheline Kamber (2001), Data Mining: Concepts and Techniques, Morgan Kaupmann Publishers [12] Nguyen S Hoa, Nguyen H Son (1996), “Some Efficient Algorithms for Rough Set Methods" Proceedings of the sixth International Conference on Information Processing Management of Uncertainty in Knowledge-Based Systems, 1451-1456 [13] Nguyen S Hoa, Andrzej Skowron, Piotr Synak (1997), “Knowledge Discovery in Databases: Rough Set Approach“ Proc of the Seventh International Fuzzy Systems Association World Congress, Vol II, pp 204-209, IFSA’97, Prague, Czech Republic [14] Xiaohua Hu, Jianchao Han, T.Y.Lin (2004), “A New Rough Sets Model Based on Database Systems" Fundamenta Informaticae XX 1-18 [15] Yka Huhtala, Juha Karkkainen, Pasi Porkka and Hannu Toivonen (1999), “Tane: An Efficient Algorithm for Discovering Functional and Approximate Dependencies“ The Computer Journal, Vol 42, No [16] Yka Huhtala, Juha Karkkainen, Pasi Porkka and Hannu Toivonen (1998), “Efficient Discovery of Functional and Approximate Dependencies using Partitions“ In Proc, 14th Int Conf on Data Engineering, IFFE Computer Society Press 99 [17] Jyrki Kivinen, Heikki Mannila (1995), “Approximate Inference of Functional Dependencies from Relation“, Theoretical Computer Science 149(1), 129-149 [18] Jan Komorowski, Zdzislaw Pawlak, Lech Polkowski, Andrzej Skowron (1999), Rough Sets: A Tutorial [19] Boris Kovalerchuk, Evgenii Vityaev (2001), Data Mining in Finance: Advances in Relational and Hybrid Methods, Kluwer Academic Publishers, The 2nd Printing [20] Tadeusz Luba, Janusz Rybnik (1992), Rought Sets and Some Aspects of Logic Synthesis in Hanbook of Aplicatión and Advances of the Rough Sets Theory: Intelligent Decision Support Edited by Roman Slowinski, 181-199 [21] David Maier (1983), The Theory of Relational Databases (Computer Science Press, Rockville, Maryland [22] Mannila, H., Toivonen, H and Verkamo, A.I (1997) , “Discovery of frequency episodes in event sequences“ Data Mining and Knowledge Discovery, I, 259 - 289 [23] Tetsuya Murai, Yoshiharu Sato (2000), Association Rules from the Point of View of madal Logic and Rough Set, The 4th Asian Fuzzy Systems Symposium [24] Pawlak Z (1991), Rough Sets- Theoretical Aspects of Reasoning about Data, Kluwer Academic Publishers, Dordrecht [25] Iztok Savnik and Peter A Flash (2000), “Discovery of multivalued dependencies from ralations“ Intelligent data Analysis, 4(3,4) 195 - 211 [26] Andrzej Skowron, Rauszer C (1992), “ The Discernibility Matrices and Functions in Information Systems" Intelligent Decision Support Handbook of Applications and Advances of the Rough Sets Theory, Kluwer, Dordrecht, 331–362 [27] AndrzejSkowron, Ning Zong (2000), Rought Sets in KDD, Tutorial Notes, Copyright 2000 100 [28] Nguyen Hung Son, Marcin Szczuka (2005), Rough Set in KDD, Tutorial Notes of The Ninth Pacific-Asia Conference on Knowledge Discovery and Data Mining, Ha Noi [29] Ho Thuan (1986), “Contribution to the theory of relational databases“, Tanulmanyok 184/1986, Studies 184/1986 Budapest, Hungary [30] Jeffrey D Ullman (1988), Principles of Database and Knowledge-Base Systems, Volume I, Computer Science Press, Rockville, Maryland [31] Jakub Wro’blewski (2000), “Analyzing relational databases using rough set based methods“ Proc of IPMU 2000, Madrid, Spain Universidad Politecnica de Madrid 2000, Vol 1, pp 256 - 262 [32] Hong Yao, Howard J Hamilton and Cory J Butz (2002), “FD_Mine: Discovering Functional Dependencies in a Database Using Equivalences“ University of Regina Computer Sciences Department Technical Report CS-02-04, ISBN 07731-0441-0 101 Các cơng trình cơng bố liên quan đến luận án Hoàng Thị Lan Giao (2005), “Một số thuật tốn tìm tập rút gọn bảng định sử dụng phép toán đại số quan hệ“, Tạp chí Khoa học, Khoa học Tự nhiên Cơng nghệ, Đại học Quốc gia Hà Nội, T.XXI (2PT), 41-48 Hồ Thuần, Hoàng Thị Lan Giao (2005), “Một thuật tốn tìm tập rút gọn sử dụng ma trận phân biệt được“, Chun san Các cơng trình nghiên cứu triển khai Viễn thông CNTT, (15), tr 83-87 Hồ Thuần, Hoàng Thị Lan Giao (2006), “Khám phá phụ thuộc đa trị dựa vào ma trận phụ thuộc“, Tin học điều khiển(1), tr Hồ Thuần, Hoàng Thị Lan Giao (2006), “Mở rộng phụ thuộc hàm phụ thuộc đa trị“, Tin học điều khiển (đã gửi đăng) Hoàng Thị Lan Giao (2006), “Khai phá luật theo tiếp cận tập thô“, Đề tài NCKH cấp Bộ trọng điểm B2005-07-02 , nghiệm thu tháng 3/2006 Các báo cáo khoa học tham gia Hội nghị Khoa học Trường Đại học Công nghệ kỷ niệm năm thành lập Khoa Cơng nghệ Hội thảo Tin học Tồn quốc, Hải Phòng tháng 8/2005 Hội thảo Khoa học quốc gia "Nghiên cứu phát triển ứng dụng Công nghệ Thông tin Truyền thông" (ICT.Rda), 5/2006 ... cách tiếp cận lý thuyết tập thô, tập thô liên kết với hai tập "rõ" xấp xỉ xấp xỉ Xấp xỉ bao gồm đối tượng chắn thuộc, xấp xỉ chứa tất đối tượng có khả thuộc tập Các tập xấp xỉ sở để đưa kết luận. .. trọng lý thuyết việc nghiên cứu ứng dụng công nghệ thông tin thời đại Lý thuyết tập thơ xem xét theo hai phương diện mơ hình thực hành Theo phương diện mơ hình, lý thuyết tập thơ cho cách tiếp cận. .. định lý sau Định lý 1.4 [24] Cho X, X , Y, Y , Z Z tập thuộc tính Khi đó: a) Nếu X → Y X ⊇ X X → Y b) Nếu X → Y Y ⊆ Y X → Y c) Nếu X → Y Y → Z X → Z d) Nếu X → Z Y → Z X ∪ Y → Z e) Nếu X → Y ∪ Z