Tóm tắt luận văn Tiến sĩ Toán học: Phủ tập thô và độ đo đánh giá hiệu năng tập luật quyết định

14 64 0
Tóm tắt luận văn Tiến sĩ Toán học: Phủ tập thô và độ đo đánh giá hiệu năng tập luật quyết định

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Khảo sát, phân tích các loại phủ tập thô; phát hiện tính chất và mối quan hệ giữa các loại phủ và các phép xấp xỉ; tính chất của ánh xạ đóng mà các phép xấp xỉ trên, xấp xỉ dưới xây dựng trên các mô hình phủ tập thô có được; đề xuất thuật toán rút gọn tập thuộc tính dựa vào phủ; xây dựng độ đo đánh giá hiệu năng tập luật quyết định được rút trích từ các bảng quyết định; xây dựng một ứng dụng trên mô hình lý thuyết tập thô dựa vào phủ.

BBB BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM VIỆN CÔNG NGHỆ THÔNG TIN NGUYỄN ĐỨC THUẦN PHỦ TẬP THÔ VÀ ĐỘ ĐO ĐÁNH GIÁ HIỆU NĂNG TẬP LUẬT QUYẾT ĐỊNH Chuyên ngành: BẢO ĐẢM TỐN HỌC CHO MÁY TÍNH VÀ HỆ THỐNG TÍNH TỐN Mã số: 62.46.35.01 TĨM TẮT LUẬN ÁN TIẾN SĨ TOÁN HỌC N gướng dẫn khoa học P GS N THÀ NỘI - 2010 Cơng trình hồn thành tại: VIỆN CÔNG NGHỆ THÔNG TIN VIỆN KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM Người hướng dẫn khoa học DANH MỤC CƠNG TRÌNH ĐÃ CƠNG BỐ LIÊN QUAN LUẬN ÁN [1] PGS TSKH NGUYỄN XUÂN HUY Nguyễn Đức Thuần, Nguyễn Xuân Huy (2009), “ CÁC XẤP XỈ TRÊN CỦA PHỦ TẬP THƠ VÀ ÁNH XẠ ĐĨNG” Kỷ yếu Hội Nghị Khoa Học Kỷ Niệm 25 Năm Thành Lập Viện Cơ học & Tin học Ứng dụng Tp Hồ Chí Minh Nxb Khoa Học Tự Nhiên Cơng Nghệ, 329-333 PGS TS LÊ HẢI KHÔI [2] Phản biện 1: GS.TS NGUYỄN THANH THỦY Nguyen Duc Thuan (2010), “A Family of Covering Rough Sets Based Algorithm for Reduction of Attributes ”, International Journal of Computer Theory and Engineering (IJCTE) Vol 2(2) 180-184 Phản biện 2: PGS.TS ĐẶNG QUANG Á Phản biện 3: PGS.TS NGUYỄN BÁ TƯỜNG [3] Luận án bảo vệ trước Hội đồng chấm luận án cấp viện họp tại: Nguyễn Đức Thuần, Nguyễn Xuân Huy (2009), “RÚT GỌN TẬP THUỘC TÍNH CỦA HỆ QUYẾT ĐỊNH DỰA VÀO HỌ PHỦ TẬP THƠ”, Tạp chí Khoa học & Công nghệ, ĐH Đà Nẵng Vol (4)-33, 64-69 Nguyen Duc Thuan, Nguyen Xuan Huy (2009), “A New Measure to Evaluate the Consistency of a Set of Decision Rules Extracted from a Decision Table”, International Journal of Computer Electrical Engineering (IJCEE) Vol 1(4) 447- 451 Hội trường Viện Công nghệ Thơng tin 18 Hồng Quốc Việt, Cầu Giấy, Hà Nội vào hồi 15 00 ngày 12 tháng 01 năm 2011 Có thể tìm hiểu luận án thư viên: Thư viện Quốc Gia, Thư viện Viện Công Nghệ Thông Tin [4] Nguyen Duc Thuan (2009), “Covering Rough Sets From a Topological Point of View”, International Journal of Computer Theory and Engineering (IJCTE) Vol 1(5) 601-604 24 01 KẾT LUẬN Luận án thực kết sau MỞ ĐẦU Trong thời gian gần đây, lý thuyết tập thơ Pawlak đề xuất (1982) Khảo sát tính chất toán học phép xấp xỉ ứng với ba loại phủ cung cấp cơng cụ tốn học hữu ích phục vụ cho việc nghiên cứu hệ W Zhu, F.Y Wang đề xuất Chỉ hai phủ sinh phép xấp xỉ thống thông minh, hệ thống thông tin không đầy đủ Phương pháp tập loại 2, Trình bày điều kiện đề phép xấp xỉ đồng tiếp cận thô ứng dụng nhiều lĩnh vực: kinh tế, ngân hàng, tài chính, y học khơng gian topo điều khiển tiến trình… Xác lập mối quan hệ phép xấp xỉ dựa phủ với ánh xạ Lý thuyết Tập thơ dựa sở tốn học phép xấp xỉ, quan đóng Đây sở để mở rộng phép xấp xỉ kết thừa kết hệ tương đương phép phân hoạch Chính yếu tố đơn giản làm có nhằm ứng dụng tập thơ hiệu tập thơ dễ tiếp cận Tuy nhiên, yếu tố làm hạn chế ứng dụng Đề xuất thuật tốn FC-Reduct: tìm rút gọn tối thiểu tập thuộc tính lớp quan hệ tương đương phân hoạch không lớn Nhiều mở rộng thú vị ứng với họ phủ định tập thô Độ phức tạp thuật toán ý nghĩa dựa mở rộng hai khái niệm: quan hệ hai phân O(|D||U| ) (tương đương với thuật tốn tìm rút gọn tập thuộc tính hoạch hay phối hợp với phương pháp khác Chúng ta thấy hướng lý thuyết tập thơ cổ điển) mở rộng tập thô qua tổng kết T.Y.Lin Xây dựng độ đo đánh giá hiệu tập luật định khắc phục hạn chế hệ độ đo trước Thử nghiệm kết đạt được: thuật toán FC-Reduct độ đo đánh giá hiệu tập luật định sở liệu UCI Tích hợp độ đo vào phần mềm rút trích tập luật định hỗ trợ xử lý thông tin dạy học Đại học Nha Trang Ngoài kết thu luận án, vấn đề phải tiếp tục, nghiên cứu phát triển liên quan là: - Mối quan hệ phủ tập thô khơng gian tốn học, lớp phụ thuộc bool dương, CSDL quan hệ - Phối hợp khái niệm tập thơ với cơng cụ tốn học xấp xỉ khác Không gian Topo Phủ Quan hệ hai Nhát cắt - a Các hướng tiếp cận mở rộng tập thô Hệ thống láng giềng Tập thô Sự mở rộng tập thơ phát sinh nhiều tốn thú vị cần nghiên cứu giải Với mong muốn phát triển, mở rộng lý thuyết tập thô ứng dụng, luận án đóng góp số kết tập trung vào vấn đề sau: Khảo sát, phân tích loại phủ tập thơ Phát tính chất mối quan hệ loại phủ phép xấp xỉ Phát tính chất ánh xạ đóng mà phép xấp xỉ trên, xấp xỉ xây dựng mơ hình phủ tập thơ có tập mờ, xác suất, tập mơ hồ (vague set) dựa phủ tập thô Đề xuất thuật tốn rút gọn tập thuộc tính dựa vào phủ - Ứng dụng tập thô vào khai thác liệu (Datamining) Xây dựng độ đo đánh giá hiệu tập luật định rút trích từ - Xây dựng phần mềm ứng dụng, giải tốn thực tiễn dựa vào lý thuyết tập thơ mở rộng bảng định Xây dựng ứng dụng mơ hình lý thuyết tập thơ dựa vào phủ 02 23 BỐ CỤC CỦA LUẬN ÁN Luận án gồm ba chương, phần kết luận, cơng trình công bố tài liệu tham khảo Chương 1: CÁC KHÁI NIỆM CƠ SỞ - Trình bày khái niệm sở làm tảng toán học cho chương sau Chương 2: PHỦ TẬP THƠ Đóng góp số kết phủ tập thô: - Điều kiện để hai phủ sinh phép xấp xỉ loại - Tính chất ánh xạ đóng phép xấp xỉ loại 1, 2, ứng với ba loại phủ: đơn vị, nửa thu gọn, nửa tựa điểm - Một số điều kiện để phép xấp xỉ đồng tiếp cận không gian topo - Thuật tốn FC_reduct rút gọn tập thuộc tính dựa vào họ phủ tập thơ - Ứng dụng thuật tốn cho tốn xử lý thơng tin dạy học Đ.H Nha Trang Chương 3: ĐỘ ĐO ĐÁNH GIÁ HIỆU NĂNG TẬP LUẬT QUYẾT ĐỊNH - Đề xuất hệ độ đo đánh giá hiệu tập luật định Ứng dụng hệ độ đo cho tốn xử lý thơng tin dạy học Đ.H Nha Trang Phần Kết luận : Tổng kết kết đạt hướng nghiên cứu Các cơng trình cơng bố Tài liệu tham Khảo Phụ lục: Một số kết ứng dụng đạt Biểu mẫu phiếu khảo sát thông tin dạy & học Đ.H Nha Trang NỘI DUNG LUẬN ÁN Chương 1: CÁC KHÁI NIỆM CƠ BẢN 1.1 Hệ thống thông tin tập thô 1.1.1 Hệ thống thông tin Hình 3.2 Sự biến thiên độ đo độ quán: tb, b, cc (D) ứng với tập liệu Dermatology 3.4 Ứng dụng hệ độ đo cho tốn xử lý thơng tin dạy học Đ.H Nha Trang Như trình bày 2.8.1, tập luật định rút trích từ sở liệu khảo sát chất lượng giảng dạy ĐH Nha Trang đánh giá hiệu theo độ đo luận án đề xuất Các giá trị ứng với độ đo nhằm hỗ trợ nhóm chuyên gia giáo dục đưa kết luận thông tin dạy học, đồng thời sở để so sánh với kết thu phương pháp thống kê mà nhóm chuyên gia giáo dục tiến hành trước 3.5 Kết luận chương Chương trình bày đo đánh giá hiệu tập luật định đề xuất Hệ độ đo khắc phục hạn chế hệ độ đo có trước Việc minh họa cách cài đặt thực nghiệm độ đo ba liệu UCI Tic-tac-toe, Dermatology, Nursery cho thấy tương quan khác biệt hệ độ đo Q trình tích hợp độ đo đề xuất vào tốn xử lý thơng tin dạy học ĐH Nha Trang cho thấy khả ứng dụng đô đo 22 03 Định lý 3.11 Cho T1= (U, CÈD), T2=(U, BÈD) bảng định, BÍC B rút gọn miền dương D ứng với C tb(T2)³tb(T1) Số lượng mẫu 958 366 Số thuộc tính ĐK 33 rỗng đối tượng gọi tập vũ trụ tập phổ dụng, A tập hữu Xét hệ thống thông tin Đặc trưng (Features) S = (U, A) Khi tập thuộc tính BÍA tạo tương ứng quan hệ tương đương IND(B): IND(B) = {( u, v) ỴU ´ U | a(u) = a(v), "a Ỵ B} IND(B) gọi quan hệ B_khơng phân biệt Lớp tương đương U cc (D) 0.0000 0.0000 0.1253 0.1628 0.4186 0.7766 0.9436 1.0000 1.0000 b 0.1114 0.1322 0.2827 0.3300 0.5832 0.8000 0.9436 1.0000 1.0000 tb 0.1114 0.1322 0.2827 0.3300 0.5832 0.8000 0.9436 1.0000 1.0000 Bảng 3.3 S liệu khác biệt cc (D) , b tb liệu Dermatology Độ đo tập hữu hạn khác 1.1.2 Quan hệ không phân biệt Số lớp Q.định Bảng 3.2 Số liệu khác biệt cc (D) , b tb liệu Tic-tac-toe Độ đo S = (U, A), U hạn khác rỗng thuộc tính Bảng Mơ tả tập liệu thử nghiệm Data sets Tic-tac-toe Dermatology Hệ thống thông tin cặp (Đặc trưng)Features 12 15 18 21 33 cc (D) 0.0000 0.0109 0.0437 0.6066 0.8552 0.8962 0.9809 1.0000 1.0000 1.0000 b 0.3350 0.3164 0.2821 0.6826 0.8797 0.9153 0.9818 1.0000 1.0000 1.0000 tb 0.0854 0.1581 0.2960 0.7661 0.9148 0.9415 0.9891 1.0000 1.0000 1.0000 quan hệ IND(B) kí hiệu [u]B Tập thương xác định quan hệ IND(B) ký hiệu U/IND(B) hay U/B 1.1.3 Tập thô Cho hệ thống thông tin S = (U, A) Với tập XÍU BÍA, đặt R= IND(B), ta có tập sau RX = {u ỴU | [u ]B Í X } RX = {u ỴU | [u ]B ầ X ặ} RX , RX ln lt gọi R-xấp xỉ R- tập xấp xỉ tập X Từ hai tập xấp xỉ trên, người ta định nghĩa tập BNB(X) = RX - RX : biên X R POSB(X) = U V ỴU / B BX : B-vùng dương X NEGB(X) = U - RX : B-vùng âm X Trong trng hp BNB(X) ạặ, X c gi l thô, ngược lại X gọi tập rõ Với B,D Í A, người ta gọi B-miền khẳng định dương D tập xác định POS B ( D ) = Hình 3.1 Sự b thiên độ đo độ quán:tb, b, cc (D) ứng với liệu Tic-Tac-Toe U V ỴU / D ( R (V )) 04 1.1.4 Các tính chất xấp xỉ (do Pawlak công bố 1991) Cho hệ thống thông tin S = (U, A) Với tập XÍU BÍA, đặt R= IND(B), đại lượng đo xác tập xấp xỉ X phân hoạch R giá trị aR (X ) = Card ( RX ) Card ( RX ) Bảng định hệ thống thơng tin có dạng T = (U, CÈD), với CÇD = f, C gọi tập thuộc tính điều kiện, D tập thuộc tính định T= (U, CÈD), giả sử U/C = {X1, X2, , Xm} U/D = {Y1, Y2, , Yn} Một lớp XiỴU/C gọi qn u(d) = v(d), "u,vỴXi "dỴD ; lớp YjỴU/D gọi qn ngược u(a)= v(a), "u,v ỴYj "C Bảng định T= (U, CÈD) qn lớp XiỴU/C qn, ngược lại không quán Một quan hệ phận p họ {U/B | BÍA} định nghĩa U/P p U/Q : "PiỴU/P, $QjỴU/Q : Pi ÍQj Khi ta nói Q thơ P hay P mịn Q Dễ thấy rằng, U/C p U/D T = (U, C ÈD) gọi quán Nếu m=1 n= |U| tb(T) đạt giá trị nhỏ Tính đơn điệu độ đo tb bảng định quán ngược thấy qua định lý ngược Nếu U/C1=U/C2 U/D2 p U/D1 tb(T1) ³ tb(T2) Bổ đề 3.1 Cho T=(U, CÈD) bảng định, tập khác rỗng X, Y ÍU Gi s X= k UX j , XpầXq=ặ vi mi p¹q, có nghĩa {X1, j =1 X2, , Xk} phân hoạch X, C X ÇY X ÇY ³ U X k å j =1 X j ÇY X j ÇY C U X ta có đẳng thức X p Ç Y X q Ç Y C = , "p¹q p,q = 1, 2, ,k Định lý 3.9 Cho T1=(U, C1ÈD1), T2=(U, C2ÈD2) hai bảng quán ngược Nếu U/D1=U/D2 U/C2 p U/C1 tb(T1) £ tb(T2) Từ định nghĩa độ quán quán ngược, ta thấy độ quán quán ngược tỉ lệ thuận với độ chắn Nhưng độ đo 1.1.7 Rút gọn nhân T = (U, ẰD) Tập thuộc tính RÍA gọi rút gọn A POSR(D) = POSA(D) Nhân tập thuộc tính điều kiện A ký hiệu CORE(A), định nghĩa CORE(A) = ÇRED(A).;RED(A) tập rút gọn A Ngoài ra, người ta định nghĩa rút gọn C-miền khẳng định dương D sau: Nếu BÍC thỏa Với ZijỴRULE, m(Zij) =1 độ đo tb(T) đạt giá trị lớn Định lý 3.8 Cho T1=(U, C1ÈD1), T2=(U, C2ÈD2) hai bảng quán 1.1.6 Bảng định Xét bảng định Định lý 3.7 (Cực trị cho tb) Cho T=(U, CÈD) bảng nh v RULE ={Zij | Zij: des(Xi) đ des(Yj), XiẻU/C, YjỴU/D} 1.1.5 Độ xác xấp xỉ Cho bảng định 21 Yuhua Qian cộng không thỏa, độ đo tb phù hợp b Bổ đề 3.2 Cho T1=(U, CÈD1), T2=(U, BÈD2) hai bảng định, CÍB U/B p U/C tb(T2)£tb(T1), dấu đẳng thức xảy (tb(T2)=tb(T1)) T1, T2 hai bảng quán Định lý 3.10 Cho T1=(U, CÈD), T2=(U, BÈD) bảng định, T1 bảng quán BÍC Nếu B C-rút gọn miền dương D tb(T2)=tb(T1) 20 05 có số nhược điểm áp dụng cho luật đơn, giá trị 1.POS B ( D ) = POSC ( D ) độ đo đọ chắn khơng có luật định bẳng 2."a Ỵ B, POSC ( D) ¹ POSC -{ a} ( D ) định chất nhận Yuhua Qian cộng phân tích, đề xuất ba độ B gọi lả rút gọn C-miền khẳng định dương D đo khắc phục nhược điểm Tuy có nhiều tính chất 1.1.8 Ma trận phân biệt hàm phân biệt tốt, công thức họ phức tạp, đáng lưu ý độ đo độ quán Xét bảng định T=(U, CÈD), với U={u1, u2, , un} Ma trận phân có hạn chế không đồng biến độ đo cổ điển Luận án đề xuất độ đo biệt T, ký hiệu M(T) = (mij )n´n , ma trận đối xứng khắc phục nhược điểm hệ độ đo có phần tử tập thuộc tính xác định sau ỡù{c ẻ C | ui (c) u j (c )} , ui ( D) ¹ u j ( D ) mij = í , ui ( D ) = u j ( D) ùợặ Hm phõn bit c f Τ hàm logic, xác định từ ma trận 3.2 Độ đo hiệu tập luật định (Xem bảng dưới) 3.3 Đề xuất độ đo hiệu tập luật định Cho bảng định T=(U, CÈD) RULE = {Zij | Zij: des(Xi) đ des(Yj), XiẻU/C, YjẻU/D} phõn bit M(T) nh sau fT (ui ) = Ù (Ú mij ) , với mi ui ẻ U iạ j o chắn (certainty measure) m a (S ) = n åå s(Z ij )m ( Zij ) = åå i =1 m j =1 n i =1 m i -1 X ÇY i j =1 Xi j =1 j U X X i Ç Yj X i Ç Y j n ta ( S ) = - åå Trong đó, thuộc tính đặt tương ứng biến logic tên Xi m U i =1 tb ( S ) = - [1- n n -1 Ni Xi i 1.1.9 Luật định Ç Y j m ( Z ij )(1 - m ( Z ij ))] Yuhua & cộng j =1 m n i =1 j =1 åå X i Ç Yj X i Ç YjC Xi Độ đo đề xuất U m n m n i =1 j =1 i =1 j =1 X i Ç Yj U 2 Yuhua & cộng Định lý 3.1 Độ đo độ chắn ta T độ đo a (Các định lý 3.2-3.6 tính chất độ đo a Yuhua Qian cộng công bố) Độ đo độ quán tb số tính chất Cho bảng định T= (U, CÈD), giả sử U/C = {X1, X2, , Xm} U/D = {Y1, Y2, , Yn} Nu XiầYj ạặ, ký hiu des(Xi), des(Yj) ln lt mô tả lớp tương đương tương ứng với Xi, Yj Một luật định xác định Xi, Yj có dạng Zij: des(Xi) ® des(Yj) Độ đo độ chắn độ hỗ trợ luật định Zij định Độ đo độ hỗ trợ(consistency measure) g ( S ) = åå s ( Z ij ) = åå (3) Ú mij = false, nu mij = ặ v ui(D) uj(D), o đề xuất U åX (2) Ú mij = true, mij = Ỉ ui(D) = uj(D), i C Độ đo độ quán (consistency measure) b (S ) = å (1) Ú mij biểu thức tuyển tất c cỏc bin c ẻ mij, nu mij ạặ, Yuhua & cộng nghĩa m ( Z ij ) = X i Ç YJ / X i s ( Z ij ) = X i Ç YJ / U Ở |.| số hay lực lượng tập hợp Để thuận tiện trình bày, ký hiệu |Zij| thay cho X i Ç Y j 06 19 1.1.10 Phụ thuộc độ k 2.8 Ứng dụng thuật tốn FC-Reduct cho tốn xử lý thơng tin Cho hệ thống thơng tin S = (U, A), X,Y Í A Chúng ta nói tập k thuộc tính Y phụ thuộc độ kỴ[0,1] vào tập thuộc tính X, ký hiu X ắắ đY , vi k c xỏc nh sau (|.| ký hiệu số tập hợp.) POS X (Y ) k= U 1.2 Phủ tập thô 1.2.1 Phủ không gian xấp xỉ phủ Định nghĩa 1.2.1 (Phủ) Cho U tập phổ dụng, C họ tập khác rỗng U, ÈC = U, C gọi phủ U Định nghĩa 1.2.2 (Không gian xấp xỉ phủ) Cho U tập phổ dụng, C phủ U Cặp thứ tự (U, C) gọi không gian xấp xỉ phủ (CAS) Định nghĩa 1.2.3 (Mô tả tối thiểu) Cho không gian xấp xỉ phủ (U, C), họ tập hợp xỏc nh bi xẻU: Md(x) = {KẻC ỗxẻK ("SẻC xẻS S K ị K= S)} c gọi mô tả tối thiểu x Định nghĩa 1.2.4 (Nửa thu gọn) Cho C phủ U C gọi (phủ) nửa thu gọn hay nửa khơng dư thừa thỏa điều kiện "K1, K2 ẻC v K1 K2 ị K1= K2 nh ngha 1.2.5 (Đơn vị) Cho C phủ U C gọi (phủ) đơn vị "xỴU, |Md(x)| = Định nghĩa 1.2.6 (Phủ tựa điểm) Cho C phủ U C gọi phủ tựa điểm "KỴC xỴK, KÍ ÈMd(x) Định nghĩa 1.2.7 (Phần tử loại phủ) dạy học Đại học Nha Trang Thuật toán FC-Reduct sử dụng để thu gọn tập thuộc tính nhằm giảm bớt kích thước tập luật định Kết kênh để chuyên gia giáo dục tham khảo phục vụ đánh giá tiêu chí khảo sát 2.9 Kết luận chương Chương luận án trình bày kết đạt liên quan đến phủ tập thơ Cụ thể là: Một số tính chất rút gọn phép phủ xấp xỉ ba loại phủ tập thô: Nửa thu gọn (Semi-reduced), Phủ tựa điểm (Pointwise-covered), Đơn vị (Unary) Điều kiện để hai phủ sinh phép xấp xỉ loại đề xuất chứng minh (định lý 2.13, hệ 2.1, nhận xét 2.1) Mối liên hệ, tính chất phép xấp xỉ dựa vào loại phủ ánh xạ đóng (mệnh đề 2.12.3,nhận xét 2.2, hệ 2.2) Chỉ số điều kiện để phép xấp xỉ đồng phủ không gian topo (mệnh đề 2.4-2.6, hệ 2.3) Thuật tốn FC_Reduct rút gọn tập thuộc tính dựa vào họ phủ đề xuất Độ phức tạp thuật toán O(|D||U|2) (tương đương với giải thuật tập thô cổ điển) Ứng dụng thực tế thuật tốn cho tốn xử lý thơng tin dạy học Đại học Nha Trang cho thấy khả ứng dụng tính đắn thuật tốn Chương ĐỘ ĐO ĐÁNH GIÁ HIỆU NĂNG TẬP LUẬT QUYẾT ĐỊNH 3.1 Hạn chế độ đo cổ điển bảng định Rút trích đánh giá hiệu tập luật định toán nhiều người quan tâm Các độ đo cổ điển số tác giả 18 2.7.1 07 Thuật tốn FC_Reduct rút gọn thuộc tính họ định phủ tập thô Đầu vào: Hệ QĐ phủ T = (U, D, D={d}) Đầu ra: Một rút gọn tập thuộc tính RD of D Bước 1: Tính CI = å D x Ç [ x] D Bước 2: If CI = |U| {T hệ định quán} then goto Bước else goto Bước Bước 3: Tính Dx, d(Dx) , "xỴU Bước 4: begin for each Ci ỴD if åå xi ỴU x j ÎU (D xi Ç D x j ) È ( Pxi Ç Px j ) d (D xi ) - d (D x j ) = then D:= D - {Ci}; {ở Cov(D - {Ci })= {Px | xỴU}} endif; endfor goto Bước end; Bước 5: begin for each Ci ỴD d oif å xi ỴU D xi Ç [ xi ]D D xi C- {K}, nói K phần tử loại C, ngược lại K phần tử không loại Định nghĩa 1.2.8 (Phủ rút gọn được) Cho (U, C) CAS Nếu Dx xỴU Cho (U, C) CAS KỴC Nếu K hợp số tập hợp - {ở Cov(D - {Ci })= {Px | xỴU}} endif; endfor end; Bước 6: RD= D; thuật toán kết thúc Pxi Ç [ xi ]D Pxi =0 then D:= D - {Ci }; phần tử C phần tử khơng loại C phủ khơng rút gọn được, ngược lại C phủ rút gọn Định nghĩa 1.2.9 (Rút gọn phủ) Đối với phủ C U Một phủ không rút gọn có từ việc loại bỏ phần tử loại C gọi rút gọn phủ C, ký hiệu reduct(C) Mệnh đề 1.2.1 Cho C phủ U, KỴC K phần tử loại C, K1ỴC–{K}, K1 phần tử loại C phần tử loại C–{K} 1.2.2 Thuật tốn tìm rút gọn phủ Do W.Zhu & FY.Wang đề xuất Ý tưởng: Duyệt loại bỏ dần phần tử loại (dựa vào Định nghĩa 1.2.7-1.2.9) 1.2.3 Các phép xấp xỉ dựa vào phủ tập thô Cho (U, C) CAS Một tập X ÍU Xấp xỉ dưới, xấp xỉ phủ loại 1, 2, X định nghĩa sau Xấp xỉ phủ loại 1, 2, È {KỴ C | K Í X} X* = X = X# 2.7.2 Đánh giá độ phức tạp thuật toán FC_Reduct Thuật tốn có độ phức tạp O(|D||U|2) (ở bỏ qua thời gian tính Dxi, Pxi, với i= |D|) So sánh kết thử nghiệm thuật toán với kết Chen Degang, Ký hiệu FL(X), SL(X),TL(X) K.h chung CL(X) Xấp xỉ phủ loại 1: X* X*È {Md(x)| xỴX-X*} FH(X) Xấp xỉ phủ trờn loi : X ẩ {KẻC | KầXạặ} SH(X) È {Md(x) | xỴX} TH(X) # Xấp xỉ phủ loại : X Bảng 1.2 Các phép xấp xỉ dựa vào phủ tập thơ Hệ định Thuật tốn Chen Degang Thuật toán Nhất quán Red({C3, C4}, {C2, C3}) {C3, C4} Không quán Red({C2, C4}, {C2, C3}) {C2, C4} 1.3 Ánh xạ đóng Cho U tập khác rỗng Tốn tử H: P(U) ® P(U) (P(U) tập tất tập U) gọi ánh xạ đóng H thỏa: " X,Y Í U 08 17 (Cl1) X Í H(X) (tính phản xạ) 2.7 Thuật toán FC_Reduct rút gọn tập thuộc tính dựa vào họ phủ tập thơ (Cl2) X Í Y Þ H(X) Í H(Y) (tính đồng biến) Nhận xét 2.3 Từ định nghĩa đại lượng Dx Với (U, D, D={d}) hệ (Cl3) H(H(X)) = H(X) (tính lũy đẳng) 1.4 Không gian topo định phủ quán, d hàm định d: U ® Id xác định từ tập vũ trụ U vào tập giá trị Id Ta có kết sau Xét tập hợp X, họ t tập X gọi topo X, thỏa điều kiện: - Với xi, xjỴU, D xi Í D x j d ( xi ) = d ([ xi ]D ) = d (D xi ) = d ( D x j ) = d ( x j ) = d ([ x j ]D ) X Ỉ thuộc t - Nếu d ( xi ) ¹ d ( x j ) D xi ầ D x j = ặ cú ngha l D xi Ë D x j D x j Ë D xi Hợp tùy ý tập thuộc t thuộc t Giao hữu hạn tập thuộc t thuộc t Định lý 2.19 Cho (U, D, D={d}) hệ định phủ, ta có Một tập X topo t X gọi không gian topo Tập (U, D, D={d}) hệ định phủ quán thỏa GỴt gọi tập mở X Tập F X gọi tập đóng, å X\F tập mở Các khái niệm kinh điển liên quan trình bày: Lân cận,Bao đóng,Phần trong,Biên, Cơ sở Tiền sở (Base, Subbase) 1.5 Kết luận Chương Chương trình bày số khái niệm làm sở toán học cần Chương 2: PHỦ TẬP THÔ Các kết 2.1, 2.2 công bố W Zhu F.Y Wang (2006,2007) 2.1 Tính chất xấp xỉ phủ loại 1, 2, A Sự phụ thuộc xấp xỉ xấp xỉ loại Cho C1, C2 hai phủ U Định lý 2.2 Định lý 2.3 C1, C2 sinh phép xấp xỉ FH C1, C2 sinh phép xấp xỉ CL åå (D xi Ç D x j ) È ( Pxi Ç Px j ) d (D xi ) - d (D x j ) = Û reduct(C1) = reduct(C2) Û Û Định lý 2.20 Cho (U, D, D={d}) hệ định khơng qn PÍD, POSP(D)= POSD(D) nếu"xiỴU, ta có 2.1.1 Xấp xỉ phủ tập thô loại xấp xỉ =U Ở đây, Cov(D-{Ci})={Px | xỴU}=Cov(P), Cov(D)={Dx | xỴU} C1, C2 sinh phép Dx Giả sử Cov(D)£U/D, CiỴD, Ci không cần thiết thỏa xi ỴU x j ỴU thiết để trình bày kết chương sau Định lý 2.1 xỴU D x Ç [ x ]D C1, C2 sinh phép xấp xỉ FH D xi Ç [ xi ]D D xi - Pxi Ç [ xi ]D Pxi =0 Định lý 2.21 Cho hệ định phủ quán T=(U,D,D) Xét hai họ phủ P1, P2 : P2 ÍP1Í D, Cov(Pi)£U/D, i=1,2, " Ck ỴP2ÍP1, Ck khơng dư thừa P1 Ck khơng dư thừa P2 Định lý 2.22 Cho hệ định Không quán T=(U,D,D) Xét hai họ phủ P1, P2 : P2 ÍP1Í D, POS P1 ( D) = POS P2 ( D) U ," Ck ẻP2P1, nu Ck khơng dư thừa P1 Ck khơng dư thừa P2 16 09 D, POSP(D)=POSD(D) P gọi rút gọn D ứng với D 2.6.3 Một số kết liên quan họ phủ phủ suy dẫn Cheng Degang cộng đưa kết sau Định lý 2.15 Giả sử U tập phổ dụng hữu hạn D={Ci : i=1, m} họ phủ U, mệnh đề sau B Tiên đề cho phép xấp xỉ Định lý 2.4 Cho U tập khác rỗng Nếu tồn tốn tử L: P(U) ® P(U) thỏa tính chất sau: "X, Y Í U (1L) L(U) = U (3L) L(X) Í X (5L) L(L(X)) = L(X) (1) Dx=Dy với CiỴD ta có Cix= Ciy (7L) X ÍY Þ L(X) Í L(Y) (2) DxÉDy với CiỴD ta có Cix ÊCiy tồn tối thiểu CkỴD mà Ckx ÉCky tồn phủ C U có tính chất toán tử xấp xỉ CL sinh C L (Chú ý: ký hiệu (1L) – (7L) số thứ tự tính chất phép xấp xỉ (3) DxËDy DyËDx tồn Ci, CjỴD mà CixÌCiy CjxÉCjy hay tồn CkỴD mà CkxËCky CkCkx dưới, xấp xỉ Pawlak công bố) C Tiên đề cho phép phủ xấp xỉ loại Định lý 2.16 Giả sử Cov(D)£U/D, CiỴD, Ci cần thiết có nghĩa Cov(D- Bài tốn tiên đề hóa cho xấp xỉ phủ loại tốn mở Ci})£U/D sai tồn cặp xi, xjẻU tha d([xi]D) 2.1.2 Xp x ph thụ loại d([xj]D), quan hệ chúng tương ứng với D thay đổi sau Ci bị loại bỏ A Sự phụ thuộc xấp xỉ xấp xỉ tập thô loại khỏi D Định lý 2.5 Phép xấp xỉ phủ xấp xỉ phủ loại không xác Định lý 2.17 Giả sử Cov(D)£U/D, PÍD Cov(P)£U/D với cặp xi, xjẻU tha d([xi]D) d([xj]D), quan h gia xi, xj ứng với D tương đương với quan hệ chúng P, nghĩa D x j Ë D xi Û Pxi Ë Px j Px j Ë Pxi D xi Ë D x j Định lý 2.18 Hệ định không quán (U, D, D={d}) có tính chất sau (1) "xiỴU, D xi Ì POSD ( D) D xi Í [ xi ]D ; D xi Ë POSD ( D) "xk Ỵ U , D xi Í [ xk ]D khơng (2) "P Í D , POS P ( D ) = POS D ( D ) P ( X ) = D ( X ), "X Ỵ U / D (3)"PÍD, POSP(D)=POSD(D) "xiỴU, D xi Í [ xi ]D Û Pxi Í [ xi ]D định lẫn B Tiên đề phép phủ xấp xỉ loại Bài tốn tiên đề hóa cho xấp xỉ phủ loại tốn mở 2.1.3 Xấp xỉ phủ tập thơ loại A Sự phụ thuộc xấp xỉ phủ xấp xỉ phủ loại Cho C1, C2 hai phủ U Định lý 2.6 C1, reduct(C1) sinh phép xấp xỉ xấp xỉ loại Định lý 2.7 C1, C2 sinh phép xấp Û reduct(C1)= reduct(C2) xỉ TH Chú ý 2.1: Hai phủ sinh xấp xỉ loại khơng có rút gon B Tiên đề phép xấp xỉ phủ loại Bài toán tiên đề hóa phép xấp xỉ phủ loại tốn mở 10 15 2.2 Mối quan hệ ba loại phủ tập thô 2.6 Rút gọn tập thuộc tính dựa vào họ phủ tập thơ FH TH SH C đơn vị Û C phủ tựa điểm Û TH = SH C nửa thu gọn * Þ TH = SH C phân hoạch Û FH = TH = SH FH = TH Bảng 2.1 Điều kiện để phép xấp xỉ phủ 2.3 Một số kết xấp xỉ phủ loại Định lý 2.13 Cho C1, C2 phủ U, C1 C2 xác định xấp xỉ phủ xấp xỉ phủ loại chúng thỏa điều kiện sau Các khái niệm kết 2.6.1, 2.6.2 Cheng Degang cộng đề xuất 2.6.1 Một số khái niệm kết sở Với C ={C1, C2, ,Cn} phủ U Với xẻU, t Cx=ầ{CjẻC: xẻCj} Cov(C)={Cx: xẻU} cng l mt ph U gọi phủ suy dẫn C Khái niệm phủ suy dẫn họ phủ tập thô định nghĩa tương tự: Cho D={Ci | i=1, ,m} họ phủ U Với mi xẻU, t D x = ầ{Cix | Cix ẻ Cov(Ci ), x Ỵ Cix } Cov(D)={Dx: xỴU} phủ U gọi phủ suy dẫn D 2.6.2 Rút gọn tập thuộc tính hệ thống định quán không quán reduct(C1) = reduct(C2) Xét (U, D, D={d}) hệ định qn Với CiỴD, C1 C2 phủ tựa điểm Hệ 2.1 Cho C1, C2 phủ U, C1 C2 sinh xấp xỉ xấp xỉ phủ loại 2, chúng thỏa điều kiện sau reduct(C1) = reduct(C2) C1 C2 phủ nửa thu gọn Nhận xét 2.1 Cho C phủ U, C reduct(C) chưa sinh xấp xỉ loại (ngay reduct(C) phân hoạch) Cov(D-{Ci}) £ U/D, Ci thuộc D nói khơng cần thiết D, ngược lại Ci nói cần thiết D Tập P Í D thỏa Cov(P) £ U/D, phần tử thuộc P cần thiết, có nghĩa "CiỴP, Cov(D-{Ci})£U/D sai P gọi rút gọn D Tập tất phần tử cần thiết D tương ứng với D gọi nhân D ứng với D, ký hiệu CoreD(D) Rút gọn hệ định 2.4 Tính chất ánh xạ đóng ba phép xấp xỉ dựa vào phủ quán tập tối thiểu thuộc tính điều kiện đảm bảo chắn 2.4.1 Tính chất ánh xạ đóng ba phép xấp xỉ phủ ứng luật định quán với phủ Đơn vị Mệnh đề 2.1 Cho C phủ U, C (phủ) đơn vị FH sinh C thỏa tính chất "X,Y Í U, X ÍY Þ FH(X) Í FH(Y) (tính đồng biến) TH sinh C thỏa: TH(TH(X)) =TH(X) (tính lũy đẳng) Xét d: U ® Id hàm định định nghĩa d(u)= u(D), "U Ta có "xi, xj Ỵ [u]D Û xi(D) = xj(D) = u(D), khơng nhầm lẫn viết d(xi) = d(xj) = d([u]D) = d(u) Tương tự 1.1.6, hệ định phủ (U, D, D) không quán POSD(D) ¹ U Nếu POSD ( D ) = POS D-{Ci } ( D) , Ci phần tử không cần thiết tương ứng với D Ngược lại, Ci phần tử cần thiết tương ứng với D Với PÍD, phần tử P phần tử cần thiết 14 11 Hệ 2.3 Cho (U, t) không gian topo cảm sinh từ quan hệ hai ngơi R có tính phản xạ bắc cầu Xét phủ U C={ rR(x)|xỴU}, ta có: R 2.4.2 Tính chất ánh xạ đóng ba phép xấp xỉ phủ ứng với phủ Tựa điểm R (3) X = t X Mệnh đề 2.2 Cho C phủ U, C phủ tựa điểm FH Hệ cho thấy mối quan hệ xấp xỉ Yao(3), A.Mkozae cộng (5) Trong trường hợp tổng quát X ,t X khác Tuy nhiên ta có Cho (U, tS) khơng gian topo xây dựng theo 2.5.1 b Xét " X,Y Í U, X Í Y Þ FH(X) Í FH(Y) (tính đồng biến) Phản ví dụ 2.7 Cho U = {a, b, c, d}, K1= {a, b}, K2= {a, c}, K3= {b, d}, K4= {d} C= {K1, K2, K3, K4} C phủ tựa điểm U Với X= {a}, phủ U C = tS Mọi tập X Í P(U), t X Í X Việc rút gọn phủ phủ không gian topo Có thể thực việc rút gọn thuật tốn W.Zhu & Wang Ngồi ra, ta sử dụng chuyển đổi phủ Guilong Liu, Ying Sai đề xuất Phép chuyển đổi định nghĩa: Gọi C(U) tập tất phủ U, định nghĩa phép chuyển đổi F C(U) đến C(U): sinh C thỏa tính chất Khi C phủ tựa điểm U, TH, SH chưa thỏa tính lũy đẳng tính chất sau từ d}, C= {K1, K2, K3} C phủ đơn vị U Với X= {c}, có SH(X) = È {K | KẻC, KầX ặ } = {a, d, c} ¹ SH(SH(X)) = {a, b, c, d} (1) X + = C+ X = X = Đ ò X =t X (2) C + X = Ị òò X Tuy nhiên SH chưa thỏa tính lũy đẳng C (phủ) đơn vị Phản ví dụ 2.6 Cho U = {a, b, c, d}, K1= {a, b}, K2= {a, d, c}, K3= {a, b, F: C(U) ® C(U), với CỴ C(U) : F(C) = C’= {N(x) | xỴU} có TH(X) = SH(X) = {a, b, c} ¹ SH(SH(X)) = {a, b, c, d} 2.4.3 Tính chất ánh xạ đóng ba phép xấp xỉ phủ ứng với phủ Nửa thu gọn Nhận xét 2.2 Cho C phủ U, C nửa thu gọn, TH, SH sinh C chưa thỏa tính lũy đẳng Hệ 2.2 Cho C phủ U, C nửa thu gọn FH có tính đơn điệu Phủ đơn vị Phủ tựa điểm Phủ nửa thu gọn FH Ánh xạ đóng Ánh xạ đóng Ánh xạ đóng bảo tồn khơng gian topo Nói khác hơn, xấp xỉ Yao(3) xấp xỉ SH Ánh xạ đóng - - A.M Kozae cộng (5) khơng bảo tồn với phép chuyển đổi Có TH - - - Đối với phép chuyển đổi phủ phép xấp xỉ phủ X + , C + X xấp xỉ phủ C+ X không đổi Nhưng, phép chuyển đổi khơng thể thấy qua phản ví dụ sau Giả sử U={a, b, c, d}, topo t định nghĩa U: C= t = {Ỉ, U, {d}, {c, d}}, F(C)= {N(a)= U= N(b), N(c) = {c, d}, N(d) = {d}} Dễ thấy F(C) khơng topo Bảng 2.3 Tính chất ánh xạ đóng ba phép xấp xỉ phủ sinh ba loại phủ 2.5 Mối quan hệ phép xấp xỉ phủ dựa vào không gian topo 2.5.1 Quan hệ hai không gian topo 12 13 a Không gian topo xây dựng từ quan hệ hai Giả sử R quan hệ hai tùy ý xác định U, cặp (U, R) gọi không gian xấp xỉ xác định quan hệ hai R Ứng với R, định nghĩa láng giềng trái, phải phần tử x thuộc U sau: lR(x) = {y | U, yRx} rR(x) = {y | U, xRy} Xây dựng topo t1 sử dụng R-láng giềng phải (tương tự, topo t2 sử dụng R-láng giềng trái), xem họ S1= {rR(x) | xỴU} tiền sở topo t1 ký hiệu Sx = {GỴS1| xỴG} Topo t1 gọi cảm sinh từ quan hệ hai R b Không gian topo xây dựng từ họ phủ Một hệ thống thông tin S = (U, A), U tập hữu hạn khác rỗng đối tượng, A tập hữu hạn khác rỗng thuộc tính Với thuộc Cho (U, C) khụng gian xp x ph N(x) = ầ{KẻC | xẻK} lân cận x Ký hiệu XC cho phần bù X U (U, t) không gian topo sử dụng R-láng giềng phải Khảo sát phép xấp xỉ sau W.Zhu (1) X+ = È{KỴC | K Í X} Xu, Zhang (2) C+X = {xẻU | (ầMd(x)) X} Yao (3) X = U r ( x )Í X rR ( x) R Yao (4) Đò X = {x Ỵ U : rR ( x) Í X } R X+= X+ È {N (x) | xỴ X – X+} C+X = {xỴU | (ầMd(x))ầ Xặ } X = (( X C )C ) Ị òò R X = {x Ỵ U : rR ( x ) ầ X ặ} A.M Kozae, A.A Abo Khadra, T Medhat (5) t X = X0 t X = Ç{F Í U : X Í F Ù F dóng} Bảng 2.4 Các phép xấp xỉ phủ định nghĩa khơng gian topo tính A xác định quan hệ hai Ra UxU sau "u,vẻU, u Ra v v ch u(a) ầ v(a) ≠ Ỉ 2.5.2 Mối quan hệ xấp xỉ dựa vào không gian topo Với định nghĩa này, Ra xác định phủ Ca U topo cảm Xét hai tập đáng ý P(U): sinh từ quan hệ hai Ra Với tất thuộc tính thuộc A, có topo tS sinh từ tiền sở topo ta U A S a Trong đó, Sa tiền sở Nếu (U, tS) không gian topo xây dựng từ họ phủ {Ca | "A} sinh từ tập quan hệ {Ra | "A} tS gọi phủ sản sinh từ hệ thống thông tin S c Khái niệm rút gọn không gian topo sản sinh từ tập quan hệ G= { X | XỴP(U), ề ũũ R X = ặ } v H= {XẻP(U) | $P(U), X = Ị òò Y } R Mệnh đề 2.4 Nếu R có tính bắc cầu Ò òò Ò òò R Nếu Ò òò R R X Í Ị òò R X "XỴP(U) có tính ly ng thỡ GầH = ặ Trong phn sau, xột phủ đặc biệt C=tS Ở (U, tS) không gian topo xây dựng 2.5.1 b Mệnh đề 2.5 Cho (U, t) không gian topo sinh quan hệ hai hai Xét không gian topo (U, t) sinh từ tập quan hệ hai RA, ký hiệu R Nếu R quan hệ hai ngơi có tính phản xạ hai phép xấp xỉ bRA sở (U, t) Với PÍRA, rỴP, r gọi khơng cần thiết Yao (3) Yao (4) đồng P nếu: bP = b (P-r) Tập M gọi rút gọn P, nếu: (i) bP = bM, (ii) bP-{r} ¹ bM, "rỴM d Danh sách phép xấp xỉ tác giả định nghĩa Mệnh đề 2.6 Cho (U, tS) không gian topo xây dựng 2.5.1 b Xét phủ đặc biệt U C =tS , có X + = t X với X ÍU ... thuyết tập thô cổ điển) mở rộng tập thô qua tổng kết T.Y.Lin Xây dựng độ đo đánh giá hiệu tập luật định khắc phục hạn chế hệ độ đo trước Thử nghiệm kết đạt được: thuật toán FC-Reduct độ đo đánh giá. .. gọn tập thuộc tính dựa vào họ phủ tập thơ - Ứng dụng thuật tốn cho tốn xử lý thơng tin dạy học Đ.H Nha Trang Chương 3: ĐỘ ĐO ĐÁNH GIÁ HIỆU NĂNG TẬP LUẬT QUYẾT ĐỊNH - Đề xuất hệ độ đo đánh giá hiệu. .. thuật toán cho toán xử lý thông tin dạy học Đại học Nha Trang cho thấy khả ứng dụng tính đắn thuật toán Chương ĐỘ ĐO ĐÁNH GIÁ HIỆU NĂNG TẬP LUẬT QUYẾT ĐỊNH 3.1 Hạn chế độ đo cổ điển bảng định

Ngày đăng: 11/01/2020, 00:31

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan