Rút gọn thuộc tính trong bảng quyết định động theo tiếp cận tập thô

121 832 0
Rút gọn thuộc tính trong bảng quyết định động theo tiếp cận tập thô

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Rút gọn thuộc tính trong bảng quyết định động theo tiếp cận tập thô

iii MỤC LỤC O .i ii MỤC LỤC iii Danh mục thu t ng vi Danh mục ký hi u, t viết t t vii Danh sách b ng viii Danh sách hình vẽ x MỞ ẦU 1 Ở LÝ THUYẾT 12 ế 1.1 M t s .12 1.1.1 H thông tin 12 1.1.2 12 1.1.3 13 1.1.4 B ng quyế nh 14 1.2 M t s khái ni m v t p rút g n .16 1.2.1 T p rút g n d a mi 16 1.2.2 T p rút g n d a ma tr n phân bi t 17 1.2.3 T p rút g n d a entropy Shannon 18 1.2.4 T p rút g n d a µ-metric 19 ế 1.3 1.4 M t s thu 1.5 21 24 1.4.1 24 1.4.2 µ-metric 24 1.4.3 µ-metric 25 ế .26 ẾP CẬ Ậ 21 ă Ậ O Ế ỔI 27 .27 iv 2.2 ổi 29 221 µ-metric thêm m ng 29 222 µ-metric xóa m ng 32 223 µ-metric c p nh t m 23 ă ổi 39 dụng µ-metric t 2.2.1 Thu ă p rút g n thêm t 2.2.2 Thu ă p rút g n c p nh t t 24 25 ng 34 ng 39 ng 43 47 2.4.1 Th c nghi m thu ă p rút g n thêm t 2.4.2 Th c nghi m thu ă p rút g n c p nh t t ế ng 59 .64 ẬP RÚT G ng TIẾP CẬ Ậ 31 ng 47 O Ế ỔI 66 .66 3.2 Thu t toá ă ụ p rút g µ-metric t p thu c tính thay ổi 67 321 µ-metric thêm t p thu c tính 322 µ-metric xóa t p thu 323 ă 324 u ki n 69 dụng µ-metric t p thu í ổi 70 74 ă 3.3 Thu thu í u ki n 67 í p rút g ụ p ổi .81 3.3.1 T p rút g n d a hàm quyế nh m r ng tính ch t 82 3.3.2 Ma tr n phân bi t m r ng hàm phân bi t m r ng 84 3.3.3 Thu t toán tìm t p rút g n s dụng hàm phân bi t m r ng 85 3.3.4 Thu ă p rút g n s dụng hàm phân bi t m r ng bổ sung t p thu c tính 88 3.3.5 Thu ă n s dụng hàm phân bi t m r ng lo i b t p thu c tính 90 336 93 v 34 Ế ế .98 Ậ 100 Danh mục công trình c a tác gi 102 Tài li u tham kh o 103 Phụ lục 110 vi D mụ t uật ữ Thuật ngữ tiếng Việt Thuật ngữ tiếng Anh B ng quyế Decision Table nh B ng quyế ng Dynamic Decision Table B ng quyế nh nh t quán Consistant Decision Table ch c ch n c a b ng quyế xác phân l p nh Certainty Measure Classification Accuracy µ-metric µ-Metric hỗ tr c a b ng quyế ng nh Support Measure Object Hàm phân bi t m r ng Generalized Discernibility Function Hàm quyế Generalized Decision Function nh m r ng H thông tin Information System H ng Lu t quyế nh Dynamic Information System Decision Rule Ma tr n phân bi t m r ng Generalized Discernibility Matrix Mi Positive Region ă Tiếp c n Incremental Approach Quan h Indiscernibility Relation Rút g n thu c tính Attribute Reduction T p xác Crisp Set T p lõi Core T p rút g n Reduct T p thô Rough Set Thu c tính Attribute | Feature Thu c tính không th lo i b Indispensable Attribute X px Lower Approximation X p x i Upper Approximation vii D BN B X  mụ ký B - mi n biên c a X POSB  D  B - mi BX B-x px BX B - x p x c a aD ic a B ng quyế K P ệu, từ v ết tắt X X nh C u trúc tri th c sinh b i t p thu c tính P ch c ch n c a b ng quyế nh DT xác phân l p hỗ tr c a b ng quyế phụ thu c c a t p thu u a Giá tr thu c tính a c nh DT í D ng iv iC u Hàm phân bi t m r ng Hàm quyế nh m r ng H thông tin Kho ng cách µ-metric b ng quyế u B L p a ĩ M a thu nh DT í iv it pB U /B Phân ho ch c a U sinh b i quan h IND(B) IN D  B  Quan h B - không phân bi H (Q | P ) Shannon e u ki n c a Q H P |X| Shannon entropy c a t p thu c tính P L IN D  B  ng u c a quan h ng c a t p h p X c ết P viii D b ế ch táo 15 B ng 2.1 B ng quyế nh g c 31 B ng 2.2 B ng quyế ng 32 B ng 2.3 B ng quyế ng 34 B 11 s B ng 2.4 B ng quyế nh c p nh t m ng 39 B ng 2.5 Các b s li u th nghi m 49 B ng 2.6 T p rút g n c a thu t toán MBAR thu t toán MIR_AdObjs 51 B 27 AP, AQ ,  , g  c a thu t toán MBAR thu t toán MIR_AdObjs 52 B ng 2.8 So sánh th i gian th c hi n (s) thu t toán MBAR thu t toán MIR_AdObjs 53 B 29 xác phân l p c a MBAR MIR_AdObjs 55 B ng 2.10 Kết qu th c hi n Thu t toán MIR_AdObjs thu t toán GIARC-L 57 B 11 a thu t toán MIR_AdObjs thu t toán GIARC-L 58 B 12 xác phân l p c a GIARC-L MIR_AdObjs 59 B ng 2.13 B s li u th c nghi m 60 B ng 2.14 T p rút g n c a thu t toán MBAR thu t toán MIR_UpObjs 61 B 15 a thu t toán MBAR thu t toán MIR_UpObjs 61 B ng 2.16 So sánh th i gian th c hi xác phân l p c a ARED-L MIR_UpObjs 63 B ng 3.1 B ng quyế ă p thu í u ki n P 69 B ng 3.2 Mô t b d li u th nghi m 75 B ng 3.3 T p rút g n c a thu t toán MIR_AdAt MBAR 76 B ng 3.4 Kết qu a thu t toán MIR_AdAt MBAR 77 B ng 3.5 T p rút g n c a thu t toán MIR_AdAt DIA_RED 79 B 36 xác phân l p c a DIA_RED MIR_AdAt 81 B ng 3.7 Mô t b d li u th nghi m 94 ix B ng 3.8 T p rút g n c a thu t toán MIR_AdAt GDF_IR_AdAt 95 B 39 a thu t toán MIR_AdAt GDF_IR_AdAt 96 B 10 xác phân l p c a GDF_IR_AdAt MIR_AdAt 97 x D s ì vẽ Hình 2.1 Th i gian tìm rút g n c a hai thu t toán MBAR MIR_AdObjs 50 Hình 2.2 Th i gian tìm rút g n c a hai thu t toán MBAR MIR_AdObjs theo ă 54 Hình 2.3 Th i gian tìm rút g n c a thu t toán MBAR thu t toán MIR_UpObjs 62 Hình 3.1 Th i gian tìm rút g n c a hai thu t toán MIR_AdAt MBAR 77 Hình 3.2 L Hình 3.3 L ng t p rút g n c a hai thu t toán DIA_RED MIR_AdAt 80 ng t p rút g n c a hai thu ă DF_ _ MIR_AdAt 94 MỞ ĐẦU í ụ í ă Xu t phát t s ế í ế ụ í : í í ; ( í í : í í G í í í í ẽ ă í ế í Giảm kích thước tập thuộc tính í G í í í ĩ í hi u qu cho í í í í ụ [27] í í ế ổ í í í ế (hay í ụ í ) í ổ F Attribute Selection) ụ , ụ í l a í ụ ỗ í ế í í ế í ế í í í l a [20], [27]: ; í ; ; ế Phân loại phương pháp lựa chọn thuộc tính ến c ế t nhi u ĩ áp dụng thành công nhi ă phân l p bi u di thu t toán l a c ụ n d li u, n, x lý tìm kiếm … Có th chia : c (Filter) thu c tính thành hai l l ế (Wrapper) í ế ụ í ụ ụ ng tin c a thu c tính l tiêu chu n ch n thu c tính mà không s dụng tri th c phân l p c a d li u D ến lý thuyết thông tin ng í thiết chi phí tính toán th p, b m c thông tin c n i v i kỹ thu t khai phá tri th c thu c tính ă ụ ụ [22]: ụ ; ; ụ ụ cụ th c a mô hình í ụ ; í C ĩ ă í ụ ; ụ ụ í d a tác vụ 99 ến hành 05 th c nghi m 06 c cu i c a nghiên c u, tác gi b d li th nghi m so sánh thu xu t v ă dụng , so sánh gi a thu t toán tác gi xu t Các th nghi m th c hi n l p thu t toán g c, th c hi n thu c th c hi n nh m mụ í qua nh ng h p í m t lý thuyết thông : i gian th c hi ă xác phân l p C4.5 V i ch ng minh ch t chẽ logic lý thuyế th c nghi m u cho th y xu t gi m th i gian tìm rút g n v quyế h ng phân tích m l n nh t ă m b o yêu c u v hi nh so v i th c hi n l p l i thu t toán g c M t s so sánh gi a thu t ă toá y thu m nh th nói khác bi t l n Các so sánh cung c nh ng thông tin h mụ a b ng í í quyế nh l a ch a mô hình phân tích d li u cụ th c í p nh t v i 100 ẾT LUẬN đề cậ đến vấ đề s u đ 1) Luậ :  Tìm hi u tổng quan tình hình nghiên c u rút g n thu c tính b ng quyế ĩ nh ng tiếp c n lý thuyết t p thô  Nghiên c u tổng quan v tiếp c n nh biế ă n thu c tính b ng ng  Nghiên c xu ă rút g n thu c tính theo tiếp c c a b ng quyế ng h ng ho c thêm, xóa thu c tính d a metric hàm phân bi t m r ng đạt đ ợc luận án gồm: 2) Những kết qu  ế tái s dụng kết qu c a thu t toán g c th hi n qua vi c xây d ng ch ng minh công th c c p nh t h p b ng quyế nh có s biến ng m nh t t p rút g n ng ng (thêm, xóa c p nh t) làm ă cho rút g n thu c tính theo tiếp c  D a kết qu xây d ng - c trên, xu t thu t toán heuristic c p ng h p thêm ho c c p nh t t ng; tiến hành th c nghi m minh h a b d li u UCI so sánh v i thu t toán g c ă nghi t toán ă s dụng entropy (Liang) Kết qu th c ng minh lý thuyế xu t có nh ng c i tiến nh u cho th y thu t toán lu nh v th i gian th c hi n xác phân l p c a b ng quyế nh rút g  Xây d ng ch ng minh công th c c p nh t nh t ma tr n phân bi t m r ng mb o ng quyế -metric ng h p b ng quyế c nh g c ếc p nh có s biến ng v t p thu c tính (thêm, xóa)  D a kết qu xu t thu t toán heuristic tìm rút g n thêm ho c xóa m t t p thu c tính theo hai : -metric Hàm phân bi t m r ng Th c nghi m b s li u UCI ch ng minh s 101 c i tiến c ă s 3) ă xu t so v i m t nhóm t p thô khác ng nghiên c u  M r ng nghiên c ế c p nh t µ-metric c p nh t giá tr thu c tính ng thu t toán heuristic tìm t p thu c tính rút g n  Nghiên c u xây d ng thu t toán sinh lu t quyế nh b ng quyế nh ng  M r ng nghiên c b ng quyế n thu c tính d a µ-metric 102 D mụ t ì ủ t (2012), “Metric Based Attribute ” thứ V - yếu Hội thảo quốc gia lần ột số vấn đề chọn lọc C TT TT, pp.185-190 2014 ổi s dụng kho thu c tính b ng quyế “ n ” K yếu Hội nghị khoa học Công nghệ Quốc gia lần thứ VII - Nghiên cứu ản ứng dụng CNTT - FAIR7, pp.570-581 (2015), “ ” The Proceedings of the 7th VAST - AIST Workshop - “Research Colla oration Review and Perspective”, pp.217-228 n Long Giang (2016 “ ” Journal on Information Technologies & Communications,Vol.E-3, No.9(13), pp.26-39 (Chuyên san Nghiên c u, phát tri n công ngh thông tin truy n thông-T p í vi n thông) Demetrovics Janos, Nguyen Thi Lan Huong, Vu Duc Thi, Nguyen Long Giang 2016 “Metric Based Attribute Reduction Method in Dynamic Decision Tables” Cybernetics and Information Technologies, (Bulgaria) Vol.16, No.2 n Long Giang (2016), “Generalized discernibility function based attribute reduction when adding and removing an ” K yếu Hội thảo Quốc gia lần thứ XIX – Một số vấn đề chọn lọc CNTT TT, pp.110-115 103 T ệu t mk Tài liệu tiếng Việt 2007 “ [1] ế í ” Luận án Tiến sĩ Toán học 2012 “ ghi n cứu phương pháp khai phá d liệu [2] theo tiếp cận lý thuyết tập thô” ế ĩ Thông Tin “ [3] í ế ụ ” Tạp chí Tin học Điều khiển học, T.28, S.2, 2012 “ ghi n cứu thay đổi giá trị [4] độ đo đánh giá hiệu tập luật định tr n tập r t gọn” ế ỷ “ ” 11 2012 2013 295-301 2010 “ [5] ” Tạp chí Tin học Điều khiển học, T.26, S.1, tr 73-85 2014 [6] í ế ổ ụ ” “ yếu Hội nghị khoa học Công nghệ Quốc gia lần thứ VII - ghi n cứu ản ứng dụng C TT - FAIR7 Tài liệu tiếng Anh [7] Chan C 1998 “ z ” Information Sciences, Vol.107 pp 177–194 D [8] incremental approach 2013 for updating “ approximations -set-based under dynamic ” IEEE Transactions on Knowledge and Data Engineering, 25(2), pp 274-284 104 [9] Demetrovics J., Thi V.D and Giang N.L (2014), “ etric ased attri ute reduction in dynamic decision ta les”, Annales Univ, Sci Budapest, Sect Comp Vol.42, pp 157-172 [10] D z [11] D D z 2014 “ 2015 “O D z D ” Springer F : w ” RSFDGrC 2015, LNAI 9437, pp 13–23 [12] Ge H., Li L and Yang C (2009), "Improvement to quick attribution reduction algorithm", Journal of Chinese Computer Systems, 30 (2), pp 308312 2015 [13] “ ” The Proceedings of the 7th VAST - AIST Workshop - “Research Colla oration Review and Perspective”, pp.217-228 [14] Giang N.L (2012), "Metric based attribute reduction in decision tables." Computer Science and Information Systems (FedCSIS), 2012 Federated Conference on, pp 311-316, IEEE [15] Guan L (2009), "An incremental updating algorithm of attribute reduction set in decision tables", Fuzzy Systems and Knowledge Discovery, 2009 FSKD'09 Sixth International Conference on, Vol 2, pp 421-425, IEEE [16] Hoa N.S and Son N.H (1996), "Some efficient algorithms for rough set ” Proceedings of the Conference of Information Processing and Management of Uncertainty in Knowledge-Based Systems [17] F 2005 reduction based on elementary “ ” Proceedings of the 10th International Conference on Rough Sets, Fuzzy Sets, Data Mining and Granular Computing, Regina, Canada, pp 185-193 [18] Hu X and Cercone N (1995), "Learning in relational databases: a rough set ” Computational intelligence , 11(2), pp 323-338 [19] 2004 “ w 105 ” Fundamenta Informaticae, 59(2-3), pp 135-152 2004 [20] application t w z “F zz -rough attribute reduction with ” Fuzzy Sets and Systems, Vol.141(3), pp 469-485 [21] Jing Y., Li T., Luo C., Horng S J., Wang G and Yu, Z (2016), “ incremental approach for attribute reduction based on knowledge ” Knowledge-Based Systems, Vol.104, pp 24-38 ć [22] ć & ć w 2015 ” “ w Information and Communication Technology, Electronics and Microelectronics (MIPRO), 38th International Convention on, pp 1200-1205, IEEE D [23] 2013 “ dominance-based rough sets approach under the variation of the attribute ” Knowledge-Based Systems, Vol.40, pp 17-26 [24] Li T., Ruan D., Geert W., Song J and Xu Y 2007 “ characteristic relation approach for dynamic attribute generalization in data ” Knowledge-Based Systems, Vol 20, pp 485–494 D [25] 2002 “ zz w ” International Journal of General Systems, 31(4), pp 331-342 F D [26] 2014 “ approach to feature selection applying rough set technique”, IEEE Transactions on Knowledge and Data Engineering, 26(2), pp 294 - 308 2005 “ [27] w ” IEEE Transactions on knowledge and data engineering, 17(4), pp 491-502 2009 “ [28] w [29] m ” Chinese Journal of Computers, Vol.32, No.8, pp 1493-1499 Luo P., He Q and Shi Z (2005), "Theoretical study on a new information ” In Fourth IEEE Conference on 106 Cognitive Informatics,(ICCI 2005), pp 73-79, IEEE D [30] 1999 “ w ” Computer Research and Development, Vol 36, No 6, pp 681-684 2007 “ [31] ” Chinese Journal of Computers, 30(5), pp 815-822 2012 [32] “ -attribute w group decision- ” Omega, 40(3), pp 294- 301 [33] w Z 1982 “ ” International Journal of Computer & Information Sciences, Vol.11, Issue 5, pp 341-356 [34] w Z 1998 “ ” Cybernetics and systems 29, pp 661-688 [35] Pawlak Z and w 2007 “ ”, Information Sciences, Vol.177, No.1, pp 3-27 [36] w Z 2012 “ : ” Springer Science & Business Media, Vol F [37] 2010 ” “ Fuzzy Systems and Knowledge Discovery (FSKD), 2010 Seventh International Conference on, Vol 4, pp 1848-1852, IEEE [38] Qian W.,.Shu W, Yang B and Zhang C 2015 “ F D w F ” Chinese Journal of Electronics, Vol.24, No.1, pp 128-133 D Z [39] D 2008 “ ” evaluating th Information Sciences, 178(1), pp 181-202 [40] 1948 “ ” The Bell System Technical Journal 27, pp 373 – 423 [41] 2000 “ 107 zz w ” Eng.Applications of Artificial Intelligence, Vol.13(3), pp 263-278 w [42] z 1992 F “ ” D Interlligent Decision Support, Handbook of Applications and Advances of the Rough Sets Theory, Kluwer, Dordrecht, pp 331-362 [43] 2009 Sun L., Xu J and Cao “D w ” Intelligent Systems and Applications, ISA 2009 International Workshop on, pp 1-4, IEEE [44] The UCI machine learning repository, http://archive.ics.uci.edu/ml/datasets.html Z [45] 2007 “ ” 2007 International Conference on Computational Intelligence and Security Workshops, IEEE CISW, pp 81-84 D [46] w 2008 ” “ Information Sciences, 178(16), pp 3228- 3239 O [47] FF 2008 “ ” 2008 International Symposium on Computational Intelligence and Design, IEEE ISCID, pp 3-6 F [48] D 2013 “ e reduction for dynamic data ” Applied Soft Computing, 13(1), pp 676-689 F [49] 2013 “ : ”, Knowledge-Based Systems, Vol 39, pp 95– 108 2001 [50] ” “ w w : Dasarathy BV editor Data mining and knowledge discovery: Theory, tools, and technology III, Proceedings of SPIE, pp 200-207 108 2003 “ [51] w w” International Journal of Intelligent System 18, pp 679-688 D [52] 2002 “D ” Journal of Computers, Vol 25 No 7, pp 759-766 D [53] Z F 2001 “ w ” Proc Of the World Multiconference on Systemics, Cybernetics and Informatics, Orlando, Florida, pp 555-560 2001 “ [54] : ” Journal of computer science and technology, 16(6), pp 489-504 Z [55] Z 2008 “ ” Computational Intelligence and Design, ISCID'08, International Symposium on ,Vol 1, pp 150-153, IEEE [56] F Wei W., D 2010 “ ” International Journal of General Systems, 39(8), pp 813-838 1999 [57] “ ” International Journal of General Systems, pp 283-197 [58] Z Z 2006 “ reduction algorithm with complexity of max(O(|C||U|), O(|C|2 ” Journal of Computer, Vol 29, No 3, pp 391-398 [59] Xu Z., Wang X and Zhang W (2013), "Attribute Reduction Algorithm D ” Information Computing and Applications, Springer Berlin Heidelberg, pp 563-572 [60] Zhang C S, Jing Ruan J and Tan Y H (2011), “An Improved Incremental ” Journal of Computational Information Systems, pp 3127-3133 109 [61] Zhang J., Li T., Ruan D 2012 “ dynamic attribute variation in setApprox Reason, Vol.53, pp 620–635 w ” Int J 110 P ụ ụ 1.1 Giao diệ Một số giao diện củ t ì t ì t nghiệm 1.2 K ch b n thử nghiệm bổ sung tậ đố t ợng 1) Nạp tập d liệu an đầu: - Ch n ch c ă “ ổ sung t ”, ch “ tùy ch n theo % t p d li - ” n p vào ĩ Gi s ch n n p 50% t p d li p t p d li y 50% b n ghi c a t p d li u th nghi m (UCI) làm t p d li u g tiến hành thêm t i ng 2) Nạp tập d liệu bổ sung: - Vào ch ă “ ổ sung t ”, ch “ n s % t p d li u l i - Gi s ch n n p 50% t p d li u l i p t p d li u bổ sung” n p vào 111 3) Thực thuật toán MBAR 112 4) Thực thuật toán MIR_AdObjs 1.3 K ch b n thử nghiệm bổ sung tập thuộc tính k ch b n bổ sung t ng, bổ sung t p thu c tính bao g m c: 1) Nạp tập thuộc tính an đầu: n p vào n s % thu c tính ban 113 2) Nạp tập thuộc tính bổ sung: l n s % thu c tính n p vào 3) Thực thuật toán MBAR 4) Thực thuật toán MIR_AdAt Các thu ch ă nghi m C p nh t t c th nghi m v i k ch b ng Bổ sung t p thu c tính c nhóm [...]... c n thu c tính trên h ă so v ng tiếp c n gia ă n ng: Tiệm cận gia tăng trong rút gọn thuộc tính trên hệ thông tin động là phương pháp tìm cơ chế tái sử dụng các kết quả tính để cập nhật tập rút gọn nhằm giảm thời gian tính toán và đảm bảo các yêu cầu về hiệu năng của tập rút gọn ă ế ế và c í ế thao tác í ụ y làm tiêu chu n l a ch n thu c tính ă ổi so v ĩ c p rút ổi b n ch t Nói m g ă ă p rút g n kết... Xanh No 9 16 1.2 Một số khái niệm về tập rút gọn 1.2.1 T p rút gọn dựa trên miề d ơ Trong b ng quyế í nh, không ph i m i thu i v i tác vụ phân l p t ng Các thu í u ki n trong b ng quyết c chia thành thu c tính lõi và thu c tính không c n thiết d tr i v i phân l p Thuộc tính lõi là thu c tính c t yếu, không th thiếu trong vi c phân l p chính xác t p d li u Thuộc tính không cần thiết w Đ ĩ dụng mi ĩ... trên µ-metric trong ế ụ tiếp c n ế ế ă tìm t p rút g ng h p í ụ 27 C 2 TIẾP CẬN GIA TĂNG TÌM TẬP RÚT GỌN TRONG BẢNG QUYẾT ĐỊN CÓ TẬP ĐỐI TƯỢNG T AY ĐỔI 2.1 Mở đầu ế ế ế i v i m t mô hình d li u, tính ổ nh c a t p tri th i v i mô hình h c máy) là m t yêu c u c ổi qui mô nh v t nh nh ĩ mb ng ho c t p thu c tính c ổi m tính rút g ổ (ví dụ t p hu n luy n d li u thì t p thu c “ nh Trong nh ng ng... n R b ; p thu c tính g t p rút g n R không ch a thu í mb trong w i là t p rút g ế u PRED C ⋂ rút g n Pawlak c a C ĩ 2 th a ĩ T p rút g u ki ch c  là h t t c các t p p rút g n b o toàn mi rút g n thu c tính khác d a trên nh ng nguyên t c b í u có mụ n là gi m s ng thu c tính và b o toàn các thông tin c n thiết ch a trong d li u Ví dụ, trong [35] Z.Pawlak và A.Skowron ĩ p rút g 1.5 b u ki n b o toàn... p, l a ch n thu c tính, rút g n s chi u c a h thông tin, phân cụm, gi m nhi u d li … d li u quan h , phân tích h thông tin không ĩ í l a ế ă ế í ế í l a í ế ẽ ; ế ế í í L a ch n thu ếp c n lý thuyết t p thô í g i là rút g n thu c tính í í ế M t có th có nhi u t p thu c tính rút g n (t nay g i ng n g n là t p rút g n) và mỗi t p rút g thu c tính u có th thay thế ế Vi c tìm t t c các rút g n minh là... t p rút g n t ra nh ng tiêu chu rút g n Trong nhi u nghiên c thu c cho t p t p i ta dùng tiêu chu n s nh T p rút g n t t nh t sẽ có s ng ng thu c tính ít nh t; có nhi u t p rút g n có s thu c tính bé nh t, tiêu chu là t p có ít thu c tính tính có kh ă t t nh t t í ụ c tìm kiế ng dụng th c tế, ch c n tìm ra m t t p rút g ụ g n t t nh t [41] t p t i thi u thu c p thu c tính g c M c dù có th c t p rút. .. bi t 1.2.3 T p rút gọn dựa trên entropy Shannon Khái ni m e í m ĩ c ă 1948 không ch c ch n c a m t h trong lý thuyế [40] c s dụng r ng rãi c tính hóa n i dung thông tin Trong nhi u nghiên c u phát tri n lý thuyết t c s dụ t tiêu chu n trong bài toán ẽ tìm t p thu c tính rút g n Các khái ni c s dụng trong các ph n ch ng minh m t s tính ch t lý thuyết c dụng hàm phân bi t m r ng Đ n thu c tính s 3 mục... [59]) rút g hỗ tr c a t p thu c tính ph c a t p lu t sinh b i t p rút g n) gi m d n t 3 y, nếu ch xét v khía c dụ 1 ến nhóm hỗ tr c a t p lu c ma tr n phân bi t t dụng nh iv i m t mô hình d li u, c n ph i xem xét thêm nh ng yếu t khác n a, chẳng h n ph m vi ng dụng ho c chi phí tính toán c khi quyế nh ch n l pháp Rút gọn thuộc tính đối với hệ thông tin động M c dù ỹ thông tin c xu t tìm t p rút g n... tính c n thiế c g i là thu c tính lõi Rút g n thu c tính chính là tìm cách lo i b t c n thiết mà v ă m b o kh ĩ 1.5 ([33]) Cho b ng quyế : R  C í D p ĩ : rút g n theo mi Đ p c a t p thu ng thu c tính không 1) POSR (D )  POSC (D ) 2)  r  R , P O S R r ( D )  P O S C ( D ) t t p rút g n c a C d a trên mi nh T p thu c tính 17 ĩ 1 u ki ch n c a các lu t phân l u ki n t p rút g n R b ; p thu c tính. .. trên t p ki m í ng i tính toán nhi u l n t p rút g n n nh t cho bài toán tìm t p rút g n là th c hi n l i thu t toán rút g n g c trên d li ổi ế theo ụ chu kỳ í ế ĩ ế í ng ổi t p thu c tính rút g n d li u thì ch c ch n c m b o ch nh ổi qui mô l n, t c là t p d li u biế ă ế í ế M ts pháp s dụng tính toán h rong [8], các tác gi xu t thu nh t các x p x c a m t t p h p trong h thông tin theo mô hình t ă c ... thu c tính h ă so v ng tiếp c n gia ă n ng: Tiệm cận gia tăng rút gọn thuộc tính hệ thông tin động phương pháp tìm chế tái sử dụng kết tính để cập nhật tập rút gọn nhằm giảm thời gian tính toán... phí tính toán c quyế nh ch n l pháp Rút gọn thuộc tính hệ thông tin động M c dù ỹ thông tin c xu t tìm t p rút g n c p Song ĩ nghiên c ế v n khiêm t n V ổi, toán rút g n thu c tính c qu ? ến rút. .. thuyết t p thô í g i rút g n thu c tính í í ế M t có th có nhi u t p thu c tính rút g n (t g i ng n g n t p rút g n) t p rút g thu c tính u có th thay ế Vi c tìm t t c rút g n minh toán NP -

Ngày đăng: 16/12/2016, 21:43

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan