Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 25 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
25
Dung lượng
876,28 KB
Nội dung
I. !"#$ % &'( ")*+, +-.'/")0" ""12-3 45,67+8 9:":;& :< :&&=>4 "1? • @A)B""#"CA)8< 4: :&":&"=3 • DE48;: =>4 "17&/ 8:"=>.8:" =>! 8&:: =>4F8&G =3 • 8;"=?HI !JK3C "1 +B3 • L"8M =?N&ON.# !"1+53 • P#8;: :=3 Q7+B"R7$S45,$ N45,OT"7U-'/45, 23 D5%"? • <V,8D&&W = 3 • <VI3 • XK3 • <V.1V.Y: Z"3 1 JK5+"I""2 " V. ")!>" I> 5%"/>.>[P "&O->(KB"5"N+ #,C0"+"I" ")U4 " V.>+B"$63 II. 1. \, X(KB8] "^:P: = _`&9<98abcdecffd=) HA 0abgc25+"I""""2 " !.3X(KB5#N)C" !"h>"AB"I.#"C4 V .>K>K/"[LU4.,4 V.NO5",>+"B"%1>B" hh3iI..6V.N(KB *5HAHR#4#jO5"B"#5V, hh4*"+-&k3P: #6(K B>!KB)N,cKlmnHAHR5,HAHRN6 -3@AHR5,4 "1O5"hh>oHAHRN+ ACO5"-C0")K-3DKHAHR%&'# pK8+=S%&'3 q)5Z" ">5&rI"5Z" B" >"B"H U "7 K>F"3X(KBI" 5Z" 7-B"I*"C&"$p"5Z" B"hh3i5#6(KBO, 5,"KHHAs:&B"$"C)&K6 .t"5B"$4Au+) )3 \$V>(KB'B"I" "Hr( A)574+B"hh UB". H>V.+>"A5".CI"6B" O,.A&-UYB": Z">K /""&IZ">&K3 X(KBN"C*"#"K>p" $C-B")!O5" "KtI3 III. 1. iB7V DV8:& ::= ""7+BC A>j#AO,"5ZT"3DAp6 V4 "1p3qp5,T" 2 5"!p> "B7V,." 62,8"!h2=3Dpp5"! p >Vo.6K>#N .C.V,3i6V HASp -+",v& &N )"6p-3qp$N5"!p"O6V3 @:Hv.I)V5&wax? 3 PS4C"N>HV"V5&? DV6.IN-#5"C.5&?p +"6.V,8.l<n=3Dp 5%"+",..V,yp"O t"5H:5p U4>'V.. lz n3D6VSp4Au5%"5%" v& &-#& &4*">& &>,%{%[ 5"Cv& &4h4C#" "8Lp" U^=N" -6.6 p3X5(VNB"-&"6. lKn "$V>.5K5"! ".5S4'7.B" C5'"7HV"B76V3 D." 7V,B"5Z"- "NIo"!#&O8 :: ::&= U#Z/o"!#V /8 :: :" :&=3|.I#5%"4#j4*"&O #NI>#",.#Z/8- #Z/-.",.j"=3 2. D5%4C#HV"V sh$Sp%4#jACY qY)T",>p'p 5"24*",- q"5/>T" .#!.&}V OAY , 4 i~/ S""6.5 !Y~V /: ;T"T"7#/ V P7pR4Au) &Vp" - PACY p ~,))T" ,3 - B"o. Y-# # V /H%3 - B"oY :&•4:€ PN>B"!5.V,(/p> &}/ VA+/>.I5V5,V? q5K>A)UC!5.V,OA3 <$: &}",NE> NE> &}!.V,OA/p3 3. PK/6B7V 5 DV"C.5"h/>p"-# j"&3q->V-&O 5"pSC7"5ZB"Nt"j"# 5-3%>Vt"-##&"K K3|7K>V5H:5j#3 DV-#Hr(C.N&O$ 3 P#6V6/"#4#j 4Au "Z/ 3 DV-C0"Hr(4-#"V 3 DV-C0"Hr(4-""3 DV5H:55%"&O3 L)-"VB"-"C)&V 4,ApV,3 $K 85•;‚ UDƒ3„=4h4 .INC"Z/3 V&rI"5%"l#n>p"-# O1/&O.NU}, >5"&}-0&O5%"+/HA3 i """NV"V)"&V ,-BCA//)V,t"-#"U- 0 "4#j4*"V3i!% "C65"A)/ V8<" &&:>abbf=3$VV B""#" /SY# 4#j> "&O5Z">VN+ V "O" "+#6V ,3|.I>&#: V?€ 8… a … c =8… ‚ … ƒ =7V%4O#4#j 254#j "$b3‚3X5(V-+c 4C& 6T"V 3 DU.N6VY"-0 5/,KA>.B"T >j38Q>abb‚=3 4. !"# a. PNEa)8†:^"D:=? q"RNa.3@v: Ap6Y 7-‚NE •e4&:D: 6 ACY)aV,>"!- <3q"5/>Y/ )V,7 -"!•3@v: NE•e4&:7- &? •G \ DK t5,V5Z"T" \#H #3L N%&'(B"6 !D:^ > H"6 "B"&' " /B" 3\C&r/pq>K;K$5 H#>UAC.! . - \,A+"rN#V 3DB"+. \5&wax? |, H&A644AuN;)2D3 D-#H:B"+•G 8;=5." "47N5"B"&rI"*H2 644Au "K;>•G 8;=o5"! & /8: =6;3\C&rV4 ";N .…4Au>#B"A.F"-# H:5…-"V4‡ a > c > ‚ >[3 ˆ3q .…5&rI"#K >"K &}5%"+", 6p/> B"-5&V,: K N&}5 .5&wax? |,‰;Š‰O"&O45V K +Š3 L \5H&4"B""O 8B"5V,=B",8B"& 2V,=5.: B"+4N5,5& wax? 7 q-> \ 455"B" 5V,>. - \,A&} 5!+"rN#V3|!. : N. \,A5%"5%",O 75V /& V,OA -5"B"$# V,8#"•G … 8;=={Awax3 \ C.%&''4C"N?#H:A C.)-#Z/3PB.2 ,+.l4&• :nR-"Da€l:&n Dc€l n>5K-.4-2,"Da 04"Dc3L#7#OA>C. R&O\6AC.N3L$N&}. 4KA;wax? . S".>4h$,.l…":n3P .-4"l n>l:•":nl&: n3q7 4C">,"l n-4-" .2l:&n44".2l n3 P5%""l:•":n-4O4-2, 8 l:&n B"-4 -2, l ny , " l&: n-442,l:&n4-2,l n3 P: B"+N> 6.…HvNKA ;wax? |K: B"+.R&O\? P: .5%"5N>.R&O\ $ 5.l :n>l&:nl:•"n3 C&} \8l :n= € f3fcby\8l&:n= € f3a„a\8l:•"n=€f3fƒg3q5K>. l…":n.-R&O\,AN&}5! .V3CV&}V 5&wax? 9 \•:H DR&O\8\:H=?DR&O\5&rI" "K D…]P3P"5, \>R&O\ ) .lB" "&On6K3DR&O\6K ;5"5&wax? |,F"&O2,>H&A#44Au " ;)2D >5.5&? DR &O \ 5Z" &} 5 . N"CK;5VV K 3L$NHv5Z".…4Au ";-#Z/>T"v&}5 €‡ a > c [33 ˆ"3L#H#OA 6…>#ACK -#/ 5S"V 4N>K /"!^ … )# V/"…∈^ … 3q5K,"&}-c e cK > "-K"K $€‡ a > c [33 ˆ &}B"5Hv3q5KUACK >$U&}VK"K a c N"4 C)Z/ $8 a c .K$" K"=3|,K a c 5%"+"K ;t"5VK ; a 84-".…∈ a =; c 84-" .…∈ c =: >\8;=&}5.5&wax? 10 [...]... thực) o Xử lý các bộ học thiếu giá thuộc tính (missing-value attributes) o Xử lý các thuộc tính có chi phí (cost) khác nhau c Cây quyết định mở rộng 1 Oblivious Decision Trees Cây quyết định oblivious là cây quyết định mà tất cả các nút tại cùng cấp thì cùng tính năng Mặc dù có những hạn chế, song cây quyết định 15 Hệ hỗ trợ ra quyết định oblivious rất hiệu quả trong việc lựa chọn tính năng [Almuallim... 0.048 Chọn Quang cảnh làm thuộc tính phân lớp vì có Gain lớn nhất - Vẽ cây quyết định: Do Quang cảnh=Nắng và Quang cảnh=Mưa chưa xác định được thuộc tính phân lớp nên ta chia tập huấn liệu thành 2 bảng như hình trên và tiếp tục tìm thuộc tính phân lớp cho 2 bảng mẫu huấn luyện Kết quả cuối cùng ta có cây quyết định sau: 14 Hệ hỗ trợ ra quyết định Từ cây quyết định trên tạo ra các luật: – R1: IF QC=Âm u... Giải thuật: ID3_algorithm(Training_Set, Class_Labels, Attributes) Tạo nút Root của cây quyết định If tất cả các ví dụ của Training_Set thuộc cùng lớp c Return Cây quyết định có nút Root được gắn với (có nhãn) lớp c If Tập thuộc tính Attributes là rỗng Return Cây quyết định có nút Root được gắn với nhãn lớp ≡ Majority_Class_Label(Training Set) 21 Hệ hỗ trợ ra quyết định A ← Thuộc tính trong tập Attributes... chọn tính năng trước đây bằng cách xây dựng cây quyết định oblivious, trong khi đó [Langley và Sage (1994)] đã đề nghị lựa chọn ngược cũng sử dụng cây quyết định oblivious [Kohavi và Sommerfield (1998)] đã chỉ ra rằng cây quyết định oblivious có thể chuyển thành một bảng quyết định Gần đây [Maimon và Last (2000)] đã đề nghị thuật toán mới IFN (Information Fuzzy Network) để xây dựng cây quyết định oblivious... bộ nhớ của cây quyết định quy nạp SPRINT đánh dấu bất kỳ nhiễu nào được chia nhỏ dựa trên các bộ dữ liệu lớn (Gehrke, 2000) đã giới thiệu RainForest; một khung đồng nhất cho các phân lớp cây quyết định mà có khả năng nhân rộng bất kỳ thuật toán cụ thể nào từ tài liệu này (gồm: C4.5, CART và CHAID) Hơn nữa để tổng quát, RainForest cải tiến SPRINT bằng một nhân tố 17 Hệ hỗ trợ ra quyết định của 3 Ngược... (Negatives == 0) return 0; double Entropy; int total = Negatives + Positives; double RatePositves = (double)Positives / total; double RateNegatives = (double)Negatives / total; Entropy = -RatePositves * Math.Log(RatePositves, 2) - RateNegatives * Math.Log(RateNegatives, 2); return Entropy; } 4 Hàm tính Gain: 19 Hệ hỗ trợ ra quyết định • Công thức: Gain(S, A) = Entropy(S) - Entropy (Sv) • Code: private double... and Utgoff(1995) T1 Holte(1993) PUBLIC Rastogi and Shim(2000) MARS Friedman(1991) and 12 Hệ hỗ trợ ra quyết định SLIQ (Supervised Learning in Quest) SPRINT(A Scalable DataMining) Parallel Classifier … Mehta(1996) for Shafer, Agrawal, Mehta … Em xin trình bày cụ thể thuật toán ID3 như sau: Thuật toán ID3 được phát biểu bởi tác giả Quinlan (trường đại học Syney, Australia) và được công bố vào cuối thập... else begin chọn một thuộc tính P, lấy nó làm gốc cho cây hiện tại; xóa P ra khỏi tập_thuộc _tính; với mỗi giá trị V của P begin tạo một nhánh của cây gán nhãn V; Đặt vào phân_vùngV các ví dụ trong tập_ví_dụ có giá trị V tại thuộc tính P; Gọi induce_tree(phân_vùngV, tập_thuộc _tính) , gắn kết quả vào nhánh V end end end Xét ví dụ 3.1 cho thuật toán ID3: 13 Hệ hỗ trợ ra quyết định - Gọi tập huấn luyện là... giải quyết được các vấn đề về cập nhật các cây quyết định tăng trưởng (Utgoff, 1989b,1997) trình bày một số phương pháp để cập nhật cây quyết định tăng trưởng Mở rộng của thuật toán CART là khả năng gây tăng trưởng được mô tả trong (Crawford, 2002) d Phần demo về cây quyết định áp dụng thuật toán ID3: 1 Giao diện chính của chương trình Demo gồm 4 phần: o Phần 1: Bảng lưu dữ liệu training (Data Training)... xây dựng cây mờ gồm một số hàm suy luận dựa trên việc giải quyết xung đột trong các hệ thống dựa theo luật và các phương pháp suy luận gần đúng hiệu quả Olaru và Wehenkel (2003) đã hiện thực một cây quyết định mờ mới được gọi là cây quyết định mềm Cách tiếp cận này vừa kết hợp việc phát triển cây và tỉa cây, để xác định cấu trúc của cây quyết định mềm, với việc trang bị lại và thích hợp hơn, để cải