M t ví d biu d in các it ng hình hc b%ng frame
2. Xây d & ng cây nh danh
Xét ví d xây d ng các quy lu t có th k t lu n m t ng i nh th nào khi i
t(m bi n thì b cháy n(ng. Ta g i tính ch t cháy n(ng hay không cháy n(ng là thu c tính
quan tâm (thu c tính m&c tiêu). Nh v y, trong tr ng h p này, t p R c a chúng ta ch+ g m có hai ph&n t {"cháy n'ng", "bình th ng"}. Còn t p P là t t c nh ng ng i
c li t kê trong b ng d #i (8 ng i) Chúng ta quan sát hi n t ng cháy n(ng d a trên
4 thu c tính sau : chi u cao (cao, trung bình, th p), màu tóc (vàng, nâu, ) cân n(ng (nh,, TB, n(ng), dùng kem (có, không),. Ta g i các thu c tính này g i là thu c tính d n xu t.
F_ U 2 4 ? 3 ; ; B >? 7 P7.9 ;
6 P2 M Y B / e I U! / A 2. h
K `;Z O <; 7 + +. ` 2 ; Q8 )2.!
Tên Tóc Ch.Cao Cân
N ng
Dùng kem?
K t qu
Sarah Vàng T.Bình Nh* Không Cháy
Dana Vàng Cao T.Bình Có Không
Alex Nâu Th p T.Bình Có Không
Annie Vàng Th p T.Bình Không Cháy Emilie / T.Bình N"ng Không Cháy Peter Nâu Cao N"ng Không Không John Nâu T.Bình N"ng Không Không
Kartie Vàng Th p Nh* Có Không
Ý t ng &u tiên c a ph 'ng pháp này là tìm cách phân ho ch t p P ban &u thành các t p Pi sao cho t t c các ph&n t trong t t c các t p Pi u có chung thu c tính m c tiêu.
∀ ∀ ∀
∀ i, j; ∀∀∀∀ k, l : pk∈∈∈∈ Pi và pl∈∈∈∈ Pj thì f(pk) = f(pl)
Sau khi ã phân ho ch xong t p P thành t p các phân ho ch Pi c "c tr ng b i thu c tính ích ri (ri∈∈∈∈R), b #c ti p theo là ng v#i m1i phân ho ch Pi ta xây d ng lu t
Li : GTi→→→→ ri
trong ó các GTi là m nh c hình thành b ng cách k t h p các thu c tính d-n xu t. V n hình th c có th làm ta c m th y khó kh n. Chúng ta hãy th ý t ng trên v#i b ng s li u mà ta ã có.
Có hai cách phân ho ch hi n nhiên nh t mà ai c%ng có th ngh ra. Cách &u tiên là
cho m i ng i vào m t phân ho ch riêng (P1 = {Sarah}, P2 = {Dana}, … t)ng c ng s3 có 8 phân ho ch cho 8 ng i). Cách th hai là phân ho ch thành hai t p, m t t p g m t t c
nh ng ng i cháy n!ng và t p còn l i bao g m t t c nh ng ng i không cháy n!ng. Tuy
'n gi n nh ng phân ho ch theo ki u này thì chúng ta ch,ng gi i quy t c gì !!
2.1. (âm ch i
Chúng ta hãy th m t ph 'ng pháp khác. Bây gi b n hãy quan sát thu c tính &u tiên – màu tóc. N u d a theo màu tóc phân chia ta s3 có c 3 phân ho ch khác nhau
ng v#i m1i giá tr c a thu c tính màu tóc. C th là : Pvàng = { Sarah, Dana, Annie, Kartie }
Pnâu= { Alex, Peter, John } P = { Emmile }
* Các ng i b cháy n!ng c g ch d i và in m.
Thay vì li t kê ra nh trên, ta dùng s' cây ti n mô t cho các b #c phân ho ch sau :
Quan sát hình trên ta th y r ng phân ho ch Pnâu và P th a mãn c i u ki n
"có chung thu c tính m&c tiêu" (Pnâuch a toàn ng i không cháy n(ng, P ch a toàn ng i cháy n(ng).
Còn l i t p Pvàng là còn l-n l n ng i cháy n ng và không cháy n(ng. Ta s3 ti p t c phân ho ch t p này thành các t p con. Bây gi ta hãy quan sát thu c tính chi u cao. Thu c tính này giúp phân ho ch t p Pvàng thành 3 t p con : PVàng, Th p = {Annie,
N u n i ti p vào cây hình tr #c ta s3 có hình nh cây phân ho ch nh sau :
Quá trình này c th ti p t c cho n khi t t c các nút lá c a cây không còn l-n l n gi a cháy n(ng và không cháy n(ng n a. B n c%ng th y r ng, qua m1i b #c phân ho ch cây phân ho ch ngày càng "phình" ra. Chính vì v y mà quá trình này c g i là quá trình " âm ch i". Cây mà chúng ta ang xây d ng c g i là cây nh danh.
/ n ây, chúng ta l i g"p m t v n m#i. N u nh ban &u ta không ch n thu c tính màu tóc phân ho ch mà ch n thu c tính khác nh chi u cao ch,ng h n phân ho ch thì sao? Cu i cùng thì cách phân ho ch nào s3 t t h'n?
2.2. Ph ng án ch n thu c tính phân ho ch
V n mà chúng ta g"p ph i c%ng t 'ng t nh bài toán tìm ki m : "/ ng tr #c m t ngã r3, ta c&n ph i i vào h #ng nào?". Hai ph 'ng pháp ánh giá d #i ây s3 giúp ta ch n c thu c tính phân ho ch t i m1i b #c xây d ng cây nh danh.
a. Quinlan
Quinlan quy t nh thu c tính phân ho ch b ng cách xây d ng các vector (c tr ng
cho m1i giá tr c a t.ng thu c tính d-n xu t và thu c tính m c tiêu. Cách tính c th nh sau :
V#i m1i thu c tính d-n xu t A còn có th s% d&ng phân ho ch, tính :
V(Aj) = ( T(j, r1), T(j, r2) , …, T(j, rn) ) "i9 (j g :8 8d H 3 + = B / e I E 2i 3 + = B / U 2 ( g :8 8 d H 3 + = B / e I E 2i( a 3k9l9m 9 2 + + =<; B / U a
Nh v y n u m t thu c tính A có th nh n m t trong 5 giá tr khác nhau thì nó s3 có 5 vector "c tr ng.
M t vector V(Aj ) c g i là vector 'n v n u nó ch+ có duy nh t m t thành ph&n có giá tr 1 và nh ng thành ph&n khác có giá tr 0.
Thu c tính c ch n phân ho ch là thu c tính có nhi u vector 'n v nh t. Tr l i ví d c a chúng ta, tr ng thái ban &u (ch a phân ho ch) chúng ta s3 tính vector "c tr ng cho t.ng thu c tính d-n xu t tìm ra thu c tính dùng phân ho ch. /&u tiên là thu c tính màu tóc. Thu c tính màu tóc có 3 giá tr khác nhau (vàng, , nâu) nên s3 có 3 vector "c tr ng t 'ng ng là :
VTóc(vàng) = ( T(vàng, cháy n(ng), T(vàng, không cháy n(ng) ) S ng i tóc vàng là : 4 S ng i tóc vàng và cháy n(ng là : 2 S ng i tóc vàng và không cháy n(ng là : 2 Do ó VTóc(vàng) = (2/4 , 2/4) = (0.5, 0.5) T 'ng t VTóc(nâu) = (0/3, 3/3) = (0,1) (vector 'n v ) S ng i tóc nâu là : 3 S ng i tóc nâu và cháy n(ng là : 0
S ng i tóc nâu và không cháy n(ng là : 3
VTóc( ) = (1/1, 0/1) = (1,0) (vector 'n v ) T)ng s vector 'n v c a thu c tính tóc vàng là 2 Các thu c tính khác c tính t 'ng t , k t qu nh sau : VC.Cao(Cao) = (0/2,2/2) = (0,1) VC.Cao(T.B) = (2/3,1/3) VC.Cao(Th p) = (1/3,2/3) VC.N"ng (Nh*) = (1/2,1/2) VC.N"ng (T.B) = (1/3,2/3) VC.N"ng (N"ng) = (1/3,2/3) VKem (Có) = (3/3,0/3) = (1,0) VKem(Không) = (3/5,2/5)
Nh v y thu c tính màu tóc có s vector 'n v nhi u nh t nên s3 c ch n phân ho ch.
Sau khi phân ho ch theo màu tóc xong, ch+ có phân ho ch theo tóc vàng (Pvàng) là còn ch a nh ng ng i cháy n(ng và không cháy n(ng nên ta s3 ti p t c phân ho ch t p này. Ta s3 th c hi n thao tác tính vector "c tr ng t 'ng t i v#i các thu c tính còn l i
(chi u cao, cân n(ng, dùng kem). Trong phân ho ch Pvàng, t p d li u c a chúng ta còn
l i là :
Tên Ch.Cao Cân
N ng
Dùng kem?
K t qu qu
Sarah T.Bình Nh* Không Cháy Dana Cao T.Bình Có Không Annie Th p T.Bình Không Cháy Kartie Th p Nh* Có Không VC.Cao(Cao) = (0/1,1/1) = (0,1) VC.Cao(T.B) = (1/1,0/1) = (1,0) VC.Cao(Th p) = (1/2,1/2) VC.N"ng (Nh*) = (1/2,1/2) VC.N"ng (T.B) = (1/2,1/2) VC.N"ng (N"ng) = (0,0) VKem (Có) = (0/2,2/2) = (0,1) VKem(Không) = (2/2,0/2) = (1,0)
2 thu c tính dùmg kem và chi u cao u có 2 vector 'n v . Tuy nhiên, s phân ho ch c a thu c tính dùng kem là ít h'n nên ta ch n phân ho ch theo thu c tính dùng kem. Cây nh danh cu i cùng c a chúng ta s3 nh sau :