Ph¥n lîp nhí quan h» t÷ìng ÷ìng kinh iºn

Một phần của tài liệu Lý thuyết tập mờ và ứng dụng trong phân lớp dữ liệu (Trang 26 - 43)

2 Ph¥n lîp dú li»u düa tr¶n quan h» mí

2.2 Ph¥n lîp nhí quan h» t÷ìng ÷ìng kinh iºn

ành ngh¾a 2.2. Mët quan h» hai ngæi R trong mët tªp hñp X ÷ñc gåi l  mët quan h» t÷ìng ÷ìng n¸u v  ch¿ n¸u quan h» R thäa m¢n c¡c t½nh ch§t sau :

- Ph£n x¤: (∀x ∈ X) xRx.

- èi xùng: (∀x, y ∈ X) xRy → yRx.

- B­c c¦u :(∀x, y, z ∈ X), (xRy∧yRz) → xRz. V½ dö 2.2.

X²t X = {Håc sinh tr÷íng THPT Ba Bº}.

Mët quan h» xRy ⇔ x v  y håc còng lîp. Khi â R l  mët quan h» t÷ìng ÷ìng tr¶n X.

V½ dö 2.3.

Quan h» çng d÷ thao modulo n tr¶n tªp Z c¡c sè nguy¶n l  mët quan h» t÷ìng ÷ìng.

ành ngh¾a 2.3. N¸u R l  quan h» t÷ìng ÷ìng tr¶n S v  a ∈ S, tªp hñp t§t c£ c¡c ph¦n tû b ∈ S n¬m trong quan h» R vîi a ÷ñc gåi l  mët lîp t÷ìng ÷ìng: S = [a] = {b ∈ S/aRb}.

N¸u R l  quan h» t÷ìng ÷ìng tr¶n tªp S th¼ R ph¥n ho¤ch S th nh c¡c lîp t÷ìng ÷ìng Si khæng réng v  ríi nhau, tùc l  S = S1∪S2 ∪...v  vîi måi i 6= j ta câ:

- Si ∩Sj = ∅.

- Vîi méi a, b còng thuëc Si th¼ aRb l  óng. - Vîi méi a ∈ Si v  b ∈ Sj th¼ th¼ aRb l  sai. Sè lîp t÷ìng ÷ìng câ thº væ h¤n.

Ta câ mët sè ành ngh¾a sau:

ành ngh¾a 2.4. Mët quan h» mí R l  quan h» t÷ìng tü (t÷ìng ÷ìng mí) n¸u nâ câ c¡c t½nh ch§t sau:

- Ph£n x¤. - èi xùng.

- B­c c¦u max - min. V½ dö 2.4.

X²t quan h» R cho bði:

R =     1 0,1 0 0,1 0,1 1 0,2 0,3 0 0,2 1 0,8 0,1 0,3 0,8 1     Th¸ th¼ R l  quan h» t÷ìng tü.

ành ngh¾a 2.5. Mët quan h» mí R l  quan h» khæng t÷ìng tü n¸u nâ l  ph¦n bò cõa quan h» t÷ìng tü hay nâ thäa m¢n c¡c t½nh ch§t:

- Ph£n ph£n x¤. - Ph£n èi xùng. - B­c c¦u min - max. V½ dö 2.5.

X²t quan h» R cho bði:

R =     0 0,9 1 0,2 0,1 0 0,3 0,1 0 0,2 0 0,8 0,1 0,3 0,5 0    

Th¸ th¼ R l  quan h» khæng t÷ìng tü.

K½ hi»u dR(u, v) = µR(u, v) khi â chóng ta th§y nâ câ c¡c t½nh ch§t sau: - dR(u, v) ≥ 0.

- dR(u, v) = dR(v, u).

- dR(u, v) = dR(u, w)∨dR(w, u).

Nh÷ vªy dR(u, v) câ t½nh ch§t t÷ìng tü nh÷ kho£ng c¡ch trong khæng gian h¼nh håc v  ÷ñc gåi l  kho£ng c¡ch max - min.

ành ngh¾a 2.6. Mët quan h» mí R l  quan h» gièng nhau n¸u nâ thäa m¢n:

- Ph£n x¤. - èi xùng. V½ dö 2.6.

X²t quan h» R cho bði:

R =     1 0,5 1 0,2 0,5 1 0,3 0,4 0 0,3 1 0,7 0,2 0,4 0,7 1    

Th¸ th¼ R l  quan h» gièng nhau.

ành ngh¾a 2.7. Mët quan h» mí R l  quan h» khæng gièng nhau n¸u nâ l  ph¦n bò cõa quan h» gièng nhau, tùc l :

- Ph£n ph£n x¤ - èi xùng. V½ dö 2.7.

R =   0,5 0 0,3 0,4 0 0,6 0 0,2 0,2 0,4 0,7 0   

Th¸ th¼ R l  quan h» khæng gièng nhau. Nhªn x²t:

- Hñp th nh cõa quan h» t÷ìng tü v  quan h» khæng t÷ìng tü l  mët quan h» khæng t÷ìng tü.

- Hñp th nh cõa quan h» t÷ìng tü v  quan h» gièng nhau l  mët quan h» gièng nhau.

- Hñp th nh cõa quan h» khæng t÷ìng tü v  quan h» khæng gièng nhau l  quan h» khæng gièng nhau.

ành ngh¾a 2.8. Bao âng b­c c¦u R∧ cõa quan h» gièng nhau ÷ñc t½nh theo cæng thùc: R∧ = R1 ∪R2...∪Rk∪

Trong â R2 = R◦R. Vîi µR◦S = max {min{µR(u, v), µR(w, u) : w ∈ U}}.

Rk = Rk−1 ◦R.

Nhªn x²t: Bao âng b­c c¦u R∧ cõa quan h» gièng nhau l  quan h» t÷ìng tü.

ành lþ 2.1. N¸u R l  quan h» t÷ìng tü th¼ tªp mùc α, Rα = {u, v ∈ U :

µR(u, v) ≥ α} cõa R l  quan h» t÷ìng ÷ìng kinh iºn v  do â nâ ph¥n ho¤ch U th nh c¡c lîp t÷ìng ÷ìng.

ành lþ 2.2. * N¸u câ n m  CRn = CRn+1 th¼ CR∧ = CR1∪...∪CRn. *. N¸u U húu h¤n v  |U| = n th¼ CR∧ = CR1 ∪ ...∪CRn.

K½ hi»u R, l  ph¦n bò cõa R, tùc l  R, = CR th¼ R, l  quan h» khæng t÷ìng tü v  R,1−α = {u, v ∈ U : µR(u, v) = dR(u, v) ≤1−α}= Rα. Nâi c¡ch kh¡c kho£ng c¡ch giúa hai ph¦n tû b§t ký trong còng lîp khæng v÷ñt qu¡ 1−α.

Vîi cì sð lþ thuy¸t tr¶n ta câ b i to¡n ùng döng sau.

B i to¡n têng qu¡t: Cho mët tªp c¡c èi t÷ñng bao gçm n èi t÷ñng, méi èi t÷ñng ÷ñc °c tr÷ng bði m thuëc t½nh kh¡c nhau. Y¶u c¦u cõa b i to¡n l  ph¥n lo¤i c¡c èi t÷ñng câ "ë t÷ìng tü" nh÷ nhau v o còng mët lîp theo mët ti¶u chu©n nh§t ành.

Thuªt to¡n mæ t£ nh÷ sau:

Input: Ma trªn câ k½ch th÷îc []n×m, trong â n l  c¡c èi t÷ñng, m l  c¡c thuëc t½nh.

Output: Ph¥n ho¤ch ÷ñc c¡c èi t÷ñng. Thuªt to¡n ph¥n lîp sû döng quan h» mí.

B÷îc 1: X¥y düng quan h» khæng t÷ìng tü giúa c¡c èi t÷ìng mí. - ành ngh¾a kho£ng c¡ch giúa c¡c èi t÷ìng mí.

Gi£ sû A v  B l  hai èi t÷ñng mí b§t ký. Ta ành ngh¾a kho£ng c¡ch giúa A v  B l  kho£ng c¡ch hamming.

d(A,B) = 1

n(|A(u1)−B(u1)|+...+|A(un)−B(un)|) tromg â 0 ≤d(A,B) ≤1.

K½ hi»u dij =d(Ai, Bj) v  lªp quan h» khæng gièng nhau, ð ¥y dij l  kho£ng c¡ch giúa hai èi t÷ìng thù i v  thù j. R = (dij)n×m v  R l  ma trªn kho£ng c¡ch giúa hai èi t÷ñng.

T½nh R∗ = C((CR)∧). ¥y l  quan h» khæng t÷ìng tü m  méi ph¦n tû ch½nh l  kho£ng c¡ch giúa c¡c èi t÷ñng. º t½nh ÷ñc ma trªn khæng t÷ìng tü ta thüc hi»n theo c¡c b÷îc cö thº sau:

+ Tø ma trªn kho£ng c¡ch ta t½nh ma trªn quan h» gièng nhau CR theo cæng thùc µCR = 1−µR.

+ T½nh bao âng b­c c¦u cõa quan h» gièng nhau CR theo cæng thùc

CR∧ = CR1 ∪...∪CRk∪ ....

Trong â CR2 = CR◦CR. Vîi µR◦S = max {min{µR(u, w)∧µR(w, u) :

w ∈ U}}.

tü n¶n º t½nh to¡n ÷ñc quan h» khæng t÷ìng tü R∗ ta ph£i thüc hi»n theo cæng thùc µR∗ = 1−µCR.

B÷îc 2: Ta th§y R∗α = {i, j : dR(i, j)} l  quan h» t÷ìng ÷ìng kinh iºn v  nâ x¡c ành mët ph¥n ho¤ch mùc α tr¶n c¡c èi t÷ñng. Nh÷ vªy c¡c èi t÷ñng trong còng mët ph¥n ho¤ch câ kho£ng c¡ch (mùc t÷ìng tü ≤ α, hay mùc ë t÷ìng tü ≥1−α) khæng v÷ñt qu¡ α.

V½ dö 2.8.

º minh håa thuªt to¡n ta câ b i to¡n ùng döng sau: Cho b£ng iºm cõa 5 håc sinh vîi iºm c¡c mæn håc t÷ìng ùng nh÷ sau (iºm tøng mæn hiºu l  x/10)

Vîi sè li»u tr¶n ta t½nh ÷ñc:

SV V«n To¡n àa Sû Lþ Sinh Hâa Ngo¤i Ngú

A1 0,5 0,8 0,7 0,6 0,9 0,6 0,9 0,9

A2 1 0,6 0,8 0,7 0,6 0,8 0,6 0,8

A3 0,8 0,7 0,9 0,8 0,6 0,9 0,8 0,7

A4 0,7 0,9 0,6 0,7 0,8 0,9 0,6 0,6

A5 0,8 0,6 0,9 0,8 0,7 0,7 0,7 0,8 B£ng 2.1: B£ng iºm cu£ 5 håc sinh

d11 = 1 8(|0,5 - 0,5| + |0,8 - 0,8| + ...+|0,9 -0,9|) = 0 d12 = 1 8(|0,5 - 1| + |0,8 - 0,6| + |0,7 - 0.8| + |0,6 - 0,7| + | 0,9 - 0,6| + |0,6 - 0,8| + |0,9 - 0,6| + |0,9 - 0,8|) = 0,22 T÷ìng tü nh÷ tr¶n ta t½nh ÷ñc ma trªn R R =       0,00 0,22 0,21 0,18 0,18 0,22 0,00 0,11 0,16 0,08 0,21 0,11 0,00 0,13 0,07 0,18 0,16 0,13 0,00 0,17 0,18 0,08 0,07 0,13 0,00      

Khi â: (CR) =       1,00 0,78 0,79 0,82 0,82 0,78 1,00 0,89 0,84 0,92 0,79 0,89 1,00 0,87 0,93 0,82 0,84 0,87 1,00 0,83 0,82 0,92 0,93 0,87 1,00       CR∧ =       1,00 0,82 0,82 0,82 0,82 0,82 1,00 0,91 0,86 0,91 0,82 0,91 1,00 0,86 0,92 0,82 0,86 0,86 1,00 0,86 0,82 0,91 0,92 0,86 1,00       R∗ =       0,00 0,19 0,19 0,19 0,19 0,19 0,00 0,09 0,14 0,09 0,19 0,09 0,00 0,16 0,08 0,19 0,14 0,14 0,00 0,14 0,19 0,09 0,08 0,14 0,00       Ta câ mët sè nhªn x²t sau:

- Vîi α ð ng÷ïng d ≤ 0,19 th¼ 5 sinh vi¶n câ iºm trung b¼nh c¡c mæn håc t÷ìng ÷ìng nhau.

- Vîi α ð ng÷ïng d ≤ 0,14 th¼ ph¥n ho¤ch 5 sinh vi¶n th nh 2 lîp t÷ìng ÷ìng nhau:

+ Lîp thù nh§t gçm câ 1 sinh vi¶n {A1}.

+ Lîp thù hai gçm câ 4 sinh vi¶n {A2, A3, A4, A5}.

- Vîi α ð ng÷ïng d ≤ 0,09 th¼ ph¥n ho¤ch 5 sinh vi¶n th nh 2 lîp t÷ìng ÷ìng nhau:

+ Lîp thù nh§t gçm câ 1 sinh vi¶n {A1}.

+ Lîp thù hai gçm câ 3 sinh vi¶n {A2, A3, A5}. + Lîp thù ba gçm câ 1 sinh vi¶n {A4}.

+Lîp thù nh§t gçm câ 1 sinh vi¶n {A1}.

+ Lîp thù hai gçm câ 3 sinh vi¶n {A2, A3, A5}. + Lîp thù ba gçm câ 1 sinh vi¶n {A4}.

- Vîi α ð ng÷ïng d ≤ 0,08 th¼ ph¥n ho¤ch 5 sinh vi¶n th nh 4 lîp t÷ìng ÷ìng nhau:

+ Lîp thù nh§t gçm câ 1 sinh vi¶n {A1}. + Lîp thù hai gçm câ 1 sinh vi¶n {A2}. + Lîp thù ba gçm câ 2 sinh vi¶n {A3, A5}. + Lîp thù t÷ gçm câ 1 sinh vi¶n {A4}.

- Vîi α ð ng÷ïng d ≤ 0,08 th¼ ph¥n ho¤ch 5 sinh vi¶n th nh 4 lîp t÷ìng ÷ìng nhau:

+ Lîp thù nh§t gçm câ 1 sinh vi¶n {A1}. + Lîp thù hai gçm câ 1 sinh vi¶n {A2}. + Lîp thù ba gçm câ 1 sinh vi¶n {A3}. + Lîp thù t÷ gçm câ 1 sinh vi¶n {A4}. + Lîp thù n«m gçm câ 1 sinh vi¶n {A5}. 2.4 Mët sè b i to¡n

B i to¡n 2.1. T¤i mët khu thuëc thà tr§n X º ¡nh gi¡ mùc thu nhªp cõa c¡c hë ngh±o trong khu, l¢nh ¤o thà tr§n y¶u c¦u c¡n bë thèng k¶ xem trong tøng th¡ng nhúng gia ¼nh thuëc hë ngh±o thu nhªp b¼nh qu¥n tr¶n ¦u ng÷íi l  bao nhi¶u?

Thuªt to¡n mæ t£ nh÷ sau:

Input: B£ng dú li»u câ k½ch th÷îc []8×12, trong â câ 8 èi t÷ñng thuëc hë ngh±o, 12 l  c¡c th¡ng trong n«m.

Output: Ph¥n ho¤ch ÷ñc c¡c èi t÷ñng.

(mùc thu nhªp cõa tøng hë ÷ñc ¡nh gi¡ x/1000000). H T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12 H1 0,1 0,1 0,2 0,3 0,2 0,3 0,4 0,2 0,3 0,3 0,4 0,4 H2 0,2 0,1 0,3 0,2 0,2 0,3 0,3 0,4 0,4 0,3 0,5 0,4 H3 0,0 0,1 0,1 0,2 0,2 0,3 0,2 0,4 0,2 0,4 0,5 0,5 H4 0,0 0,0 0,2 0,1 0,3 0,0 0,4 0,4 0,2 0,6 0,3 0,2 H5 0,2 0,0 0,1 0,3 0,2 0,2 0,1 0,3 0,4 0,3 0,4 0,5 H6 0,0 0,0 0,2 0,0 0,3 0,1 0,4 0,3 0,2 0,3 0,5 0,5 H7 0,1 0,1 0,2 0,0 0,3 0,1 0,4 0,3 0,2 0,3 0,5 0,5 H8 0,0 0,2 0,2 0,1 0,0 0,3 0,5 0,2 0,1 0,5 0,4 0,5

B£ng 2.2: B£ng thu nhªp b¼nh qu¥n cõa 8 hë gia ¼nh Vîi sè li»u thèng k¶ tr¶n ta t½nh ÷ñc ma trªn R R =             0,00 0,06 0,09 0,14 0,08 0,07 0,1 0,1 0,06 0,00 0,07 0,16 0,08 0,09 0,1 0,15 0,09 0,07 0,00 0,13 0,09 0,1 0,09 0,1 0,14 0,15 0,13 0,00 0,17 0,11 0,1 0,14 0,08 0,08 0,09 0,17 0,00 0,1 0,11 0,16 0,07 0,09 0,1 0,07 0,1 0,00 0,14 0,09 0,07 0,1 0,09 0,1 0,11 0,14 0,00 0,11 0,1 0,15 0,1 0,14 0,16 0,09 0,11 0,00             CR =             1,00 0,94 0,91 0,86 0,92 0,93 0,9 0,9 0,94 1,00 0,93 0,84 0,92 0,91 0,9 0,85 0,91 0,93 1,00 0,87 0,91 0,9 0,91 0,9 0,86 0,85 0,87 1,00 0,83 0,89 0,9 0,86 0,92 0,92 0,91 0,83 1,00 0,9 0,89 0,84 0,93 0,91 0,9 0,93 0,9 1,00 0,86 0,91 0,93 0,9 0,91 0,9 0,89 0,86 1,00 0,89 0,9 0,85 0,9 0,86 0,84 0,91 0,89 1,00            

CR∧ =             1,00 0,94 0,91 0,93 0,92 0,93 0,91 0,91 0,94 1,00 0,93 0,9 0,92 0,93 0,91 0,91 0,93 0,93 1,00 0,9 0,92 0,91 0,91 0,9 0,9 0,9 0,9 1,00 0,89 0,9 0,9 0,89 0,92 0,92 0,92 0,9 1,00 0,92 0,9 0,9 0,93 0,93 0,91 0,93 0,92 1,00 0,9 0,91 0,93 0,93 0,91 0,9 0,92 0,93 1,00 0,9 0,91 0,91 0,9 0,9 0,9 0,91 0,9 1,00             R∗ =             0,00 0,06 0,09 0,07 0,08 0,07 0,09 0,09 0,06 0,00 0,07 0,11 0,08 0,07 0,09 0,09 0,07 0,07 0,00 0,1 0,08 0,09 0,09 0,1 0,1 0,1 0,1 0,00 0,11 0,1 0,1 0,11 0,08 0,08 0,08 0,1 0,00 0,08 0,1 0,1 0,07 0,07 0,09 0,07 0,08 0,00 0,1 0,1 0,07 0,07 0,09 0,1 0,08 0,07 0,00 0,1 0,09 0,09 0,1 0,1 0,1 0,09 0,1 0,00             Ta câ mët sè nhªn x²t sau:

- Vîi α ð ng÷ïng d≤ 0,06 th¼ ph¥n ho¤ch 8 hë gia ¼nh th nh 4 lîp t÷ìng ÷ìng nhau.

+Lîp thù nh§t gçm 2 hë gia ¼nh {H1, H2}. + Lîp thù hai gçm 2 hë gia ¼nh {H4, H6}. + Lîp thù ba gçm 1 hë gia ¼nh {H5}.

+ Lîp thù t÷ gçm 3 hë gia ¼nh {H3, H7, H8}.

- Vîi α ð ng÷ïng d≤ 0,07 th¼ ph¥n ho¤ch 8 hë gia ¼nh th nh 4 lîp t÷ìng ÷ìng nhau.

+ Lîp thù nh§t gçm 4 hë gia ¼nh {H1, H2, H3, H6}. + Lîp thù hai gçm 2 hë gia ¼nh {H7, H8}.

+ Lîp thù ba gçm 1 hë gia ¼nh {H5}. + Lîp thù t÷ gçm 1 hë gia ¼nh {H4}.

֓ng nhau.

+ Lîp thù nh§t gçm 4 hë gia ¼nh {H1, H2, H3, H5}. + Lîp thù hai gçm 2 hë gia ¼nh {H6, H7}.

+ Lîp thù ba gçm 2 hë gia ¼nh {H4, H8}.

- Vîi α ð ng÷ïng d≤ 0,11 th¼ 8 hë gia ¼nh câ mùc thu nhªp b¼nh qu¥n ¦u ng÷íi/th¡ng t÷ìng ÷ìng nhau.

- Vîi α ð ng÷ïng d≤ 0,1 th¼ 8 hë gia ¼nh câ mùc thu nhªp b¼nh qu¥n ¦u ng÷íi/th¡ng t÷ìng ÷ìng nhau.

- Vîi α ð ng÷ïng d≤ 0,07 th¼ ph¥n ho¤ch 8 hë gia ¼nh th nh 4 lîp t÷ìng ÷ìng nhau.

Một phần của tài liệu Lý thuyết tập mờ và ứng dụng trong phân lớp dữ liệu (Trang 26 - 43)

Tải bản đầy đủ (PDF)

(43 trang)