Một bảng quyết định đơn giản

Một phần của tài liệu (LUẬN văn THẠC sĩ) ứng dụng tập thô vào tìm kiếm web (Trang 43 - 53)

Một lần nữa ta thấy rằng, cỏc cặp đối tượng x3, x4 và x5, x7 vẫn cú giỏ trị như nhau tại hai thuộc tớnh điều kiện, nhưng cặp thứ nhất {x3, x4}thỡ cú giỏ trị kết xuất khỏc nhau (tức giỏ trị tại thuộc tớnh quyết định khỏc nhau), trong khi đú cặp thứ hai {x5, x7} thỡ bằng nhau tại thuộc tớnh quyết định.

Từ bảng trờn cú thể rỳt ra được một luật: “Nếu Age là 16-30 và LEMS là 50 thỡ Walk là Yes”. Tớnh tối thiểu của cỏc thuộc tớnh điều kiện trong tập cỏc luật cú được từ hệ quyết định là một trong những vấn đề rất quan trọng.

4.3. Quan hệ bất khả phõn biệt

Một hệ quyết định (hay một bảng quyết định) thể hiện tri thức về cỏc đối tượng trong thực tiễn. Tuy nhiờn trong nhiều trường hợp bảng này cú thể được thu gọn lại vỡ cỏc lý do sau:

 Nhiều đối tượng giống nhau, hay khụng thể phõn biệt với nhau lại được thể hiện lặp lại nhiều lần.

 Khi bỏ đi một số thuộc tớnh thỡ thụng tin do bảng quyết định cung cấp mà chỳng ta quan tõm sẽ khụng bị mất mỏt. Những thuộc tớnh như vậy

được coi là cỏc thuộc tớnh thừa.

4.3.1. Quan hệ tương đương - Lớp tương đương

Một quan hệ hai ngụi RX x Xđược gọi là quan hệ tương đương khi và chỉ khi :

 R là quan hệ phản xạ: xRx, x  X

 R là quan hệ đối xứng: xRy  yRx, x,y  X

R là quan hệ bắc cầu: xRy và yRz  xRz, x, y, zX

Lớp tương đương của một đối tượng x là tập tất cả cỏc đối tượng y  X mà xRy.

Chỳng ta xột hệ thụng tin A = (U, A). Khi đú mỗi tập thuộc tớnh B

đều tạo ra tương ứng một quan hệ tương đương IND A(B)

IND A (B ) = {(x, x ' ) U2 | a B, a (x) a (x ' )}

INDA (B) được gọi là quan hệ B -bất khả phõn biệt. Nếu (x, x') INDA(B) thỡ cỏc đối tượng x và x' là khụng thể phõn biệt được với nhau qua tập thuộc tớnh B. Lớp tương đương của x trong quan hệ IND A(B) được kớ hiệu bởi [x]B. Nếu khụng bị nhầm lẫn ta viết IND(B) thay cho INDA(B)

Vớ dụ 4-4 : Trong vớ dụ này chỳng ta sẽ xem xột cỏc quan hệ bất khả phõn

biệt được định nghĩa trong Bảng 4-2

Chẳng hạn, xột tại thuộc tớnh {LEMS}, cỏc đối tượng x3, x4 cú cựng giỏ trị 1−25 nờn thuộc cựng lớp tương đương định bởi quan hệ IND({LEMS}), hay chỳng bất khả phõn biệt qua tập thuộc tớnh {LEMS}. Tương tự như vậy là ba đối tượng x5, x6 và x7 cựng thuộc vào một lớp tương đương định bởi quan hệ IND({LEMS})

Quan hệ IND định ra ba phõn hoạch sau của tập cỏc đối tượng trong vũ trụ: IND({Age}) = {{x1, x2, x6},{x3, x4}, {x5, x7}}

IND({LEMS}) = {{x1},{x2},{x3, x4},{x5, x6 , x7}}

IND({Age, LEMS}) = {{x1},{x2},{x3, x4},{x5, x7 },{x6}}

4.4. Xấp xỉ tập hợp

Một quan hệ tương đương cho ta một sự phõn hoạch cỏc đối tượng của tập vũ trụ. Cỏc lớp tương đương này cú thể được sử dụng để tạo nờn cỏc tập con của tập vũ trụ. Cỏc tập con này thường chứa cỏc đối tượng cú giỏ trị giống nhau tại tập cỏc thuộc tớnh quyết định.

Tuy vậy khụng phải khỏi niệm nào cũng cú thể định nghĩa một cỏch rừ ràng như vậy. Chẳng hạn như khỏi niệm Walk trong bảng quyết định 4-2, khỏi niệm này khụng thể định nghĩa rừ ràng qua 2 thuộc tớnh điều kiện Age và LEMS: hai đối tượng x3 và x4 thuộc cựng một lớp tương đương tạo bởi 2 thuộc tớnh điều kiện nhưng lại cú giỏ trị khỏc nhau tại thuộc tớnh Walk, vỡ vậy nếu một đối tượng nào đú cú (Age,LEMS) (31-45,1-25) thỡ ta vẫn khụng thể biết chắc chắn giỏ trị của nú tại thuộc tớnh Walk. Trong những trường hợp như vậy người ta sẽ sử dụng khỏi niệm tập thụ.

Mặc dự khụng thể mụ tả khỏi niệm Walk một cỏch rừ ràng nhưng căn cứ vào tập thuộc tớnh {Age, LEMS} ta vẫn cú thể chỉ ra được chắc chắn:

 Một số đối tượng cú Walk Yes

 Một số đối tượng cú WalkNo

 Cũn lại là cỏc đối tượng thuộc về tập biờn của 2 giỏ trị YesNo. Tập cỏc đối tượng cú tập biờn khỏc rỗng được gọi là tập thụ.

Cho hệ thụng tin A = (U, A), tập thuộc tớnh BA , tập đối tượng XU  Chỳng ta cú thể xấp xỉ tập hợp X bằng cỏch chỉ sử dụng cỏc thuộc tớnh trong

B từ việc xõy dựng cỏc tập hợp B-xấp xỉ dướiB -xấp xỉ trờn được định nghĩa như sau:

B - xấp xỉ dưới của tập X : BX = {x | [x]B X}  B -xấp xỉ trờn của tập X : BX{x | [x]B X }

Tập hợp BX là tập cỏc đối tượng trong U mà sử dụng cỏc thuộc tớnh trong

B ta cú thể biết chắc chắn được chỳng là cỏc phần tử của X.

Tập hợp BX là tập cỏc đối tượng trong U mà sử dụng cỏc thuộc tớnh trong B

ta chỉ cú thể núi rằng chỳng cú thể là cỏc phần tử của X.

Tập hợp BNB(X) BX-BX được gọi là B -biờn của tập X và chứa những đối tượng mà sử dụng cỏc thuộc tớnh của B ta khụng thể xỏc định được chỳng cú thuộc tập X hay khụng.

Tập hợp U -BX được gọi là B -ngoài của tập X, gồm những đối tượng mà sử dụng tập thuộc tớnh B ta biết chắc chắn chỳng khụng thuộc tập X.

Một tập hợp được gọi là thụ nếu đường biờn của nú là khụng rỗng, ngược lại ta núi tập này là rừ.

Vớ dụ 4-6: Trong đa số trường hợp, người ta luụn muốn hỡnh thành cỏc định

nghĩa của cỏc lớp quyết định từ cỏc thuộc tớnh điều kiện. Xột bảng 4-2 ở trờn với tập đối tượng W {x|Walk(x)= Yes} = {x1, x4, x6} và tập thuộc tớnh B{Age, LEMS}. Khi đú ta nhận được cỏc vựng xấp xỉ sau đõy của W thụng qua B:

W

BNB(W) = {x3, x4}, U-BW= {x2, x5, x7}

Hỡnh 4-2. Xấp xỉ tập đối tượng trong Bảng 4-2 bằng cỏc thuộc tớnh điều kiện Age và LEMS. Mỗi vựng được thể hiện kốm theo tập cỏc lớp tương đương tương ứng.

Một số tớnh chất của cỏc tập hợp xấp xỉ 1. B X( ) XB X( ) 2. B( )   B( ) , B U( ) U B U( ) 3. B X( Y)B X( )B Y( ) 4. B X( Y)B X( )B Y( ) 5. Nếu XY thỡ B( )XB Y B X( ), ( ) B Y( ) 6. B X( Y) B X( )B Y( ) 7. B X( Y)B X( )B Y( ) 8. B U( X) U B X( ) 9. B U( X) U B X( ) 10. B B X( ( )B B X( ( ))B X( ) 11. B B X( ( ) B B X( ( )) B X( )

Dựa vào ý nghĩa của cỏc xấp xỉ trờn và xấp xỉ dưới, người ta định nghĩa bốn lớp cơ bản của cỏc tập thụ, hay bốn thể loại mơ hồ (vagueness):

a, X được gọi là B - định nghĩa được một cỏch thụ (roughly B -definable)

b, X được gọi là B - khụng định nghĩa được một cỏch nội vi (internally B undefinable) nếu và chỉ nếu B(X) =  và B(X) ≠ U

c, X được gọi là B -khụng định nghĩa được một cỏch ngoại vi (externally B undefinable) nếu và chỉ nếu B(X) ≠  và B(X) = U

d, X được gọi là B -khụng định nghĩa được một cỏch hoàn toàn (totally B undefinable) nếu và chỉ nếu B(X) =  và B(X) = U

Cú thể diễn tả lại cỏc khỏi niệm trờn như sau:

 X là B -định nghĩa được một cỏch thụ nghĩa là: Nhờ sử dụng tập thuộc tớnh B ta cú thể chỉ ra một số đối tượng của U thuộc về tập X và một số đối tượng của U thuộc về U -X.

 X là B -khụng định nghĩa được một cỏch nội vi nghĩa là: sử dụng tập thuộc tớnh B ta cú thể chỉ ra một số đối tượng của U thuộc về U - X, nhưng lại khụng thể chỉ ra được cỏc đối tượng thuộc về X.

 X là B - khụng định nghĩa được một cỏch ngoại vi nghĩa là : sử dụng tập thuộc tớnh B ta cú thể chỉ ra một số đối tượng của U thuộc về X, nhưng khụng chỉ ra được cỏc đối tượng thuộc về U-X

 X là B - khụng định nghĩa được một cỏch hoàn toàn nghĩa là: sử dụng tập thuộc tớnh B ta khụng thể chỉ ra bất kỳ đối tượng nào của U thuộc về X hay thuộc về U -X

| ( ) | ( ) | ( ) | B B X X B X  

được gọi là độ chớnh xỏc của xấp xỉ, trong đú |X| chỉ số phần tử của tập X≠. Rừ ràng 0 B X 1 . Nếu B X 1 thỡ X là rừ (chớnh xỏc) đối với tập thuộc tớnh B. Ngược lại, nếu B X 1 thỡ X là thụ (mơ hồ) đối với tập thuộc tớnh B.

Dưới đõy là cỏc thuật toỏn xỏc định cỏc xấp xỉ trờn và xấp xỉ dưới của một tập đối tượng theo một tập thuộc tớnh cho trước.

Thuật toỏn xỏc định xấp xỉ dưới Input:  Tập cỏc đối tượng X  Tập cỏc thuộc tớnh B Output:  Tập cỏc đối tượng X Thuật toỏn : Bước 1: Khởi tạo BX = 

Xỏc định tập cỏc phõn hoạch P của tập vũ trụ U tạo bởi B. Bước 2: U1 = U If (U1≠){ Thực hiện bước 3. } else{ Thực hiện bước 4 } Bước 3: Xột x  U1

Tỡm phõn hoạch Pi  P sao cho: x Pi If (Pi  X){

BX = BX  Pi }

U1 = U1 - Pi. Quay lại bước 2.

Thuật toỏn xỏc định xấp xỉ trờn Input :  Tập cỏc đối tượng X  Tập cỏc thuộc tớnh B Output:  Tập cỏc đối tượng X Thuật toỏn: Bước 1: Khởi tạo B X( )

Xỏc định tập cỏc phõn hoạch P của tập vũ trụ U tạo bởi B.

Bước 2: X1 = X If (X1 ){ Thực hiện bước 3. Else { Thực hiện bước 4 } Bước 3: Xột x  X1.

Tỡm phõn hoạch Pi  P sao cho : x  Pi.

i

BX BX P 

For (p  Pi X1){ X1 = X1 - {p} }

Quay lại bước 2.

Bước 4: Kết thỳc.

Trong lý thuyết tập hợp cổ điển, một phần tử hoặc là thuộc vào tập hợp hoặc khụng. Như vậy hàm thuộc tương ứng là một hàm đặc trưng cho tập hợp, và chỉ trả về hai giỏ trị 1 hoặc 0 tương ứng.

Đối với lý thuyết tập thụ, hàm thuộc thụXBlà khỏi niệm dựng để đo mức

độ thuộc của đối tượng x trong tập vũ trụ U vào tập cỏc đối tượng XU, và được

tớnh bởi mức độ giao nhau giữa tập X và lớp tương đương [x]B mà đối tượng x thuộc về. Một cỏch hỡnh thức, ta cú: : [0,1] B X U   | [ ] | | [ ] |   B B X B x X M x x

Từ định nghĩa hàm thuộc thụ, hai khỏi niệm xấp xỉ trờn và xấp xỉ dưới cú thể được xõy dựng một cỏch tổng quỏt tương ứng với một độ rừ bất kỳ ( ,1]1

2  như sau: {x| >= } {x| >1- } B X B X B X B X        

Lưu ý rằng hai khỏi niệm xấp xỉ trờn và xấp xỉ dưới mà ta đó xõy dựng trong phần 4.4 tương ứng với  = 1.0.

Vớ dụ 4-8: Xột bảng quyết định dưới đõy

A0 A1 A2 A3

X0 1 A 2 34

X1 2 A 3 23

X3 1 B 2 12

X4 3 B 1 32

X5 1 B 4 12

Một phần của tài liệu (LUẬN văn THẠC sĩ) ứng dụng tập thô vào tìm kiếm web (Trang 43 - 53)

Tải bản đầy đủ (PDF)

(89 trang)