Ma trận phõn biệt và hàm phõn biệt

Một phần của tài liệu quy nạp quy tắc phân lớp sử dụng lý thuyết tập thô (Trang 47 - 50)

Phần trờn cung cấp cỏc khỏi niệm về rỳt gọn thuộc tớnh trong một hệ thụng tin, tuy nhiờn chỳng chưa thực sự rừ nột và trực quan. Trong phần này cỳng ta sẽ thấy được bản chất của một rỳt gọn của một tập thuộc tớnh, và đõy là cơ sở để hiểu được cỏc thuật toỏn tỡm rỳt gọn trong một hệ thụng tin.

Xột hệ thụng tin A= (U,A) n đối tượng. Ma trõn phõn biệt của A là ma trận đối xứng kớch thước nxn cú cỏc phần tử cij được cho như sau:

cij= {a A|a(xi) a(xj)} với I,j = 1,2,…,n

Như vậy mỗi phần tử cij của ma trận phõn biệt là tập hơp cỏc thuộc tớnh để phõn biệt hai đối tượng xixj.

Vớ dụ 1-12: Xột một hệ thụng tin đơn giản trong Bảng 2.7 với 3 thuộc tớnh và 4 đối tượng. Phần tử tại dũng 1 cột 3 cũng như phần tử tại dũng 3 cột 1 lf tập thuộc tớnh {a,c} núi lờn rằng hai đối tượng x1x3 nhận giỏ trị khỏc nhau tại hai thuộc tớnh ac.

Bảng 2.7: Hệ thụng tin dựng minh họa ma trận phõn biệt

a b c

x1 1 0 1

x2 1 1 2

x3 0 0 2

x4 1 0 1

Hệ thụng tin trờn sẽ cú ma trận kớch thước 4x4 như sau:

x1 x2 x3 x4

x1 {} {b,c} {a,c} {} x2 {b,c} {} {a,b} {b,c} x3 {a,c} {a,b} {} {a,c} x4 {} {b,c} {a,c} {}

Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn http://www.lrc-tnu.edu.vn/

Ma trận phõn biệt khụng chỉ được định nghĩa trờn tập tất cả cỏc thuộc tớnh của hệ thụng tin mà cũn cú thể được xõy dựng trờn tập thuộc tớnh B A

bất kỳ. Trong trường hợp đú, phần tử cij là tập cỏc thuộc tớnh trong B phõn biệt hai đối tượng xi, xj.

Xột ma trận phõn biệt được xõy dựng trờn tập thuộc tớnh B A. Giả sử tập thuộc tớnh B phõn hoạch tập đối tượng thành cỏc lớp tương đương X1, X2,…,XK, và do hai đối tượng thuộc một lớp tương đương thỡ nhận giỏ trị như nhau tại cỏc thuộc tớnh trong B nờn thay vỡ xõy dựng ma trận phõn biệt giữa từng cặp đối tượng, ta xõy dựng ma trận phõn biệt giữa từng cặp lớp tương đương. Khi đú, phần tử cij, I,j {1,2, …,, K} là tập hợp thuộc tớnh phõn biệt hai đối tượng bất kỳ thuộc hai lớp tương dương X1 Xj hay cú thể núi cij là cỏc tập thuộc tớnh phõn biệt.

x1 x2 x3 x4

x1 {} {b} {a} {} x2 {b} {} {a,b} {b} x3 {a} {a,b} {} {a} x4 {} {b} {a} {}

Hỡnh 2.3: Ma trận phõn biệt của hệ thụng tin Bảng 2.7 xõy dựng trờn tập thuộc tớnh {a,b}

hai lớp tương đương XiXj. Rừ ràng, ma trận phõn biệt giữa từng lớp tương đương vẫn giữ nguyờn giỏ trị về thụng tin như ma trận phõn biệt giữa từng cặp đối tượng, ngoài ra kớch thước ma trận đó được giảm đi đỏng kể.

Ma trận phõn biệt cho ta thụng tin về cỏc thuộc tớnh phõn biệt hai đối tượng bất kỳ của hệ thụng tin. Và do rỳt gọn B của một tập thuộc tớnh P bảo toàn khả năng phõn loại của P nờn B phải cú giao khỏc rỗng với tất cả cỏc phần tử của ma trận phõn biệt xõy dựng nờn P, và tập thuộc tớnh con nhỏ nhất

Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn http://www.lrc-tnu.edu.vn/

của P cú giao khỏc rỗng với mọi phần tử của ma trận phõn biệt chớnh là rỳt gọn hoàn toàn của tập thuộc tớnh P. Từ nhận xột này ta cú thể đưa ra một heuristic tỡm rỳt gọn của tập thuộc tớnh P dựa vào ma trận phõn biệt: đưa thuộc tớnh v cú mặt nhiều nhất trong ma trận phõn biệt vào tập rỳt gọn, chuyển cỏc phần tử của ma trận phõn biệt cú chứa v thành và lặp lại quỏ trỡnh này cho tới khi mọi phần tử của ma trận đều là tập rỗng. Chẳng hạn với ma trận phõn biệt của Bảng 2.7 trong Hỡnh 2.2, cỏc thuộc tớnh a,b c tương ứng xuất hiện 6, 6 và 8 lần nờn đầu tiờn ta chọn thuộc tớnh c vào tập rỳt gọn và biến những phần tử cú chứa c thành tập rỗng. Ma trận phõn biệt lỳc này, thể hiện ở

Hỡnh 2.6 bờn dưới, cú hai thuộc tớnh ab cựng xuất hiện 2 lần. Việc chọn a

hoặc b vào tập rỳt gọn ở bước tiếp theo đều làm cho ma trận phõn biệt chứa toàn cỏc phần tử là tập rỗng. Vậy tập rỳt gọn là {a,c} hoặc {b,c}.

Tất cả cỏc rỳt gọn của một hệ thụng tin cú thể tỡm được thụng qua hàm phõn biệt. Với hệ thụng tin A= (U, A) cú ma trận phõn biệt M= (cij), hàm phõn biệt fAcủa A được xõy dựng dưới dạng tuyển chuẩn tắc như sau:

x1 x2 x3 x4

x1 {} {} {} {}

x2 {} {} {a,b} {} (adsbygoogle = window.adsbygoogle || []).push({});

x3 {} {a,b} {} {}

x4 {} {} {} {}

Hỡnh 2.4: Ma trận phõn biệt Hỡnh 2.2 sau khi chọn c vào tập rỳt gọn fA = I,j,i j, cij {˅cij

*

| cij *

cij}

Chẳng hạn, hàm phõn biệt tương ứng với ma trận Hỡnh 2.2 là:

Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn http://www.lrc-tnu.edu.vn/

Sử dụng cỏc tớnh chất trong đại số Boolean như luật hỳt, phõn phối,… ta cú thể đưa hàm phõn biệt về dạng hội chuẩn tắc, từ đú tỡm được cỏc rỳt gọn của hệ thụng tin.

Cuối cựng một rỳt gọn của hệ thụng tin được dựa trờn ma trận phõn biệt tương đối được gọi là rỳt gọn tương đối của hệ thụng tin.

Một số lưu ý về hàm phõn biệt:

- Cỏc toỏn tử ˅ và ˅ sử dụng trũn hàm phõn biệt khụng phỉ là cỏc toỏn từ Boolean vỡ chỳng khụng nhận cỏc giỏ trị true hay false mà thể hiện cho từ ngữ nghĩa cú mặt hay khụng cú mặt của một thuộc tớnh nào đú. Theo đú, hàm phõn biệt:

Fa = (a˅b˅c˅d)˅(b˅d)˅(a˅d˅e˅f)˅

(a˅b˅c˅d)˅(b˅d˅e˅f)˅(d˅c)

được hiểu như sau: cỏc đối tượng trong hệ thụng tin cú thể được phõn biệt với nhau bằng cỏch sử dụng (thuộc tớnh a hoặc b hoặc c hoặc f) và (thuộc tớnh b

hoặc d) và (thuộc tớnh b hoặc d hoặc e hoặc f) và (thuộc tớnh d hoặc c).

- Hàm phõn biệt cú thể xem như một tập cỏc tậ hợp. Vớ dụ, hàm phõn biệt trong lưu ý trờn tương đương với tập:

C = {{a,b,b,f},{b,d},{a,d,e,f},{a,b,c,d},{b,d,e,f},{d,c}}

Và cũng giống như với ma trận phõn biệt, tập nhỏ nhất cú giao với cỏc phần tử của C chớnh là cỏc rỳt gọn của hệ thụng tin tương ứng. Vớ dụ: {a,d} là một trong cỏc tập nhỏ nhất cú giao với tất cỏc phần tử của C nờn nú là một rỳt gọn của hệ thụng tin.

Một phần của tài liệu quy nạp quy tắc phân lớp sử dụng lý thuyết tập thô (Trang 47 - 50)