Thuật toỏn sinh bộ quy tắc tối tiểu

Một phần của tài liệu Quy nạp quy tắc phân lớp sử dụng lý thuyết tập thô Lê Quang Đạt. (Trang 59)

Trong hệ RoughFamily, để quy nạp bộ quy tắc tối tiểu, người ta đó cài đặt thuật toỏn cú tờn gọi LEM2. Thuật toỏn này được đề xuất bởi Grzymala trong [2]. Đầu vào của LEM2 là xấp xỉ dưới hoặc xấp xỉ trờn của một khỏi niệm quyết định, do đú luụn là tập dữ liệu nhất quỏn. Tựy thuộc dữ liệu đầu vào là xấp xỉ dưới hay xấp xỉ trờn, LEM2 cho ra bộ quy tắc chắc chắn hay bộ quy tắc gần đỳng.

í tưởng chung của LEM2 là: Tớnh toỏn một phủ địa phương cho tập dữ liệu đầu vào, sau đú chuyển nú thành một bộ quy tắc.

Ta sẽ sử dụng cỏc ký hiệu đó được đưa ra trong mục 2.2. Theo đú, c là một điều kiện sơ cấp, C là một biểu thức hội của cỏc điều kiện sơ cấp ứng viờn cho phần điều kiện của một quy tắc quyết định. C(G) ký hiệu tập tất cả cỏc điều kiện c cú thể được xem xột đưa vào biểu thức hội C nhằm mụ tảkhỏi niệm G.

Đối với điều kiện sơ cấp c = (a, v), ta gọi khối của c, ký hiệu [c], là tập hợp bao gồm tất cả cỏc đối tượng trong U cú giỏ trị thuộc tớnh a bằng v. Giả sử K xấp xỉ dưới hay trờn của một khỏi niệm (tập dữ liệu đầu vào của LEM2), đại diện bởi cặp quyết định-giỏ trị (d, w). Tập K phụ thuộc vào biểu thức hội

Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn http://www.lrc-tnu.edu.vn/

Ta núi biểu thức hội C là một tổ hợp tối tiểu của K nếu và chỉ nếu K phụ thuộc vào C và khụng tồn tại biểu thức hội con của C sao cho K phụ thuộc vào . Cho là một họ khụng rỗng cỏc biểu thức hội của cỏc điều kiện sơ cấp. Ta núi là một phủ địa phương của K khi và chỉ khi cỏc điều kiện sau đõy thỏa món:

(1) Mỗi thành viờn C of là biểu thức hội tối tiểu của K,

(2) , và là tối tiểu, nghĩa là cú số thành viờn cú thể nhỏ nhất.

Với cỏc ký hiệu và định nghĩa trờn, thuật toỏn LEM2 được mụ tả như sau.

Procedure LEM2

input: tập hợp K cỏc đối tượng,

output: một phủ địa phương C của tập hợp K;

begin G := K; := ; while G do begin C := ; ; while C := or do begin

chọn một cặp sao cho đạt giỏ trị nhỏ nhất; nếu cú nhiều cặp như thế thỡ chọn cặp

Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn http://www.lrc-tnu.edu.vn/

cho [c] nhỏ nhất; nếu lại cú nhiều cặp thỏa món thỡ chọn cặp đầu tiờn; ; ; ; ; end{while} for mỗi do if then ; ; ; end{while}; for mỗi do if then ; end{procedure}.

Trong mụ tả thuật toỏn trờn, ký hiệu chỉ lực lượng của X.

Vớ dụ: Ta hóy minh họa thuật toỏn LEM2 bằng một vớ dụ đơn giản sau đõy. Cho bảng quyết định như trong Bảng 3.1.

Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn http://www.lrc-tnu.edu.vn/

Cỏc khối của tất cả cỏc điều kiện sơ cấp (cỏc cặp thuộc tớnh-giỏ trị) cú trong bảng này là [(Temperature, very_high)] ={1}, [(Temperature, high)] ={2,5,6}, [(Temperature, normal)] ={3,4,7}, [(Headache, yes)] ={1,2,4}, [(Headache, no)] ={3,5,6,7}, [(Weakness, yes)] ={1,4,5,7}, [(Weakness, no)] ={2,3,6}, [(Nausea, no)] ={1,3,5,6,7}, [(Nausea, yes)] ={2,4}.

Ta hóy quy nạp cỏc quy tắc cho khỏi niệm quyết định {1,2,4,5} (Flu = yes). Ta cú K = G = {1,2,4,5}. Tập C(G) của tất cả cỏc cặp thuộc tớnh-giỏ trị liờn quan đến tập đối tượng G

{(Temperature, very_high), (Temperature, high), (Temperature, normal), (Headache, yes),

(Headache, no), (Weakness, yes),

(Weakness, no),(Nausea, no), (Nausea, yes)}.

Tiếp theo, ta xỏc định cỏc cặp thuộc tớnh-giỏ trị (a,v) cú lực lượng lớn nhất. Với hai cặp thuộc tớnh-giỏ trị thuộc C(G) là (Headache, yes) và (Weakness, yes), lực lượng cú giỏ trị bằng 3. Tiờu chớ tiếp theo là kớch thước của cỏc khối của cỏc cặp thuộc tớnh-giỏ trị. Vỡ khối của cặp (Headache, yes) cú kớch thước nhỏ hơn khối của cặp (Weakness, yes), ta chọn cặp (Headache, yes). Ngoài ra, vỡ [(Headache, yes)]

K, (Headache, high) là tổ hợp tối tiểu đầu tiờn của G.

Tập G mới bằng tập B - [(Headache, yes)] ={1,2,4,5}−{1,2,4}={5}. Tập T(G) mới là

Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn http://www.lrc-tnu.edu.vn/

{(Temperature, high), (Headache, no), (Weakness, yes), (Nausea, no)}. Lần này, tiờu chớ đầu tiờn, lực lượng lớn nhất, xỏc định cho ta 4 cặp thuộc tớnh-giỏ trị. Tiờu chớ thứ hai, kớch thước của cỏc khối thuộc tớnh-giỏ trị, lựa chọn cặp (Temperature, high). Tuy vậy,

[(Temperature, high)] = {2,5,6} K

chỳng tụi phải chuyển qua một bước lặp nữa của vũng lặp nội bộ. Cỏc ứng cử viờn tiếp theo là (Headache, no) và (Weakness, yes), vỡ cả hai cặp thuộc tớnh- giỏ trị này đều cho kớch thước của khối bằng bốn. Bằng cỏch dũ tỡm, chỳng ta lựa chọn (Headache, no). Nhưng, do

[(Temperature, high)] ∩ [(Headache, no)] ={5,6} K ={1,2,4,5}, ta phải chọn thờm cả (Weakness,yes)]. Lần này

[(Temperature, high)] ∩ [(Headache, no)] ∩ [(Weakness, yes)] = {5}⊆ K ={1,2,4,5},

ứng viờn tổ hợp tối tiểu của ta là tập

{(Temperature, high),(Headache, no),(Weakness,yes)}. Ta phải thực hiện phần sau đõy của thuật toỏn LEM2:

for mỗi c C do

if then ;

Kết quả là, tổ hợp tối tiểu thứ hai được xỏc định: {(Temperature, high), (Weakness, yes)}.

Cuối cựng, phủ địa phương của K = {1,2,4,5} là tập hợp gồm 2 tổ hợp tối tiểu:

{{(Headache, yes)}, {(Temperature, high), (Weakness, yes)}}.

Từ phủ địa phương này, ta cú cỏc quy tắc quyết định đối với khỏi niệm K

= {1,2,4,5} (Flu = yes) là:

If (Headache =yes) then (Flu =yes)

Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn http://www.lrc-tnu.edu.vn/

Bằng cỏc lăp lại thủ thục trờn cho khỏi niệm K = {3,6,7} (Flu = no), ta thu được 2 phủ địa phương:

{{(Temperature, normal), (Headache, no)}, {(Headache, no), (Weakness, no)}}.

Từ phủ địa phương này, ta cú cỏc quy tắc quyết định đối với khỏi niệm K

= {3,6,7} (Flu = no) là;

If (Temperature = normal) & (Headache =no) then (Flu= no) If (Headache =no) & (Weakness = no) then (Flu =no)

Bộ quy tắc tối tiểu của Bảng 3.1, quy nạp được bởi LEM2, là If (Headache =yes) then (Flu =yes)

If (Temperature =high) & (Weakness =yes) then (Flu =yes) If (Temperature =normal) & (Headache =no) then (Flu =no) If (Headache =no) & (Weakness = no) then (Flu =no).

Thuật toỏn LEM2 giỳp ớch cho việc xõy dựng cỏc hệ thống phõn loại [20, 21, 83]. Bộ quy tắc quy nạp được sẽ được sử dụng để phõn loại cỏc đối tượng mới chưa biết nhón lớp. Việc phõn loại này được thực hiện bằng cỏch so khớp mụ tả đối tượng mới với điều kiện của quy tắc quyết định. Tuy nhiờn, điều này cú thể gặp phải một số khú khăn, vỡ ba trường hợp sau đõy cú thể xảy ra:

a. Cỏc đối tượng mới phự hợp chớnh xỏc với một quy tắc.

b. Cỏc đối tượng mới phự hợp với nhiều hơn một quy tắc.

c. Cỏc đối tượng mới khụng phự hợp với quy tắc nào.

Trong trường hợp a nếu cỏc quy tắc được so khớp chớnh xỏc thỡ việc phõn loại là rừ ràng. Trong trường hợp so khớp với quy tắc gần đỳng, nhón lớp mà quy tắc khuyến nghị cú thể khụng rừ ràng. Khú khăn tương tự cũng xảy ra trong việc lựa chọn cỏc khuyến nghị đối với trường hợp (b) và trường hợp (c).

Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn http://www.lrc-tnu.edu.vn/

Như vậy, vẫn cũn cần phảit mở rộng quy tắc quy nạp bằng cỏc kỹ thuật cho phộp để giải quyết vấn đề khú khăn nờu trờn.

Chỳ ý rằng, căn cứ vào cỏc ứng dụng thực tiễn đó được thực hiện, LEM2 là thuật toỏn thường được sử dụng nhất trong số cỏc thuật toỏn quy nạp quy tắc sử dụng tập thụ.

Một phần của tài liệu Quy nạp quy tắc phân lớp sử dụng lý thuyết tập thô Lê Quang Đạt. (Trang 59)

Tải bản đầy đủ (PDF)

(76 trang)