Ví dụ minh họa

Một phần của tài liệu Học khái niệm cho các hệ thống thông tin dựa trên logic mô tả (Trang 84 - 90)

Trong mục này, chúng tôi trình bày các ví dụ minh họa cho Thuật toán 3.1, trong đó Ví dụ 3.5 chỉ sử dụng các bộ chọn cơ bản, Ví dụ 3.6 sử dụng các bộ chọn đơn giản và Ví dụ 3.8 sử dụng cả bộ chọn đơn giản và bộ chọn mở rộng trong quá trình làm mịn phân hoạch. Mục đích của các ví dụ này nhằm chỉ ra tính hiệu quả của các loại bộ chọn khác nhau.

Ví dụ 3.5. Xét hệ thống thông tin I như đã cho trong Ví dụ 3.3. Giả sử chúng ta muốn học định nghĩa của khái niệm ExcellentPub (nghĩa là, E = hE+, E−ivới

E+ = {P4,P6} và E− = {P1,P2,P3,P5}) trong ngôn ngữ con LΣ†,Φ†, trong đó Σ† = {Awarded,cited_by} và Φ† =∅. Chúng ta chỉ sử dụng các bộ chọn cơ bản trong quá trình làm mịn phân hoạch. Các bước của ví dụ được mô tả như sau:

2. Theo độ đo gia lượng thông tin, bộ chọn tốt nhất để phân chia Y1 là Awarded. Tiến hành phân chia khối Y1 bởi Awarded chúng ta thu được:

• Y2 :={P1,P4,P6}, C2 :=Awarded • Y3 :={P2,P3,P5}, C3 :=¬Awarded

• LargestContainer[3] := 3 (vì Y3 không bị phân chia bởi E) • Y:={Y2, Y3}

3. Theo độ đo gia lượng thông tin, các bộ chọn tốt nhất để phân chia Y2 là ∃cited_by.>, ∃cited_by.C2 và ∃cited_by.C3. Tất cả các bộ chọn này đều phân chia Y2 giống nhau. Chúng ta sử dụng bộ chọn đơn giản nhất ∃cited_by.> để phân chia Y2 và thu được:

• Y4 :={P4,P6}, C4 :=C2u ∃cited_by.>

• LargestContainer[4] := 4 (vì Y4 không bị phân chia bởi E) • Y5 :={P1},C5 :=C2u ¬∃cited_by.>

• LargestContainer[5] := 5 (vì Y5 không bị phân chia bởi E) • Y:={Y3, Y4, Y5}

Phân hoạch đạt được là Y = {Y3, Y4, Y5} nhất quán với E, gồm Y4 chứa P4, P6 với P4,P6 ∈ E+ và Y3, Y5 không chứa cá thể nào của E+ (phân hoạch này không tương ứng với quan hệ ∼Σ†,Φ†,I). Vì LargestContainer[4] = 4 nên ta có C= {C4} và

C ≡C4 ≡Awardedu ∃cited_by.>. Khái niệmCkhông thể rút gọn thêm được nữa nên khái niệm kết quả trả về là Crs ≡ C ≡ Awarded u ∃cited_by.>. Khái niệm này được định nghĩa đơn giản hơn so với khái niệm gốc ExcellentPub ≡(GoodPubuAwarded)≡

(Awarded u ≥2cited_by).

Quá trình làm mịn phân hoạch của Ví dụ 3.5 được minh họa thông qua cây quyết định như trong Hình 3.2.

Ví dụ sau đây minh họa cho trường hợp học khái niệm không sử dụng vai trò, nghĩa là, Σ†oR∪Σ†dR = ∅. Do đó, phương pháp đã đề xuất ở trên giống như phương pháp học máy truyền thống dựa trên cây quyết định.

Ví dụ 3.6. Xét hệ thống thông tin I như đã cho trong Ví dụ 3.3. Giả sử chúng ta muốn học định nghĩa của X ={P4,P6} (nghĩa là, E = hE+, E−ivới E+ ={P4,P6} và E−={P1,P2,P3,P5}) trong ngôn ngữ conLΣ†,Φ†, trong đó Σ† ={Awarded,Year} và Φ†=∅. Chúng ta chỉ sử dụng các bộ chọn đơn giản trong quá trình làm mịn phân hoạch. Các bước của ví dụ được mô tả như sau:

{P1,P2,P3,P4,P5,P6} Awarded ¬Awarded * * {P1,P4,P6} ¬∃cited_by.> u u ∃cited_by.> {P2,P3,P5} {P1} {P4,P6}

Hình 3.2: Quá trình làm mịn phân hoạch của Ví dụ 3.5

1. Y1 := ∆I, C1 :=>, partition:={Y1}

2. Theo độ đo gia lượng thông tin, bộ chọn tốt nhất tại bước này để phân chia khối

Y1 là Awarded và Year ≥ 2008. Chúng ta chọn Awarded là bộ chọn đơn giản nhất để phân chia Y1 và thu được:

• Y2 :={P1,P4,P6}, C2 :=Awarded • Y3 :={P2,P3,P5}, C3 :=¬Awarded

• LargestContainer[3] := 3 (vì Y3 không bị phân chia bởi E) • Y:={Y2, Y3}.

3. Theo độ đo gia lượng thông tin, bộ chọn tốt nhất để phân chia khối Y2 là Year ≥2009. Tiến hành phân chia Y2 bởiYear ≥2009 chúng ta thu được:

• Y4 :={P1},C4 :=C2u(Year ≥2009)

• LargestContainer[4] := 4 (vì Y4 không bị phân chia bởi E) • Y5 :={P4,P6}, C5 :=C2u(Year <2009)

• LargestContainer[5] := 5 (vì Y5 không bị phân chia bởi E) • Y:={Y3, Y4, Y5}.

Phân hoạch đạt được là Y = {Y3, Y4, Y5} nhất quán với E, gồm Y5 chứa P4, P6 với P4,P6 ∈ E+ và Y3, Y4 không chứa cá thể nào của E+ (phân hoạch này không tương ứng với quan hệ ∼Σ†,Φ†,I). Vì LargestContainer[5] = 5 nên ta có C= {C5} và

C ≡C5 ≡Awarded u(Year <2009). Khái niệm C không thể rút gọn thêm được nữa nên khái niệm kết quả trả về là Crs≡Awarded u(Year <2009).

Quá trình làm mịn phân hoạch của Ví dụ 3.6 được minh họa thông qua cây quyết định như trong Hình 3.3.

{P1,P2,P3,P4,P5,P6} Awarded ¬Awarded * * {P1,P4,P6} Year≥2009 u u Year<2009 {P2,P3,P5} {P1} {P4,P6}

Hình 3.3: Quá trình làm mịn phân hoạch của Ví dụ 3.6

Các ví dụ tiếp theo sau đây chỉ ra một bức tranh khá đầy đủ về hiệu quả của các bộ chọn đơn giản và bộ chọn mở rộng đã đề cập trong Mục 3.2.2. Đầu tiên chúng ta xét ví dụ về một cơ sở tri thức và hệ thống thông tin tương ứng với cơ sở tri thức đó. Ví dụ 3.7. Cho cơ sở tri thứcKB =hR,T,Aitrong LΣ,Φ, vớiΣ = ΣI∪ΣdA∪ΣnA∪ ΣoR∪ΣdR và Φ ={I}, trong đó:

ΣI ={Ava, Britt, Colin, Dave, Ella, F lor, Gigi, Harry},

ΣC ={Human, M ale, F emale, N ephew, N iece}, ΣdA= ΣC, ΣnA=∅,

ΣoR ={hasChild, hasP arent, hasSibling}, ΣdR =∅.

R ={hasP arent≡hasChild−,Sym(hasSibling)},

T ={Human≡ >, N iece≡F emaleu ∃hasChild−.(∃hasSibling.>), N ephew≡M aleu ∃hasChild−.(∃hasSibling.>)},

A ={F emale(Ava), F emale(Britt), M ale(Colin), M ale(Dave), F emale(Ella), F emale(F lor), F emale(Gigi), M ale(Harry),

hasChild(Ava, Dave), hasChild(Ava, Ella), hasChild(Britt, F lor), hasChild(Colin, Gigi), hasChild(Colin, Harry),

hasSibling(Britt, Colin), hasSibling(Colin, Britt), hasSibling(Dave, Ella), hasSibling(Ella, Dave), hasSibling(Gigi, Harry), hasSibling(Harry, Gigi)}.

Hệ thống thông tin I của cơ sở tri thứKB có thể được xây dựng như sau: ∆I={Ava, Britt, Colin, Dave, Ella, F lor, Gigi, Harry},

HumanI = ∆I, AvaI =Ava, BrittI =Britt, . . . , HarryI =Harry, F emaleI={Ava, Britt, Ella, F lor, Gigi}, M aleI ={Colin, Dave, Harry},

hasChildI={hAva, Davei,hAva, Ellai,hBritt, F lori,hColin, Gigii,hColin, Harryi}, hasP arentI={hDave, Avai,hElla, Avai,hF lor, Britti,hGigi, Colini,hHarry, Colini}, hasSiblingI={hBritt, Colini,hColin, Britti,hDave, Ellai,hElla, Davei,

hGigi, Harryi,hHarry, Gigii},

(hasSibling−)I = hasSiblingI, N ieceI ={F lor, Gigi}, N ephewI ={Harry}.

Hệ thống thông tin này được minh họa như là một diễn dịch trong Hình 3.4. Trong hình này, mỗi nút ký hiệu cho một người, ký tự M để chỉ khái niệm M ale, ký tự F

để chỉ khái niệm F emale, các cạnh liền nét ký hiệu cho vai tròhasChild và các cạnh

đứt nét ký hiệu cho vai trò hasSibling.

Ava:F Britt:F ) ) h h Colin :M Dave:M (( h

h Ella:F F lor:F Gigi:F **

j

j Harry:M

Hình 3.4: Hệ thống thông tin tương ứng với cơ sở tri thức trong Ví dụ 3.7 Ví dụ tiếp theo minh họa việc học khái niệm trong ngôn ngữ con bằng cách sử dụng bộ chọn đơn giản và bộ chọn mở rộng. Ví dụ này minh họa rằng sử dụng các bộ chọn đơn giản kết hợp với bộ chọn mở rộng cho kết quả tốt hơn so với chỉ sử dụng các bộ chọn đơn giản. Sử dụng các bộ chọn đơn giản kết hợp với bộ chọn mở rộng rút gọn được số lần lặp của vòng lặp chính và do đó rút gọn được độ dài của khái niệm kết quả. Quá trình làm mịn phân hoạch được minh họa bằng các cây quyết định. Ví dụ 3.8. Xét hệ thống thông tinI như đã cho trong Ví dụ 3.7, ngôn ngữ conLΣ†,Φ† với Σ† = {F emale, hasChild, hasSibling} và Φ† = {I}, và tập X = {F lor, Gigi} (nghĩa là, E = hE+, E−ivới E+ = {F lor, Gigi} và E− = {Ava, Britt, Colin, Dave, Ella, Harry}). Học định nghĩa của tậpX. Chúng ta có thể xem X như là tập các thể hiện của khái niệm N iece≡F emaleu ∃hasChild−.(∃hasSibling.>) trong I.

1. Học định nghĩa của X trong LΣ†,Φ† bằng cách sử dụng các bộ chọn đơn giản. Các bước của quá trình làm mịn phân hoạch được minh họa trong Hình 3.5. Khái niệm kết quả học được là:

C ≡(F emaleu ∀hasChild.⊥ u ∃hasSibling.> u ∀hasChild−.(¬F emale))t (F emaleu ∀hasChild.⊥ u ∀hasSibling.⊥).

Ava, Britt, Colin, Dave, Ella, F lor, Gigi, Harry F emale u u ¬F emale ( (

Ava, Britt, Ella, F lor, Gigi ∃hasChild.> ∀hasChild.⊥ ) )

Colin, Dave, Harry

Ava, Britt Ella, F lor, Gigi

∃hasSibling.> u u ∀hasSibling.⊥ ( ( Ella, Gigi

∃hasChild−.F emale ∀hasChild−.(¬F emale)

)

)

F lor

Ella Gigi

Hình 3.5: Quá trình làm mịn phân hoạch sử dụng các bộ chọn đơn giản

Khái niệm C được rút gọn thành khái niệm kết quả trả vềCrs như sau:

Crs≡F emaleu ∀hasChild.⊥ u(∀hasChild−.(¬F emale)t ∀hasSibling.⊥).

2. Học định nghĩa của X trong LΣ†,Φ† bằng cách sử dụng các bộ chọn đơn giản và bộ chọn mở rộng. Các bước của quá trình làm mịn phân hoạch được minh họa trong Hình 3.6.

Ava, Britt, Colin, Dave, Ella, F lor, Gigi, Harry F emale v v ¬F emale & &

Ava, Britt, Ella, F lor, Gigi ∃hasChild−.(∃hasSibling.>) ∀hasChild−.(∀hasSibling.⊥) ( (

Colin, Dave, Harry

F lor, Gigi Ava, Britt, Ella

Hình 3.6: Quá trình làm mịn phân hoạch sử dụng các bộ chọn đơn giản và mở rộng

Khái niệm kết quả học được là: C ≡F emaleu ∃hasChild−.(∃hasSibling.>).

Khái niệm C không thể rút gọn thêm được nữa nên khái niệm kết quả trả về là

Crs ≡F emaleu ∃hasChild−.(∃hasSibling.>).

mở rộng. Bộ chọn này được tạo ra bằng cách áp dụng luật thứ hai trong Định nghĩa 3.6 với ∃hasSibling.> là một khái niệm có trong tập các bộ chọn hiện thời D.

Một phần của tài liệu Học khái niệm cho các hệ thống thông tin dựa trên logic mô tả (Trang 84 - 90)

Tải bản đầy đủ (PDF)

(121 trang)