Tính đúng đắn của thuật toán BBCL

Một phần của tài liệu Học khái niệm cho các hệ thống thông tin dựa trên logic mô tả (Trang 104 - 108)

Mệnh đề 4.1 (Tính đúng đắn của thuật toán BBCL). Thuật toán BBCL là đúng đắn. Nghĩa là, nếu thuật toán BBCL trả về một khái niệm Crs thì Crs là một lời giải của bài toán học khái niệm cho cơ sở tri thức trong logic mô tả với Ngữ cảnh (1).

Chứng minh. Giả sửCrslà khái niệm kết quả của thuật toán BBCL vàC là khái niệm

F

Ctrong Bước 23. VìCrs thu được từ khái niệmCthông qua phép biến đổi bảo toàn tính tương đương của khái niệm nên chúng ta chỉ cần chứng minh hai khẳng định sau:

• KB |=C(a) với mọia∈E+, và • KB |=¬C(a) với mọia∈E−.

Đầu tiên ta chứng minh KB |=¬C(a) với mọia∈E−. Ta thấy rằng tập các khái niệm C chỉ được mở rộng tại các Bước 8 và 16. Một khái niệm D được thêm vào C khi KB |=¬D(a) với mọi a ∈ E−. Đặt n = #C sau khi đã loại bỏ những khái niệm

sao cho KB |=¬Di(a) với mọi a∈E−. Do đó,KB |= (¬D1u ¬D2u · · · u ¬Dn)(a) với mọi a ∈ E−. Áp dụng luật De Morgan, ta có KB |=¬(F

C)(a) với mọi a ∈E−. Nói cách khác, KB |=¬C(a) với mọia∈E−.

Bây giờ ta chứng minh KB |= C(a) với mọi a ∈ E+. Để thuật toán thực hiện được Bước 20 (thông qua thực hiện Bước 12 và 18) thì KB |= (F

C)(a) với mọi

a ∈ E+. Tại Bước 22, ta chỉ loại bỏ khỏi C những khái niệm D nhưng vẫn đảm bảo KB |=F

(C\ {D})(a)với mọi a ∈E+. Do đó, ta có KB |= (F

C)(a) với mọi a∈ E+. Nói cách khác, KB |=C(a)với mọi a∈E+.

Như vậy chúng ta kết luận rằng, nếu thuật toán BBCL không kết thúc với kết quả thất bại thì khái niệm trả về Crs là một lời giải của bài toán học khái niệm cho cơ sở

tri thức trong logic mô tả với Ngữ cảnh (1).

4.3.4. Ví dụ minh họa

Sau đây chúng ta xem xét các ví dụ minh họa cho Thuật toán BBCL và dual- BBCL để học khái niệm cho cơ sở tri thức trong logic mô tả với Ngữ cảnh (1) sử dụng các ngôn ngữ con khác nhau.

Ví dụ 4.3. Xét cơ sở tri thức KB0 = hR,T,A0inhư đã cho trong Ví dụ 1.9 và

E =hE+, E−ivới E+ ={P4, P6}, E− ={P1, P2, P3, P5},Σ† ={Awarded, cited_by} và Φ† = ∅. Học định nghĩa cho khái niệm Ad với KB = hR,T,Ai, trong đó A = A0∪ {Ad(a) | a ∈ E+} ∪ {¬Ad(a) | a ∈ E−}. Thuật toán BBCL thực hiện các bước như sau:

1. C:=∅,C0 :=∅.

2. KB có nhiều mô hình, trong đó mô hìnhI được đặc tả trong Ví dụ 4.1 như sau: ∆I = {P1,P2,P3,P4,P5,P6}, xI =x với x∈ {P1,P2,P3,P4,P5,P6},

PubI = ∆I, AwardedI ={P1,P4,P6}, UsefulPubI ={P2,P3,P4,P5,P6},

citesI = {hP1,P2i,hP1,P3i,hP1,P4i,hP1,P6i,hP2,P3i,hP2,P4i,

hP2,P5i,hP3,P4i,hP3,P5i,hP3,P6i,hP4,P5i,hP4,P6i},

cited_byI = (citesI)−1, hàm từng phần YearI được đặc tả theo từng cá thể. 3. Áp dụng Hàm partition để làm mịn miền ∆I của I, chúng ta thu được phân

hoạch Y={Y3, Y4, Y5} nhất quán với E tương ứng với các khái niệm đặc trưng

C3, C4, C5, trong đó Y3 = {P2,P3,P5}, Y4 = {P4,P6}, Y5 = {P1} và C3 ≡ ¬Awarded, C4 ≡Awardedu ∃cited_by.>, C5 ≡ ¬Awarded u ∃cited_by.>. (Xem quá trình phân hoạch ở Ví dụ 4.1)

4. Vì Y4 ⊆ E+ nên ta tiến hành xem xét đối vớiC4 ≡Awarded u ∃cited_by.>. Vì KB |=¬C4(a)với mọi a∈E− nên ta thêm C4 vào C. Do đó, ta cóC≡ {C4}và

F

C≡C4. 5. VìKB |= (F

C)(a)với mọia∈E+nên ta cóC ≡F

C≡Awardedu∃cited_by.>. Do khái niệm C đã ở dạng chuẩn và không thể đơn giản hơn được nữa nên kết quả trả về là Crs≡Awarded u ∃cited_by.>.

Ví dụ 4.4. Chúng ta xem xét thuật toán dual-BBCL đối với Ví dụ 4.3 và hoán đổi

E+ và E− với nhau. Nghĩa là E+ ={P1, P2, P3,P5} và E− ={P4, P6}. Thuật toán dual-BBCL thực hiện ba bước đầu tiên giống như Ví dụ 4.3 và các bước tiếp theo như sau:

4. Vì Y3 ⊆E+ nên ta tiến hành xem xét đối vớiC3 ≡ ¬Awarded. Vì KB |=¬C3(a) với mọi a∈E− nên ta thêm C3 vào C. Do đó, ta có C={C3}.

5. Vì Y5 ⊆E+ nên ta tiến hành xem xét đối vớiC5 ≡Awardedu ¬∃cited_by.>. Vì KB |= ¬C5(a) với mọi a ∈ E− và C5 không bị bao hàm bởi F

C dựa trên KB nên ta thêm C5 vào C. Do đó, ta có C={C3, C5} và F

C≡C3tC5. 6. VìKB |= (F

C)(a)với mọia∈E+nên ta cóC ≡F

C≡ ¬Awardedt(Awardedu ¬∃cited_by.>). Chuẩn hóa và đơn giản khái niệm C ta được kết quả trả về là

Crs≡ ¬Awarded t ¬∃cited_by.>.

Nếu muốn lấy kết quả của Ví dụ 4.3 chúng ta lấy phủ định của khái niệm Crs và được kết quả trả về là¬Crs≡ ¬(¬Awardedt ¬∃cited_by.>)≡Awardedu ∃cited_by.>. Ví dụ 4.5. Cho KB0, E, Φ† như trong Ví dụ 4.3 và thay đổi Σ†={cited_by,Year}. Thuật toán BBCL thực hiện hai bước đầu tiên như Ví dụ 4.3 và các bước tiếp theo như sau:

3. Áp dụng Hàm partition để làm mịn miền ∆I của I, chúng ta thu được phân hoạch Y = {Y4, Y6, Y7, Y8, Y9} nhất quán với E tương ứng với các khái niệm đặc trưng C4, C6, C7, C8, C9, trong đó Y4 = {P4}, Y6 = {P1}, Y7 = {P2,P3},

Y8 = {P6}, Y9 = {P5} và C4 ≡ (Year < 2008)u(P ubY ear ≥ 2007), C6 ≡ (Year ≥ 2008)u(Year ≥ 2010), C7 ≡ (Year ≥ 2008)u(Year < 2010), C8≡ (Year <2008) u(Year < 2007)u ∃cited_by.((Year ≥ 2008)u (Year ≥2010)),

C9≡(Year<2008)u(Year<2007)u¬∃cited_by.((Year≥2008)u(Year≥2010)). (Xem quá trình phân hoạch ở Ví dụ 4.2)

4. Vì Y4 ⊆ E+ nên ta tiến hành xem xét đối với C4 ≡ (Year < 2008)u(Year ≥ 2007). Vì KB |= ¬C4(a) với mọi a ∈ E− nên ta thêm C4 vào C. Do đó, ta có

C={C4}.

5. Vì Y8 ⊆ E+ nên ta tiến hành xem xét đối với C8 ≡ (Year < 2008)u(Year <

2007)u ∃cited_by.((Year ≥ 2008)u(Year ≥ 2010)). Vì KB |= ¬C8(a) với mọi

a ∈ E− và C8 không bị bao hàm bởi F

C dựa trên KB nên ta thêm C8 vào C. Do đó, ta có C={C4, C8} và F

C≡C4tC8. 6. Vì KB |= (F

C)(a) với mọi a∈E+ ta có C ≡ F

C ≡[(Year <2008)u(Year ≥ 2007)]t[(Year <2008)u(Year <2007)u ∃cited_by.((Year ≥2008)u(Year ≥ 2010))]. Chuẩn hóa khái niệmC ta đượcC≡(Year <2008)u[(Year ≥2007)t ∃cited_by.(Year ≥ 2010)]. Đơn giản khái niệm C ta được kết quả trả về là

Crs ≡ (Year <2008)u ∃cited_by.(Year ≥ 2010). Khái niệm Crs vẫn thỏa mãn điều kiện KB |=Crs(a) với mọia∈E+ và KB |=¬Crs với mọia∈E−.

Ví dụ 4.6. Chúng ta xem xét thuật toán dual-BBCL đối với Ví dụ 4.5 nhưng hai tập

E+ và E− được hoán đổi cho nhau. Nghĩa làE+={P1,P2,P3,P5} vàE− ={P4,P6}. Thuật toán dual-BBCL thực hiện ba bước đầu tiên như Ví dụ 4.5 và các bước tiếp theo như sau:

4. Vì Y6 ⊆ E+ nên ta tiến hành xem xét đối với C6 ≡ (Year ≥ 2008)u(Year ≥ 2010). Vì KB |= ¬C6(a) với mọi a ∈ E− nên ta thêm C6 vào C. Do đó, ta có

C={C6}.

5. Vì Y7 ⊆ E+ nên ta tiến hành xem xét đối với C7 ≡ (Year ≥ 2008)u(Year <

2010). Vì KB |=¬C7(a) với mọi a ∈ E− và C7 không bị bao hàm bởi F

C dựa trên KB nên ta thêm C7 vào C. Do đó, ta có C={C6, C7}và F

C≡C6tC7. 6. Vì Y9 ⊆ E+ nên ta tiến hành xem xét đối với C9 ≡ (Year < 2008)u(Year <

2007)u ¬∃cited_by.((Year ≥2008)u(Year ≥2010)). Vì KB |=¬C9(a)với mọi

a ∈ E− và C9 không bị bao hàm bởi F

C dựa trên KB nên ta thêm C9 vào C. Do đó, ta có C={C6, C7, C9}và F

C≡C6tC7tC9. 7. Vì KB |= (F

C)(a) với mọi a∈E+ ta có C ≡F

C≡ [(Year ≥2008)u(Year ≥ 2010)]t[(Year ≥ 2008)u(Year < 2010)]t[(Year < 2008)u(Year < 2007)u ¬∃cited_by.((Year ≥2008)u(Year ≥2010))]. Chuẩn hóa và đơn giản khái niệm

C ta được kết quả trả về là Crs ≡(Year ≥2008)t ¬∃cited_by.(Year ≥2010).

và được kết quả trả về là ¬Crs ≡ ¬[(Year ≥ 2008)t ¬∃cited_by.(Year ≥ 2010)] ≡ (Year <2008)u ∃cited_by.(Year ≥2010).

Một phần của tài liệu Học khái niệm cho các hệ thống thông tin dựa trên logic mô tả (Trang 104 - 108)

Tải bản đầy đủ (PDF)

(121 trang)