HỌC KHÁI NIỆM CHO CƠ SỞ TRI THỨC - Tóm tắt luận án- 123docz.net

4.1. Giới thiệu

Các bài toán học khái niệm trong chương này được đặt ra theo hai ngữ cảnh sau:

• Ngữ cảnh (1):ChoLlà một logic mô tả quyết định được trongLΣ,Φ có tính chất mô hình nửa hữu hạn,Ad ∈ ΣC là khái niệm đại diện cho “thuộc tính quyết định”

và cơ sở tri thức KB0 = hR, T , A0itrong logic mô tả L không chứa Ad. Với E = hE+, E−i, trong đó E+ và E− là các tập con không giao nhau của ΣI sao cho cơ sở tri thức KB = hR, T , Aivới A = A0∪ {Ad(a) | a ∈ E+} ∪ {ơAd(a) | a ∈ E−} thỏa mãn được. Học khái niệm C như là một định nghĩa của Ad trong ngôn ngữ con LΣ†,Φ†, với Σ† ⊆ Σ \ {Ad} và Φ† ⊆ Φ sao cho:

1. KB | = C(a) với mọi a ∈ E+, và 2. KB | = ơC (a) với mọi a ∈ E−.

• Ngữ cảnh (2): Ngữ cảnh này tương tự như Ngữ cảnh (1) nhưng với điều kiện thứ hai được thay thế bằng một điều kiện yếu hơn:

2. KB 6| = C(a) với mọi a ∈ E−.

Lưu ý rằng, hai bài toán trên được giải quyết theo giả thuyết thế giới mở.

4.2. Phân hoạch miền của diễn dịch

Chúng tôi xây dựng thuật toán để làm mịn phân hoạch thông qua Hàmpartition.

Hàm này cũng sử dụng hàm chooseBlockSelector để quyết định khối và bộ chọn cần phân chia trước.

Ví dụ 4.1. Xét cơ sở tri thức KB0 và KB00 như đã cho trong Ví dụ 1.1 và diễn dịch I là mô hình của KB và KB00 như sau:

∆I= {P1, P2, P3, P4, P5, P6}, xI = x với x ∈ {P1, P2, P3, P4, P5, P6}, PubI= ∆I, AwardedI = {P1, P4, P6}, UsefulPubI = {P2, P3, P4, P5, P6}, citesI= {hP1, P2i, hP1, P3i, hP1, P4i, . . . , hP4, P5i, hP4, P6i},

cited_byI= (citesI)−1, hàm từng phần YearI được đặc tả theo từng cá thể.

Cho E = hE+, E−i với E+ = {P4, P6} và E− = {P1, P2, P3, P5}, ngôn ngữ con LΣ†,Φ†, trong đó Σ† = {Awarded , cited_by } và Φ† = ∅. Các bước làm mịn miền ∆I của I theo Hàm partition được mô tả như sau:

1. Y1 := ∆I, C1 := >, Y:= {Y1}

2. Phân chia khối Y1 bởi Awarded chúng ta thu được:

• Y2 := {P1, P4, P6}, C2 := Awarded,

• Y3 := {P2, P3, P5}, C3 := ơAwarded, ⇒ Y := {Y2, Y3}

Function partition - Làm mịn miền của diễn dịch trong logic mô tả Input : I, Σ†,Φ†, E =hE+, E−i

Output: Y={Yi1, Yi2, . . . , Yik}là một phân hoạch của miền ∆I sao cho Y nhất quán với E

1 n:= 1; Y1 := ∆I; C1 :=>; Y:={Y1}; D:=∅;

2 Tạo và thêm các bộ chọn vàoD; /* Định nghĩa 3.4, 3.5 và/hoặc 3.6 */

3 while (Y không nhất quán với E) do

Yij, Sij

:=chooseBlockSelector(Y, D);

5 if (Yij không bị phân chia bởi SiI

j) then

6 break;

7 s:=n+ 1; t:=n+ 2;n :=n+ 2;

8 Ys:=Yij ∩SiI

j; Cs:=CijuSij;

9 Yt:=Yij ∩(ơSij)I; Ct:=Cij u ơSij;

10 Y:=Y∪ {Ys, Yt} \ {Yij};

11 Tạo và thêm các bộ chọn vàoD; /* Định nghĩa 3.4, 3.5 và/hoặc 3.6 */

12 if (Y nhất quán với E) then

13 returnY;

14 else

15 returnfailure;

3. Chúng ta sử dụng bộ chọn đơn giản nhất ∃cited_by .> để phân chia Y2:

• Y4 := {P4, P6}, C4 := C2u ∃cited_by .>,

• Y5 := {P1}, C5 := C2 u ơ∃cited_by .>, ⇒ Y:= {Y3, Y4, Y5} Phân hoạch đạt được là Y = {Y3, Y4, Y5} nhất quán với E.

4.3. Học khái niệm trong logic mô tả với Ngữ cảnh (1) 4.3.1. Thuật toán BBCL

Ý tưởng chính của thuật toán BBCL để giải quyết bài toán này là sử dụng các mô hình của KB kết hợp với mô phỏng hai chiều trong mô hình đó và cây quyết định cho việc tìm kiếm khái niệm C. Thuật toán này sử dụng Hàm partition được nêu ở Mục 4.2 để làm mịn miền ∆I của diễn dịch I là mô hình của KB.

4.3.2. Thuật toán dual-BBCL

Thuật toán dual-BBCL được sử dụng để học khái niệm trong logic mô tả với Ngữ cảnh (1). Bằng cách hoán đổi các tậpE+ và E− cho nhau, sau đó áp dụng Thuật toán BBCL chỳng ta sẽ nhận được khỏi niệm Crs0 và lấy kết quả trả về là khỏi niệm ơCrs0 . 4.3.3. Tính đúng đắn của thuật toán BBCL

Mệnh đề 4.1 (Tính đúng đắn của thuật toán BBCL). Thuật toán BBCL là đúng đắn. Nghĩa là, nếu thuật toán BBCL trả về một khái niệm Crs thì Crs là một lời giải của bài toán học khái niệm cho cơ sở tri thức trong logic mô tả với Ngữ cảnh (1).

Thuật toán 4.1: BBCL - Học khái niệm trong logic mô tả với Ngữ cảnh (1) Input : KB, Σ† ⊆Σ\ {Ad},Φ†⊆Φ, E =hE+, E−i, k

Output: Khái niệmC trong LΣ†,Φ† sao cho:

• KB |=C(a) với mọia∈E+, và

• KB |=ơC(a) với mọia∈E−.

1 C:=∅; C0 :=∅;

2 while not (too hard to extend C) do

3 Xây dựng mô hình hữu hạn (tiếp theo) I của KB hoặc I =I|k0 ;

4 Y:= partition (I, Σ†, Φ†, E); /* phân hoạch ∆I theo Hàm partition */

5 foreach Yij ∈Y sao cho ∃a∈E+:aI ∈Yij và ∀a∈E−:aI 6∈Yij do

6 if (KB |=ơCij(a) với mọi a∈E−)then

7 if (KB 6|= (Cij vF

C)) then

8 C:=C∪ {Cij};

9 else

10 C0 :=C0∪ {Cij};

11 if (KB |= (F

C)(a) với mọi a∈E+)then

12 go to 20;

13 while not (too hard to extend C)do

14 D:=D1 uD2u ã ã ã uDl, với D1, D2, . . . , Dl được chọn ngẫu nhiờn từ C0;

15 if (KB |=ơD(a) với mọia ∈E− và KB 6|= (DvF

C)) then

16 C:=C∪ {D};

17 if (KB |= (F

C)(a) với mọi a∈E+)then

18 go to 20;

19 return failure;

20 foreach D∈C do

21 if (KB |=F

(C\ {D})(a) với mọi a∈E+)then

22 C:=C\ {D};

23 C :=F C;

24 return Crs:= simplify(C); /* rút gọn khái niệm C */

4.3.4. Ví dụ minh họa

Ví dụ 4.2. Xét cơ sở tri thức KB0 = hR, T , A0inhư đã cho trong Ví dụ 1.1 và E = hE+, E−i với E+ = {P4, P6}, E− = {P1, P2, P3, P5}, Σ† = {Awarded, cited_by } và Φ† = ∅. Học định nghĩa cho Ad với KB = hR, T , Ai, trong đó A = A0∪ {Ad(a) | a ∈ E+} ∪ {ơAd(a) | a ∈ E−}. Thuật toỏn BBCL thực hiện như sau:

1. C:= ∅, C0 := ∅.

2. KB có nhiều mô hình, trong đó mô hình I được đặc tả như trong Ví dụ 4.1.

3. Áp dụng Hàm partition để làm mịn miền ∆I của I, ta được phân hoạch Y= {Y3, Y4, Y5} nhất quán với E tương ứng với các khái niệm đặc trưng C3, C4, C5, trong đú Y3 = {P2, P3, P5}, Y4 = {P4, P6}, Y5 = {P1} và C3 ≡ ơAwarded, C4 ≡ Awarded u ∃cited_by .>, C5 ≡ ơAwarded u ∃cited_by .>.

4. Vỡ Y4 ⊆ E+ nờn ta xem xột C4 ≡ Awarded u ∃cited_by .>. Vỡ KB | = ơC4(a) với mọi a ∈ E− nên ta thêm C4 vào C. Do đó, ta có C ≡ {C4} và F

C ≡ C4. 5. Vì KB | = (FC)(a) với mọi a ∈ E+ nên ta có C ≡ FC ≡ Awarded u

∃cited_by .>. Do khái niệm C đã ở dạng chuẩn và không thể đơn giản hơn được nữa nên kết quả trả về là Crs ≡ Awarded u ∃cited_by .>.

Ví dụ 4.3. Xét thuật toán dual-BBCL đối với Ví dụ 4.2 và hoán đổi E+ và E− với nhau. Thuật toán dual-BBCL thực hiện ba bước đầu tiên giống như Ví dụ 4.2 và các bước tiếp theo như sau:

4. Vỡ Y3 ⊆ E+ nờn ta xem xộtC3 ≡ ơAwarded. Vỡ KB | = ơC3(a) với mọia ∈ E− nên ta thêm C3 vào C. Do đó, ta có C= {C3}.

5. Vỡ Y5 ⊆ E+ nờn ta xem xột C5 ≡ Awarded u ơ∃cited_by .>. Vỡ KB | = ơC5(a) với mọi a ∈ E− và C5 không bị bao hàm bởi F

C dựa trên KB nên ta thêm C5

vào C. Do đó, ta có C = {C3, C5} và F

C ≡ C3t C5.

6. Vỡ KB | = (FC)(a) với mọi a ∈ E+ nờn ta cú C ≡ FC ≡ ơAwarded t (Awarded u ơ∃cited_by .>). Chuẩn húa và đơn giản khỏi niệm C ta được kết quả trả về là Crs ≡ ơAwarded t ơ∃cited_by .>.

Nếu muốn lấy kết quả của Ví dụ 4.2 chúng ta lấy phủ định của Crs. Lúc đó kết quả là ơCrs≡ ơ(ơAwarded t ơ∃cited_by .>) ≡ Awarded u ∃cited_by .>.

4.4. Học khái niệm trong logic mô tả với Ngữ cảnh (2) 4.4.1. Thuật toán BBCL2

Phương pháp học khái niệm cho cơ sở tri thức trong logic mô tả với Ngữ cảnh (2) được trình bày chi tiết thông qua Thuật toán 4.2.

4.4.2. Tính đúng đắn của thuật toán BBCL2

Mệnh đề 4.2 (Tính đúng đắn của thuật toán BBCL2). Thuật toán BBCL2 là đúng đắn. Nghĩa là, nếu thuật toán BBCL2 trả về một khái niệm Crs thì Crs là một lời giải của bài toán học khái niệm cho cơ sở tri thức trong logic mô tả với Ngữ cảnh (2).

4.4.3. Ví dụ minh họa

Ví dụ 4.4. Xét cơ sở tri thức KB00 = hR, T , A00inhư đã cho trong Ví dụ 1.1 và E = hE+, E−i, Σ†, Φ† như trong Ví dụ 4.2. Đặt KB = hR, T , Aivới A = A00 ∪ {Ad(a) | a ∈ E+} ∪ {ơAd(a) | a ∈ E−}. Thuật toỏn BBCL2 thực hiện ba bước đầu tiên giống như Ví dụ 4.2 (có bổ sung thêm E0− := ∅) và các bước tiếp theo như sau:

4. Vỡ Y3 ⊆ E− nờn ta xem xộtC3 ≡ ơAwarded. Vỡ KB | = ơC3(a) với mọia ∈ E+ nờn ta thờm ơC3 vào C và thờm cỏc phần tử của Y3 vào E0−. Do đú, ta cú C = {C3} và E0− = {P2, P3, P5}.

5. Vỡ Y5 ⊆ E− nờn ta xem xột C5 ≡ Awarded u ơ∃cited_by .>. Vỡ KB | = ơC5(a) với mọi a ∈ E+ và d

C khụng bị bao hàm bởiC5 dựa trờn KB nờn ta thờm ơC5 vào C. Do đú, ta cú C = {ơC3, ơC5} và E0− = {P1, P2, P3, P5}.

6. Vì E0− = E− nên ta cóC ≡ d

C≡ ơơAwarded uơ(Awarded uơ∃cited_by .>). Rút gọn khái niệm C ta được kết quả trả về là Crs ≡ Awarded u ∃cited_by .>.

Thuật toán 4.2: BBCL2 - Học khái niệm trong logic mô tả với Ngữ cảnh (2) Input : KB, Σ†,Φ†, E =hE+, E−i, k

Output: Khái niệmC sao cho:

• KB |=C(a) với mọia∈E+, và

• KB 6|=C(a) for all a∈E−.

1 C:=∅; C0 :=∅; E0−:=∅;

2 while not (too hard to extend C) và (E0−6=E−)do

3 Xây dựng mô hình hữu hạn (tiếp theo) I của KB hoặc I =I|k0 ;

4 Y:=partition (I,Σ†, Φ†, E); /* phân hoạch ∆I theo Hàm partition */

5 foreach Yij ∈Y sao cho ∃a∈E−:aI ∈Yij và ∀a∈E+:aI 6∈Yij do

6 if (KB |=ơCij(a) với mọi a∈E+)then

7 if (KB 6|= (d

Cv ơCij)) then

8 C:=C∪ {ơCij};

9 E0− :=E0−∪ {a∈E− |aI ∈Yij};

10 else

11 C0 :=C0∪ {ơCij};

12 while not (too hard to extend C) và (E0−6=E−)do

13 D:=D1 tD2t ã ã ã tDl, với D1, D2, . . . , Dl được chọn ngẫu nhiờn từ C0;

14 if (KB |=D(a) với mọi a∈E+) then

15 if (KB 6|= (d

C)vD) và (∃a∈E−\E0− :KB 6|= (d

CuD)(a))then

16 C:=C∪ {D};

17 E0− :=E0−∪ {a|a∈E−\E0−,KB 6|= (d

C)(a)};

18 if (E0−=E−)then

19 foreach (D∈C) do

20 if (KB 6|=d

(C\ {D})(a) với mọi a∈E−)then

21 C:=C\ {D};

22 C :=d

23 return Crs:= simplify(C); /* rút gọn khái niệm C */

24 else

25 return failure;

Tiểu kết Chương 4

Chương này trình bày phương pháp làm mịn phân hoạch miền của diễn dịch trong logic mô tả trên cơ sở của Thuật toán 3.1. Tiếp đó, chúng tôi đề xuất các thuật toán BBCL, dual-BBCL và BBCL2 để giải quyết hai bài toán học khái niệm cho cơ sở tri thức trong logic mô tả với Ngữ cảnh (1) và Ngữ cảnh (2). Ý tưởng chính của các thuật toán này là sử dụng các mô hình của cơ sở tri thức kết hợp với mô phỏng hai chiều trong các mô hình đó và cây quyết định để tìm kiếm khái niệm kết quả. Tính đúng của các thuật toán BBCL và BBCL2 cũng được chứng minh thông qua các bổ đề tương ứng. Các thuật toán này có thể áp dụng cho một lớp lớn các logic mô tả là mở rộng của ALCΣ,Φ có tính chất mô hình hữu hạn hoặc nửa hữu hạn, trong đó Φ ⊆ {I , F , N , Q, O, U , Self }.