Mô hình AGM

Một phần của tài liệu (LUẬN văn THẠC sĩ) tích hợp tri thức sử dụng các kỹ thuật tranh cãi (Trang 25 - 36)

4 Thực nghiệm và đánh giá

1.2 Mô hình AGM

1.2.3 Tích hợp tri thức

Tích hợp tri thức nghiên cứu cách hợp các thông tin độc lập, không nhất quán và đến từ nhiều nguồn khác nhau thành một thông tin nhất quán. Quá trình tích hợp tri thức liên kết chặt chẽ với duyệt tri thức. Giống như duyệt tri thức, trong tích hợp các thuật ngữ "tri thức" được sử dụng trong một ý nghĩa rộng lớn, "tri thức" ở đây đề cập đến các công thức được chấp nhận bởi một tác tử (tức là các công thức trong cơ sở tri thức của tác tử đó) mà không nhất thiết phải đúng. Do đó "cơ sở tri thức" và "cơ sở niềm tin" được sử dụng thay thế cho nhau. Grégoire và Konieczny đã đi xa hơn và cho rằng toán tử tích hợp tri thức có thể sử dụng để hợp các loại thông tin khác nhau hơn là tri thức và niềm tin.

Các phương pháp tiếp cận đầu tiên để đối phó với vấn đề tích hợp các cơ sở tri thức không nhất quán đã được Baral và cộng sự xây dựng trên ý tưởng của Ginsberg trong việc xem xét tập con nhất quán lớn nhất khi đối mặt với một lý thuyết không nhất quán sao cho một trong số các tập con đó có thể là kết quả của sự kết hợp của các thông tin nhất quán đến từ tác tử (nhưng mâu thuẫn với các tác tử khác). Ý tưởng là xác định hợp của các tri thức như là lựa chọn tập con nhất quán lớn nhất của việc hợp các cơ sở. Các thuộc tính logic của toán tử kết hợp đã được khảo sát [23] và so sánh với các toán tử tích hợp được xác định trong [9]. Có một số sự khác biệt giữa kết hợp và tích hợp tri thức. Một trong số đó là các phương pháp do Baral và cộng sự

[21, 22] là ở mức cú pháp trong khi toán tử tích hợp tuân theo nguyên tắc không phụ thuộc cú pháp. Một khác biệt nữa là khi toán tử kết hợp được sử dụng, các thông tin về nguồn gốc của cơ sở tri thức được bỏ qua, điều này có nghĩa là không giống như tích hợp, toán tử kết hợp không thể xem xét đến tính lực lượng. Giả sử rằng chúng ta có bốn cơ sở tri thức như sau: K1 “K2 “ ta, bu, K3 “ t a, duvà K4 “ ta, bÑcu. Kết hợp của bốn cơ sở sẽ là ta, a, b, b Ñ c, du và chúng ta sẽ có hai tập con nhất quán lớn nhất là ta, b, b Ñ c, du và t a, b, b Ñ c, du. Điều này có nghĩa là chúng ta không thể quyết định là sẽ chấp nhận a hay a. Tuy nhiên đa số các cơ sở tri thức có chứa a và chỉ duy nhất một cơ sở tri thức có chứa a. Một cách trực quan, a là đúng trong kết quả khi các cơ sở tri thức được đối xử bình đẳng. Tuy nhiên, vì một lý do gì đó mà K3 lại đáng tin cậy hơn các cơ sở tri thức khác, khi đó chúng ta có thể ưu tiên sự kết hợp trong đó a được chấp nhận.

Trọng tài là một toán tử tích hợp tri thức đã được giới thiệu vào đầu những năm 1990. Trái ngược với duyệt tri thức, Revesz xem xét các trường hợp trong đó thông tin mới không được ưu tiên hơn các thông tin cũ. Ví dụ, nếu hai nguồn tin là đáng tin cậy như nhau, chúng ta cần phải tích hợp hai cơ sở chứ không phải là duyệt lại nó bởi các thông tin khác. Vì vậy ông đã giới thiệu toán tử trọng tài (không giống với toán tử duyệt). Liberatore và Schaerf đã đề xuất các tiên đề về trọng tài giữa hai cơ sở tri thức, và các toán tử được đề xuất bởi Revesz chỉ đáp ứng một trong số chúng. Không có phương pháp nào trong số các phương pháp ở trên xem xét mức độ phổ biến của các thông tin cụ thể. Điều này có nghĩa là các toán tử trọng tài không thể nắm bắt được quan điểm đa số. Sau đó, định đề đa số cho tích hợp một số cơ sở tri thức đã được giới thiệu bởi Lin và Mendelzon. Ý tưởng của nó được lấy từ nguyên tắc đa số trong lý thuyết lựa chọn xã hội. Tuy nhiên, các định đề đa số của họ bao gồm khái niệm của hỗ trợ một phần để nắm bắt các đặc trưng của tích hợp tri thức với phiếu bầu và nó không giới hạn số lượng cơ sở hỗ trợ cho mệnh đề a với số lượng của cơ sở có chứa a. Một cơ sở tri thức được xác định là hỗ trợ một phần ký hiệu l nếu có một mệnh đề a không chứa các phần tử xuất hiện trong l, sao cho một trong hai niềm tin của đối tượng l hoặc alà đúng mà không biết là cái nào. Một mô hình lý thuyết mô tả các định đề và các toán tử kết hợp được đưa ra bởi Lin và Mendelzon [19]. Trong các tài liệu về tích hợp tri thức, nguồn gốc của các thông tin thường được giả định là kém tin cậy.

Một tập các định đề mới cho các toán tử tích hợp tri thức đã được phân biệt (đối với các tiên đề nó thỏa mãn) giữa toán tử trọng tài và toán tử đa số đã được giới thiệu bởi Konieczny và Pino Pérez [10]. Trong nghiên cứu của mình các ông đã mở rộng mô hình để bao gồm tích hợp bởi ràng buộc toàn vẹn. Đó là tập hợp các điều kiện áp đặt mà phải thỏa mãn cho tích hợp.

1.2.3.1 Một mô hình cho tích hợp với ràng buộc toàn vẹn

Ràng buộc toàn vẹn đại diện cho các điều kiện bổ sung nên làm khi tích hợp tri thức. Nếu (có thể rỗng) tập các ràng buộc toàn vẹn biểu diễn bởi cơ sở tri thức IC, thì ∆ICpEq biểu diễn kết quả của tích hợp đa tập E của các cơ sở tri thức. Kết quả này sẽ là một cơ sở tri thức nhất quán đại diện cho tập các tri thức bao hàm cả IC.

như sau:

Định nghĩa 1.2.1. (Toán tử tích hợp IC [24]). Cho E, E1, E2 là các hồ sơ tri thức , K1, K2 là các cơ sở tri thức nhất quán, và IC, IC1, IC2 là các ràng buộc toàn vẹn. ∆ là một toán tử tích hợp với ràng buộc toàn vẹn nếu nó thỏa mãn các định đề sau đây: (IC0) ∆ICpEq ( IC.

(IC1) Nếu IC nhất quán, thì ∆ICpEq cũng nhất quán. (IC2) Nếu ^E là nhất quán với IC, thì ∆ICpEq ” ^E ^IC. (IC3) Nếu E1 ”E2 và IC1 ” IC2, thì ∆IC1pE1q ”∆IC2pE2q.

(IC4) Nếu K1 (IC và K2 (IC, thì ∆ICptK1, K2uq ^K1 là nhất quán khi và chỉ khi ∆ICptK1, K2uq ^K2 là nhất quán.

(IC5) ∆ICpE1q ^∆ICpE2q ( ∆ICpE1\E2q.

(IC6) Nếu∆ICpE1q ^∆ICpE2q là nhất quán, thì∆ICpE1\E2q (∆ICpE1q ^∆ICpE2q. (IC7) ∆IC1pEq ^IC2 (∆IC1^IC2pEq.

(IC8) Nếu ∆IC1pEq ^IC2 là nhất quán, thì ∆IC1^IC2pEq (∆IC1pEq ^IC2.

Ý nghĩa trực quan của các thuộc tính này được mô tả như sau: pIC0q đảm bảo rằng các kết quả việc tích hợp tri thức sẽ thỏa mãn các ràng buộc toàn vẹn. pIC1q phát biểu rằng nếu các ràng buộc toàn vẹn là nhất quán thì kết quả của việc tích hợp tri thức cũng sẽ phải nhất quán. pIC2q nói rằng nếu phép hợp của các cơ sở tri thức và các ràng buộc tạo thành một tập tri thức nhất quán thì kết quả của việc tích hợp tri thức đơn giản chính là kết quả của phép hợp này. pIC3q là nguyên tắc không phụ thuộc cú pháp, tức là nếu chúng ta có hai tập các cơ sở tri thức mà mỗi cơ sở tri thức của tập này tương đương với một cơ sở tri thức của tập kia và hai tập ràng buộc toàn vẹn cũng tương đương nhau thì các các kết quả của việc tích hợp tri thức với ràng buộc toàn vẹn cũng tương đương nhau. pIC4q là định đề về tính công bằng, định đề này đòi hỏi khi tích hợp hai cơ sở tri thức, các toán tử tích hợp tri thức phải đối xử đối với các cơ sở tri thức này như nhau.pIC5q thể hiện ý tưởng sau đây: nếu hai nhóm cùng đồng ý về một số lựa chọn thì những lựa chọn này cũng vẫn sẽ được chọn nếu chúng ta nhóm hai nhóm này thành một. pIC5q cùng với pIC6q phát biểu rằng nếu chúng ta có thể chia một tập các cơ sở tri thức thành hai tập con rồi thực hiện tích hợp các tập con đó và tìm được các mô hình chung cho các kết quả tích hợp thì các mô hình này cũng chính là các mô hình của kết quả của việc tích hợp tri thức trong nhóm lớn ban đầu. pIC7q và pIC8qphát biểu về mối quan hệ giữa các ràng buộc nhất quán và kết quả của toán tử tích hợp tri thức.

Hai lớp con của toán tử tích hợp với ràng buộc toàn vẹn đã được xác định.Toán tử đa số IC nhằm mục đích giải quyết mâu thuẫn bằng cách tôn trọng những mong muốn của đa số, trong khi các toán tử trọng tài IC có các hành vi có sự đồng thuận hơn.

Với mỗi số tự nhiên n, En là ký hiệu của đa tập chứa n lần E.

Định nghĩa 1.2.2. [24] Một toán tử đa số IC là một toán tử tích hợp IC thỏa mãn các tiên đề đa số sau đây:

(Maj) Dn∆ICpE1\E2nq (∆ICpE2q

Toán tử này thể hiện một thực tế rằng nếu một ý kiến có đa số người đồng ý, thì nó sẽ là ý kiến chung của cả nhóm.

Một toán tử trọng tài là một toán tử tích hợp IC thỏa mãn những tiên đề trọng tài sau đây: pArbq ∆IC1pK1q ” ∆IC2pK2q ∆IC1ô IC2ptK1,K2uq ” pIC1 ô IC2q IC1 *IC2 IC2 *IC1 , / . / - ñ∆IC1_IC2ptK1,K2uq ” ∆IC1pK1q

(Arb) đảm bảo rằng thế giới có thể trung bình được lựa chọn. Có nghĩa là nếu K1 chắc chắn thích Ahơn B và K2 chắc chắn thíchA hơnC, B và C có vai trò như nhau trong việc tích hợp thì A chắc chắn sẽ được ưu tiên hơn B và C trong kết quả tích hợp [20].

Ví dụ sau đây sẽ giúp chúng ta đánh giá được hành vi khác nhau giữa một toán tử đa số và toán tử trọng tài. Giả sử có ba người cùng bàn với nhau để quyết định mua một món quà tặng sinh nhật cho một cô bạn thân. Giả sử bây giờ có hai trong ba người là muốn mua tặng cô gái một con gấu bông và một chiếc bánh sinh nhật, trong khi người thứ ba lại không muốn đóng góp tiền để mua những món quà đó. Nếu nhóm có quyết định theo đa số, ba người sẽ mua tặng cô gái một con gấu bông và một cái bánh sinh nhật và làm cho người thứ ba rất không hài lòng. Mặt khác, nếu họ chọn toán tử trọng tài thì họ hoặc là sẽ mua gấu bông tặng cô gái hoặc tặng cô một chiếc bánh sinh nhật, điều này sẽ làm cho cả ba người đều không hài lòng. Mọi người đều có một công thức trong cơ sở tri thức của họ mà không được đáp ứng, do đó sự không hài lòng cho mỗi bên là như nhau.

Các toán tử tích hợp có thể được chia làm hai loại: tích hợp ở mức cú pháp và tích hợp ở mức mô hình. Loại thứ nhất có các công thức mệnh đề như thông tin đầu vào và thường xem xét các tập con tối đa nhất quán của hồ sơ tri thức. Trong toán tử tích hợp dựa trên mô hình, nó là sự diễn giải của các công thức được xem là đầu vào cho quá trình tích hợp. Do đó, mỗi cơ sở tri thức được xem như là tập của các mô hình và cú pháp không được đề cập.

1.2.3.2 Tích hợp ở mức cú pháp

Tích hợp ở mức cú pháp (còn gọi là tích hợp dựa trên công thức) toán tử tích hợp làm việc từ ưu tiên các tập con của các công thức nhất quán. Sự khác biệt giữa các toán tử này với các toán tử khác trong việc xác định các mối quan hệ ưu tiên.

Định nghĩa 1.2.3. [24] Cho MAXCONSpK, ICq là tập con nhất quán lớn nhất (đối với tập bao hàm) của K Y tICu có chứa IC. MAXCONSpK, ICq là tập hợp của tất cả các tập M sao cho: • M ĎK Y tICu, và • IC ĎM, và • Nếu M ĂM1 Ď KY tICu, thì M1 ( K

Cho MAXCONSpE, ICq = MAXCONSpŤKiPEKi, ICq. Chúng ta sử dụng chỉ số dưới "card", tức là MAXCONScardpE,ICq để chỉ tập lớn nhất đối với lực lượng.

Định nghĩa 1.2.4. [24] Cho E là một hồ sơ tri thức và IC là một cơ sở tri thức: ∆CIC1pEq “ Ž

MAXCONSpE,ICq. ∆CIC3pEq “ Ž

M :M P MAXCONSpE,Jq và MY tICu là nhất quán. ∆CIC4pEq “ ŽMAXCONScardpE,ICq.

∆CIC5pEq “ ŽM YIC : M P MAXCONSpE,Jq và MYIClà nhất quán, nếu tập không rỗng và là IC trong các trường hợp còn lại.

Toán tử ∆C1 là kết quả của việc kết hợp các tập con nhất quán lớn nhất của EY tICu có chứa các ràng buộc IC. Toán tử ∆C3 đầu tiên tính tập các tập con nhất quán lớn nhất của E, và sau đó sẽ chọn những tập nhất quán với các ràng buộc. Toán tử ∆C4 lựa chọn các tập của các tập con nhất quán củaEY tICucó chứa những ràng buộc IC là tối đa đối với lực lượng.

1.2.3.3 Phương pháp dựa trên khoảng cách

Một toán tử tích hợp dựa trên mô hình sẽ lựa chọn trong số các mô hình của IC những cái mà được ưu tiên nhất, mối quan hệ ưu tiên phụ thuộc vào toán tử mà chúng ta sẽ sử dụng. Đa tập ∆ICpEq là tập của các công thức đúng trong tất cả các mô hình được chọn. Các thông tin được ưu tiên thường có dạng của một thứ tự ưu tiên ďcủa các diễn giải, nó được tạo ra bởi một khái niệm về khoảng cách dgiữa một diễn giải ω và một hồ sơ E, ký hiệu là dpω, Eq. Cần lưu ý rằng một toán tử tích hợp dựa trên khoảng cách không phải luôn luôn tạo ra một kết quả duy nhất.

Chúng ta thấy rằng toán tử đa số được đặc trưng bằng cách cố gắng để giảm thiểu tổng số không hài lòng, trong khi toán tử trọng tài cố gắng giảm thiểu sự không hài lòng của từng đối tượng. Do đó chúng ta có thể thấy khoảng cách như là một cách để nắm bắt những khái niệm về sự không hài lòng. Cũng giống như duyệt tri thức, kết quả của tích hợp nên giữ lại càng nhiều thông tin có thể chấp nhận được từ mỗi cơ sở tri thức Ki càng tốt. Nói cách khác, từ các nguồn thông tin được giả định là kém tin cậy, quá trình tích hợp nên loại bỏ ít nhất thông tin từ các nguồn. Mục đích là lựa chọn các diễn giải có khoảng cách nhỏ nhất giữa mô hình của IC và các mô hình của hồ sơ tri thức E. Nó có thể được xác định như sau:

modp∆ICpEqq “minpmodpICq,ďdq

Định nghĩa 1.2.5. (Khoảng cách [24]) Một khoảng cách giữa các diễn giải là một hàm tổng d từ W ˆW tới N sao cho với mỗi ω1, ω2 P W

• dpω1, ω2q “dpω2, ω1q, và

• dpω1, ω2q “0 khi và chỉ khi ω1 “ω2

Ta thấy, khoảng cách có tính đối xứng, và nếu hai diễn giải là giống hệt nhau thì có khoảng cách bằng 0.

Có hai bước để xác định mô hình IC có khoảng cách nhỏ nhất tới hồ sơ tri thức. Bước đầu tiên, chúng ta sẽ tính khoảng cách giữa mỗi diễn giải đáp ứng IC và mỗi cơ sở tri thức riêng biệt (cá nhân). Ở bước thứ hai, chúng ta tổng hợp tất cả các khoảng cách riêng biệt để xác định khoảng cách chung (tập thể). Đó là khoảng cách của hồ sơ tri thức tới mỗi mô hình của IC. Cuối cùng, (có thể nhiều hơn một) khoảng cách

Một phần của tài liệu (LUẬN văn THẠC sĩ) tích hợp tri thức sử dụng các kỹ thuật tranh cãi (Trang 25 - 36)