1.1.5.2. Logic mệnh đề
Một trong những cách chung nhất để biểu diễn tri thức trong xử lý tri thức và lập luận là sử dụng logic mệnh đề. Logic này được sử dụng trong nhiều ứng dụng để diễn đạt các câu lệnh mà người ta gán giá trị chân lý (đúng/sai) theo các thế giới có thể.
Cú pháp của một logic được xác định bằng các ký hiệu, bao gồm các biến mệnh đề, hằng logic, các phép kết nối logic và các dấu mở ngoặc “(“ và đóng ngoặc “)” của chúng, tức là một tập các luật để kết hợp các ký hiệu với nhau. Tập của tất cả các
9
công thức được xây dựng bằng một cú pháp cùng với tập các quy tắc suy diễn sẽ tạo ra một ngôn ngữ hình thức. Các ngữ nghĩa đưa ra ý nghĩa cho các công thức của ngôn ngữ.
Trong thực tế, nhiều vấn đề tích hợp tri thức có thể được thể hiện và giải quyết bằng cách hình thức hóa dựa trên logic mệnh đề.
a) Cú pháp
Logic mệnh đề, còn được gọi là logic của các mệnh đề hoặc logic tính toán, xem xét các ký hiệu của các biến, đại diện cho các sự kiện, chỉ có thể là đúng hoặc
sai. Các ký hiệu này là cơ sở cú pháp của logic mệnh đề và chúng được gọi là các biến mệnh đề.
Cú pháp của logic mệnh đề gồm tập các ký hiệu và tập các luật xây dựng công thức. Một cách chính xác, một thế giới có thể là một cách gán cho mỗi ký hiệu mệnh đề một giá trị chân lý Đúng (𝑇𝑟𝑢𝑒) hoặc Sai (𝐹𝑎𝑙𝑠𝑒). Trong một thế giới có thể, nếu kí hiệu mệnh đề 𝑃 được gán giá trị chân lý 𝑇𝑟𝑢𝑒/𝐹𝑎𝑙𝑠𝑒 thì ta nói mệnh đề 𝑃 tương ứng là đúng/sai trong thế giới có thể đó. Trong một thế giới có thể, ý nghĩa của các câu phức hợp được xác định bằng ý nghĩa của các kết nối logic, xác định ý nghĩa của các kết nối logic trong các bảng chân lý.
Một ngôn ngữ mệnh đề ℒ được xác định từ một tập hữu hạn các biến mệnh đề 𝒫 và các hằng số ⊺ và ⊥ tương ứng với hai giá trị là tuyệt đối đúng 𝑃𝑙𝑎𝑢𝑠𝑖𝑏𝑖𝑙𝑖𝑡𝑦 và tuyệt đối sai 𝑇𝑎𝑢𝑡𝑜𝑙𝑜𝑔𝑦. Ký hiệu Ω là tập các thế giới có thể, trong đó mỗi thế giới có thể là một hàm từ 𝒫 vào {𝑇𝑟𝑢𝑒, 𝐹𝑎𝑙𝑠𝑒}.
Các công thức mệnh đề thường được biểu diễn bằng các ký tự Hy lạp thường: 𝜙, 𝜓, 𝜑, 𝜇, …
Một công thức mệnh đề là ở dạng chuẩn hội (CNF – Conjunctive Normal Form) nếu nó là một hội của tuyển các mệnh đề. Một công thức là dạng chuẩn tuyển (DNF – Disjunctive Normal Form) nếu nó là một tuyển của hội các mệnh đề.
10
Ngữ nghĩa của logic được định nghĩa tử khái niệm thế giới có thể. Ngữ nghĩa của ngôn ngữ cho phép ta xác định ý nghĩa của các câu trong một miền nào đó của thế giới thực. Điều đó được thực hiện bằng cách kết hợp mỗi ký hiệu mệnh đề với sự kiện nào đó trong thế giới thực. Chẳng hạn, trong ngôn ngữ các biểu thức logic, dãy ký hiệu (𝑥 ∧ 𝑦) ∨ 𝑧 là một câu viết đúng cú pháp. Ngữ nghĩa của ngôn ngữ này cho phép ta hiểu rằng, nếu 𝑥, 𝑦 và 𝑧 là các biến logic thì công thức trên có giá trị bằng cách lấy 𝑥 hội với 𝑦 rồi sau đó lấy tuyển với 𝑧.
Xem xét định nghĩa hình thức của khái niệm này trong ngữ cảnh logic mệnh đề như sau: Cho ℒ𝒫 là một ngôn ngữ logic mệnh đề xây dựng trên một tập hữu hạn 𝒫 của các biến mệnh đề cùng với tập các liên kết logic cũng như các hằng số ⊺ và ⊥.
Định nghĩa 1.3. Thế giới có thể 𝜔 trong ngôn ngữ ℒ𝒫 là một hàm ánh xạ một tập 𝒫 của các biến mệnh đề đến tập của các giá trị chân lý {⊺, ⊥}.
Ký hiệu Ω biểu diễn cho tập tất cả các thế giới có thể trong ngôn ngữ ℒ𝒫.
Định nghĩa 1.4. Một thế giới có thể 𝜔 trên 𝒫 thường được ký hiệu là một vecto của các giá trị 0 và 1 trong đó việc đánh giá từng biến mệnh đề của 𝒫 được gán cho một giá trị duy nhất. Giá trị 0 chỉ ra rằng biến mệnh đề trong thế giới có thể 𝜔 được đánh giá là 𝐹𝑎𝑙𝑠𝑒 và 1 trong trường hợp ngược lại.
Tập của tất cả các thế giới có thể trên 𝒫 ký hiệu là Ω𝒫.
Ví dụ 1.2. Thế giới có thể 𝜔 = 0110 trên 𝒫 = {𝑎, 𝑏, 𝑐, 𝑑} được xác định 𝜔(𝑏) = 𝜔(𝑐) = 𝑇𝑟𝑢𝑒 và 𝜔(𝑎) = 𝜔(𝑑) = 𝐹𝑎𝑙𝑠𝑒. Cách biểu diễn trên và cách biểu diễn dưới đây là như nhau 𝜔 = ¬𝑎𝑏𝑐¬𝑑.
Một mô hình của công thức 𝜙 là một thế giới có thể𝜔 làm cho 𝜙 đúng, ký hiệu là 𝜔 ⊢ 𝜙. Cho Φ là tập các công thức mệnh đề, [Φ] biểu diễn tập các mô hình của Φ, nghĩa là [Φ] = {𝜔 ∈ Ω|∀𝜙 ∈ Φ, 𝜔 ⊢ 𝜙}. Ký hiệu [𝜙] để thay thế cho [{𝜙}] và ký hiệu ⊢ biểu diễn mối quan hệ hệ quả, ví dụ: {𝜙, 𝜓} ⊢ 𝜃 nghĩa là 𝜃 là hệ quả logic của {𝜙, 𝜓}, hay [{𝜙, 𝜓}] ⊆ [𝜃].
11
Định nghĩa 1.5. Một tập các CSTT 𝐸 của 𝑛 CSTT là một đa tập (multi-set – tập có thể có các phần tử giống nhau) 𝐸 = {𝐾1, … , 𝐾𝑛} và được gọi là hồ sơ tri thức (knowledge profile). Một số CSTT trong 𝐸 có thể tương đương logic với nhau.
Hai CSTT 𝐾 và 𝐾′ được gọi là tương đương logic, ký hiệu 𝐾 ≡ 𝐾′, khi và chỉ khi ∀𝜙 ∈ 𝐾, 𝐾′ ⊢ 𝜙 và ngược lại. Một hồ sơ tri thức 𝐸′ = {𝐾1′, … . , 𝐾𝑛′} là tương đương logic với một hồ sơ tri thức 𝐸 = {𝐾1, … . , 𝐾𝑛}, ký hiệu 𝐸 ≡ 𝐸′, khi và chỉ khi tồn tại một hoán vị 𝜎 trên tập {1, … . , 𝑛} sao cho 𝐾𝑖 ≡ 𝐾𝜎(𝑖)′ với mọi 𝑖 = 1, … , 𝑛. Hợp của hai hồ sơ tri thức 𝐸 và 𝐸′ cũng là một hồ sơ tri thức, ký hiệu 𝐸 ⊔ 𝐸′ = {𝐾1, … , 𝐾𝑛, 𝐾1′, … , 𝐾𝑛′}.
Với CSTT 𝐾 = {𝜙1, … , 𝜙𝑚}, ký hiệu ⋀K = ˄𝑖=1𝑚 𝜙𝑖, tương tự ∧ E = ˄𝑖=1𝑛 (˄𝐾𝑖). Một CSTT 𝐾 là nhất quán khi và chỉ khi ∀𝜙 ∈ 𝐾, ∃𝜔 ∈ Ω sao cho 𝜔 ⊢ 𝜙.
Cho 𝐾 là tập các công thức, bao đóng quan hệ hệ quả của 𝐾, ký hiệu là 𝐶𝑛(𝐾), là một tập 𝐶𝑛(𝐾) = {𝜙 ∈ ℒ𝒫 | 𝐾 ⊢ 𝜙}.
1.1.5.3. Logic khả năng
Lý thuyết khả năng, được Zadeh [19] giới thiệu và sau đó được Dubois và Prade [20] và nhiều nhà nghiên cứu khác phát triển, là một khung rất tự nhiên để xử lý vấn đề không chắc chắn về định tính và thứ tự. Nó liên quan đến tri thức phi xác suất và đặc biệt thích hợp khi tỉ lệ không chắc chắn chỉ phản ánh mối quan hệ ưu tiên giữa các phần tri thức khác nhau.
Luận án này tập trung vào lý thuyết khả năng [21, 22], được nhiều nhà tin học coi là một trong những lý thuyết có nhiều triển vọng nhất được lựa chọn để xây dựng các hệ chuyên gia, hệ trợ giúp quyết định trên những tri thức được biết không chắc chắn, không đầy đủ.
Ở mức độ cú pháp, một công thức (hay tri thức) khả năng là một cặp (𝜙, 𝑎) trong đó 𝜙 là một công thức mệnh đề và 𝑎 ∈ [0, 1]. Cặp (𝜙, 𝑎) có nghĩa là mức độ chắc chắn của 𝜙 ít nhất bằng 𝑎, (𝑁(𝜙) ≥ 𝑎). Phần tri thức không chắc chắn có thể biểu diễn bằng một CSTTKN là một tập hữu hạn các công thức có dạng 𝐵 =
12
{(𝜙𝑖, 𝑎𝑖)|𝑎𝑖 > 0, 𝑖 = 1, … , 𝑛}. Ký hiệu 𝐵∗là CSTT mệnh đề được liên kết với 𝐵, cụ thể nó là các CSTT thu được từ 𝐵 bằng cách loại bỏ đi các trọng số của công thức, tức là 𝐵∗= {𝜙𝑖|(𝜙𝑖, 𝑎𝑖) ∈ 𝐵}. Người ta nói rằng CSTTKN 𝐵 là nhất quán khi và chỉ khi 𝐵∗ là nhất quán [23].
Việc suy diễn trong logic khả năng được thực hiện theo các quy tắc được nêu trong định nghĩa dưới đây.
Định nghĩa 1.6. (Suy diễn trong logic khả năng)
Cho 𝜑 và 𝜓 là các công thức mệnh đề và 𝑝, 𝑝′ ∈ [0,1]. Ta có các luật suy diễn sau: 1) Fusion: {(𝜑, 𝑝), (𝜑, 𝑝′)} ⊢ (𝜑, max(𝑝, 𝑝′));
2) Weakening: (𝜑, 𝑝) ⊢ (𝜑, 𝑝′) nếu 𝑝 ≥ 𝑝′; 3) Modus Ponens: {(𝜑 → 𝜓, 𝑝), (𝜑, 𝑝)} ⊢ (𝜓, 𝑝);
Từ định nghĩa trên ta dễ dàng có được thêm luật suy diễn sau:
4) Luật ModusPonens mở rộng: {(𝜑 → 𝜓, 𝑝), (𝜑, 𝑝′)} ⊢ (𝜓, 𝑚𝑖𝑛 (𝑝, 𝑝′)). Luật Modus Ponens mở rộng được ứng dụng rộng rãi trong các hệ suy diễn dựa trên logic khả năng.
Ở mức độ ngữ nghĩa LKN dựa trên khái niệm của một hàm phân bố khả năng (possibility distribution) ký hiệu bằng 𝜋, là một ánh xạ từ Ω vào [0, 1] để đại diện cho tri thức sẵn có, ở đây Ω là tập tất cả các thế giới có thể (hay tập các thể hiện) được xác định từ các công thức mệnh đề trong 𝐵∗. 𝜋(𝜔) = 1 có nghĩa là hoàn toàn có thể cho 𝜔 là một thế giới thực (hoặc 𝜔 thỏa mãn hoàn toàn), 1 > 𝜋(𝜔) > 0 có nghĩa 𝜔 chỉ đáp ứng (hoặc thỏa mãn) được một phần, trong khi 𝜋(𝜔) = 0 có nghĩa 𝜔 chắc chắn không phải là một thế giới thực (hoặc không đáp ứng tất cả).
Từ một hàm phân bố khả năng 𝜋 ta có thể xác định được mức độ khả năng (tính hợp lý) của công thức 𝜙 ký hiệu là ∏(𝜙) = max {𝜋(𝜔)|𝜔 ∈ Ω, 𝜔 ⊨ 𝜙}. Đó là mức độ đòi hỏi của công thức 𝜙 đối với những tri thức sẵn có và mức độ chắc chắn (sự cần thiết (necessary)) của mỗi công thức 𝜙: 𝑁(𝜙) = 1 − ∏(¬𝜙). 𝑁(𝜙) = 1 có nghĩa
13
phần tri thức đối với 𝜙 là hoàn toàn chắc chắn, trong khi 𝑁(𝜙) = 0 thể hiện không có tri thức đối với 𝜙 nhưng không có nghĩa là 𝜙 sai.
Cho một CSTTKN 𝐵, nói chung có thể có nhiều phân bố khả năng thỏa mãn CSTT này, nhưng có một phân bố khả năng đặc biệt, là phân bố khả năng đặc tả ít nhất (ký hiệu là 𝜋𝐵) được xác định như sau:
Định nghĩa 1.7. [23]Với ∀𝜔 ∈ Ω,
𝜋𝐵(𝜔) = { 1 nếu ∀(𝜙𝑖, 𝑎𝑖) ∈ 𝐵, 𝜔 ⊨ 𝜙𝑖
1 − 𝑚𝑎𝑥{𝑎𝑖: (𝜙𝑖, 𝑎𝑖) ∈ 𝐵 và ω ⊭ 𝜙𝑖} ngược lại (1.1) Khi đó CSTTKN 𝐵 là nhất quán khi và chỉ khi tồn tại thế giới có thể 𝜔 sao cho 𝜋𝐵(𝜔) = 1.
Định nghĩa 1.8. [24] (a-cut và strict a-cut) Cho 𝐵 là CSTTKN và 𝑎 ∈ [0, 1], ta gọi a- cut (tương ứng strict a-cut) của 𝐵, ký hiệu là 𝐵≥𝑎 (tương ứng 𝐵>𝑎) là tập của các công thức mệnh đề trong 𝐵 có mức độ chắc chắn ít nhất bằng 𝑎:
𝐵≥𝑎 = {𝜙 ∈ ℬ𝑛(𝐵)|(𝜙, 𝑏) ∈ 𝐵, 𝑏 ≥ 𝑎} (1.2) (tương ứng lớn hơn 𝑎, 𝐵>𝑎 = {𝜙 ∈ ℬ𝑛(𝐵)|(𝜙, 𝑏) ∈ 𝐵, 𝑏 > 𝑎}) (1.3)
Định nghĩa 1.9. [24] Cho 𝐵1 và 𝐵2 là hai CSTTKN. 𝐵1 và 𝐵2 được gọi là tương đương, ký hiệu 𝐵1 ≡ 𝐵2 nếu 𝜋𝐵1 = 𝜋𝐵2.
Sự tương đương của hai CSTTKN cũng có thể xác định như sau:
𝐵1 ≡ 𝐵2 nếu (𝐵1)≥𝑎 ≡ (𝐵2)≥𝑎 với ∀𝑎 ∈ [0,1]. (1.4)
Định nghĩa 1.10. [24] Mức độ không nhất quán (Inconsistency degree) của CSTTKN 𝐵 được xác định như sau:
𝐼𝑛𝑐(𝐵) = max {𝑎𝑖: 𝐵≥𝑎𝑖 là không nhất quán} (1.5) = max {𝑎𝑖: (⊥, 𝑎𝑖) }
Mức độ không nhất quán của 𝐵 là trọng số lớn nhất 𝑎𝑖 sao cho 𝑎𝑖–cut của 𝐵 là không nhất quán. Khi 𝐼𝑛𝑐(𝐵) = 0 thì 𝐵 là nhất quán.
14
1.1.6. Logic khả năng biểu trưng
Tương tự như LKN, trong LKNBT [25], mỗi công thức khả năng biểu trưng có dạng (𝜙𝑖, 𝑎𝑖) ở đây 𝜙𝑖 là công thức mệnh đề, trong khi 𝑎𝑖 là một ký hiệu. Trong tập ký hiệu không có quan hệ thứ tự toàn phần mà chỉ có thứ tự từng phần.
Định nghĩa 1.11 (Phân bố không khả năng biểu trưng) [25]: Giả sử 𝐵 = {(𝜙𝑖, 𝑎𝑖): 𝑖 = 1, … , 𝑛} là một CSTTKN biểu trưng. Phân bố không khả năng đặc biệt 𝜏𝐵 đặc trưng cho CSTT này được xác định như sau:
∀𝜔 ∈ Ω, 𝒯𝐵(𝜔) = { 𝑚𝑎𝑥𝑗:𝜙𝑗∉𝐵(𝜔)𝑎𝑗
0, 𝑛ế𝑢 𝐵(𝜔) = 𝐵∗sao cho 𝐵(𝜔) = {𝜙 ∈ 𝐵
∗: 𝜔 ⊢ 𝜙} (1.6) và độ đo cần thiết 𝑁𝐵 tương ứng với phân bố này là:
𝑁𝐵(𝜙𝑖) = 𝑚𝑖𝑛𝜔∉[𝜙𝑖]𝒯𝐵(𝜔) = 𝑚𝑖𝑛𝜔∉𝜙𝑖𝑚𝑎𝑥𝑗:𝜙𝑗∉𝐵(𝜔)𝑎𝑗 (1.7) ở đây [𝜙𝑖] = {𝜔 ∈ Ω: 𝜔 ⊢ 𝜙𝑖}.
Trong LKNBT không có thuật ngữ "1 -", do đó công thức xác định phân bố không khả năng 𝒯𝐵(𝜔) theo công thức (1.6) để phù hợp với bối cảnh này. Khi đó, 𝒯𝐵 không phải là phân bố khả năng 𝒯𝐵(𝜔), vì thế nó được gọi là phân bố không khả năng biểu trưng.
1.2. Tích hợp các CSTT
1.2.1. Khái niệm tích hợp CSTT
Định nghĩa 1.12. Tích hợp CSTT là quá trình xây dựng một CSTT chung “tốt nhất” từ nhiều CSTT thành phần.
Do các CSTT thành phần 𝐵1, … , 𝐵𝑛 có thể không nhất quán với nhau thậm chí bản thân mỗi CSTT ấy cũng có thể không nhất quán, cơ sở tri thức chung “tốt nhất” cần phải là CSTT nhất quán, hơn nữa nó cần phải thỏa mãn những tính chất logic nào đó có tính chất tiên đề và thường được gọi là các định đề.
15
1.1.2.1. Duyệt tri thức
Thông tin hàng ngày được thu thập và được biến thành các hiểu biết. Sau đó nó được sử dụng để dự báo hoặc suy diễn nhằm tạo ra một số tri thức mới, chưa từng xảy ra. Vấn đề ở đây là đã có một số tri thức rồi và đã tạo ra những hiểu biết về chúng. Tuy nhiên đến một thời điểm nào đó lại biết thêm một số tri thức mới. Tri thức mới này có thể mâu thuẫn với những gì đã được biết trước đây [26]. Điều này dẫn đến phải thay đổi những gì chúng ta đã biết để phù hợp với tri thức mới tiếp nhận được [27]. Duyệt tri thức chủ yếu nhằm đối phó với những tình huống như vậy.
Duyệt tri thức là một lĩnh vực nghiên cứu được bắt đầu từ những năm 1980. Duyệt tri thức xảy ra khi một tri thức mới được thêm vào hệ thống không nhất quán với hệ thống tri thức hiện tại (hay CSDL). Có ba kiểu duyệt tri thức chính tương ứng với 3 phương pháp thay đổi tri thức như sau:
i) Phương pháp nới rộng (Expansion): Một tri thức mới 𝜙 được thêm vào hệ thống tri thức 𝐾 cùng với hệ quả logic của nó (bất chấp tập tri thức mới tạo ra có nhất quán hay không). Hệ thống tri thức mà hệ quả suy ra từ 𝐾 nới rộng với tri thức 𝜙 được biểu thị bằng 𝐾 + 𝜙.
ii) Phương pháp xét lại (Revision): Khi một tri thức mới 𝜙 được thêm vào mà không nhất quán với hệ thống tri thức 𝐾, để duy trì tính nhất quán trong hệ thống, một số tri thức cũ trong 𝐾 bị xóa. Kết quả xét lại 𝐾 bởi tri thức 𝜙 được biểu thị 𝐾 ∔ 𝜙.
iii) Phương pháp co (Contraction): Co một tri thức 𝜙 cùng tất cả các thành phần có thể suy diễn ra 𝜙 trong 𝐾. Kết quả co 𝜙 trong 𝐾 được ký hiệu là 𝐾 ∸ 𝜙.
1.1.2.2. Tích hợp tri thức
Tích hợp CSTT có mối liên kết chặt chẽ với duyệt tri thức. Tuy nhiên trong tích hợp CSTT, các CSTT được đối xử “bình đẳng” hơn, tức là không có CSTT nào được ưu tiên vượt trội so với các CSTT khác. Tích hợp CSTT cũng liên quan đến lý thuyết Lựa chọn xã hội. Trong lý thuyết Lựa chọn xã hội, có một nhóm cử tri (hoặc các tác
16
tử) và mỗi cử tri đề xuất một thứ tự ưu tiên cho một loạt các lựa chọn ứng viên. Nhiệm vụ chính của lý thuyết Lựa chọn xã hội là nghiên cứu cách xác định quy tắc bỏ phiếu, đó là một hàm để ánh xạ một tập hợp các thứ tự ưu tiên thành một lựa chọn hoặc một tập hợp các lựa chọn ứng viên. Liên quan đến lý thuyết Lựa chọn xã hội, có hai bài toán tích hợp nổi tiếng: bài toán Xếp hạng lựa chọn [28] [29] [30]và bài toán Bầu cử
[29] [30] [31].
Có một số khác biệt giữa kết hợp và tích hợp tri thức. Chẳng hạn phương pháp tích hợp tri thức do Baral và cộng sự đề xuất [32] [33] ở mức cú pháp, các toán tử tích hợp tuân theo nguyên tắc không phụ thuộc cú pháp trong khi kết hợp tri thức không thể thực hiện được nguyên tắc này. Một khác biệt nữa là khi toán tử kết hợp được sử dụng, các tri thức về nguồn gốc của CSTT được bỏ qua, điều này không giống như tích hợp tri thức, các toán tử tích hợp không thể xem xét đến lực lượng của các CSTT.
Ví dụ 1.3. Giả sử rằng có 4 CSTT như sau:
𝐾1 = 𝐾2 = {𝑎, 𝑏}, 𝐾3 = {¬𝑎, 𝑑} và 𝐾4 = {𝑎, 𝑏 → 𝑐}.
Kết hợp của bốn cơ sở sẽ là {𝑎, ¬𝑎, 𝑏, 𝑏 → 𝑐, 𝑑} và sẽ có hai tập con nhất quán lớn nhất là {𝑎, 𝑏, 𝑏 → 𝑐, 𝑑} và {¬𝑎, 𝑏, 𝑏 → 𝑐, 𝑑}. Điều này có nghĩa là không thể quyết định là sẽ chấp nhận 𝑎 hay ¬𝑎. Tuy nhiên đa số các CSTT có chứa 𝑎 và chỉ duy nhất có một CSTT có chứa ¬𝑎. Do đó, một cách trực quan, 𝑎 nên được chấp nhận đúng trong kết quả tích hợp các CSTT khi các CSTT được đối xử bình đẳng. Tuy nhiên, nếu vì một lý do nào đó mà 𝐾3 lại đáng tin cậy hơn các CSTT khác, khi đó có thể ưu tiên để ¬𝑎 được chấp nhận trong kết quả tích hợp.
Trong nghiên cứu của Konieczny và Pino Perez [27] [34], các tác giả đã đề xuất