Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 130 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
130
Dung lượng
1,26 MB
Nội dung
LỜI CAM ĐOAN Tôi xin cam đoan công trình nghiên cứu tơi thực hướng dẫn PGS TS Hoàng Hữu Hạnh Những nội dung cơng trình cơng bố chung với tác giả khác đồng ý đồng tác giả đưa vào luận án Các số liệu kết nghiên cứu trình bày luận án trung thực, khách quan chưa công bố tác giả cơng trình khác Nghiên cứu sinh Nguyễn Văn Trung i LỜI CẢM ƠN Luận án thực hoàn thành Khoa Công nghệ Thông tin, Trường Đại học Khoa học, Đại học Huế Trong suốt trình học tập thực luận án, nhận nhiều quan tâm, động viên, giúp đỡ thầy giáo hướng dẫn, thầy cô giáo Khoa Công nghệ Thơng tin, Phịng Đào tạo Sau đại học Ban giám hiệu Trường Đại học Khoa học Tôi xin bày tỏ lịng biết ơn sâu sắc đến PGS TS Hồng Hữu Hạnh người thầy tận tình hướng dẫn, động viên truyền đạt kinh nghiệm quý báu nghiên cứu khoa học để tơi hồn thành luận án Tôi xin chân thành cảm ơn quý thầy cô giáo Khoa Công nghệ Thông tin tạo điều kiện thuận lợi công tác để hồn thành cơng việc nghiên cứu Tôi xin cảm ơn quý thầy cô cán Phòng Đào tạo Sau đại học, Ban giám hiệu Trường Đại học Khoa học giúp đỡ việc hồn thành kế hoạch học tập Tơi xin trân trọng cảm ơn quý thầy cô giáo Hội đồng Khoa học Khoa Công nghệ Thông tin đọc đưa góp ý xác đáng cho luận án Tôi xin trân trọng cảm ơn quý thầy cô giáo anh chị đồng nghiệp Khoa Công nghệ Thông tin giúp đỡ, chia sẻ q trình cơng tác, học tập, nghiên cứu thực luận án Cuối xin cảm ơn người thân gia đình ln ủng hộ, chia sẻ khó khăn suốt q trình học tập, nghiên cứu thực luận án Nghiên cứu sinh Nguyễn Văn Trung ii MỤC LỤC Lời cam đoan i Lời cảm ơn ii Mục lục iii Danh mục từ viết tắt, thuật ngữ v Danh mục ký hiệu vi Danh mục bảng, biểu vii Danh mục hình vẽ viii Mở đầu Chương TỔNG QUAN VỀ XỬ LÝ TRI THỨC KHÔNG NHẤT 1.1 1.2 QUÁN TRONG ONTOLOGY Ontology tri thức không quán Khung lập luận với ontology không quán sử dụng chiến lược phát 9 triển tuyến tính tập tiên đề diễn giải 1.2.1 Các khái niệm 1.2.2 Hàm chọn 1.2.3 Phép suy luận không chuẩn sử dụng hàm chọn đơn điệu 1.2.4 Phép suy luận không chuẩn sử dụng hàm chọn dựa liên 15 15 19 20 quan cú pháp Các nghiên cứu liên quan đến khung lập luận với ontology không 23 1.2.5 quán sử dụng chiến lược mở rộng tuyến tính tập tiên đề diễn giải Xử lý tri thức không quán q trình tích hợp ontology theo 28 phương pháp đồng thuận 1.3.1 Hồ sơ xung đột 1.3.2 Sự không quán tri thức 1.3.3 Hàm đồng thuận 1.3.4 Các nghiên cứu liên quan xử lý không quán tri thức 32 32 33 40 q trình tích hợp ontology phương pháp đồng thuận 1.4 Tiểu kết Chương Chương SUY LUẬN VỚI ONTOLOGY KHÔNG NHẤT QUÁN SỬ 44 46 1.3 DỤNG HÀM CHỌN DỰA TRÊN ĐỘ LIÊN QUAN NGỮ 2.1 NGHĨA Khoảng cách ngữ nghĩa hai khái niệm ontology iii 47 48 2.2 Khoảng cách ngữ nghĩa hai biểu thức khái niệm theo ontology tham 2.3 2.4 chiếu Khoảng cách ngữ nghĩa hai tiên đề theo ontology tham chiếu Suy luận với ontology không quán sử dụng hàm chọn dựa khoảng cách ngữ nghĩa 2.5 Thực nghiệm đánh giá kết 2.6 Tiểu kết Chương Chương XỬ LÝ XUNG ĐỘT MỨC KHÁI 53 55 NIỆM TRONG Q 61 67 71 TRÌNH TÍCH HỢP ONTOLOGY Mơ hình tích hợp tri thức dựa lý thuyết đồng thuận Các mức xung đột q trình tích hợp ontology Xử lý xung đột mức khái niệm q trình tích hợp ontology Vấn đề xây dựng hàm đánh giá khoảng cách cho miền giá trị 72 72 75 78 thuộc tính 3.4.1 Hàm đánh giá khoảng cách hai biểu thức khái niệm 3.4.2 Hàm đánh giá khoảng cách hai khoảng liệu 3.5 Tiểu kết Chương Chương XỬ LÝ XUNG ĐỘT MỨC TIÊN ĐỀ TRONG Q TRÌNH 85 85 86 93 TÍCH HỢP ONTOLOGY Mơ hình xử lý xung đột tri thức cấp độ cú pháp 4.1.1 Bài tốn tìm đồng thuận công thức hội tiêu chuẩn 94 95 cho đồng thuận 4.1.2 Phân tích tiêu chuẩn đồng thuận 4.1.3 Thuật toán xác định đồng thuận 4.2 Xử lý xung đột mức tiên đề q trình tích hợp ontology 4.3 Tiểu kết Chương KẾT LUẬN DANH MỤC CÁC CƠNG TRÌNH CỦA TÁC GIẢ LIÊN QUAN ĐẾN 98 100 109 115 119 120 LUẬN ÁN TÀI LIỆU THAM KHẢO 122 123 3.1 3.2 3.3 3.4 4.1 iv DANH MỤC TỪ VIẾT TẮT, THUẬT NGỮ Từ viết tắt, thuật ngữ ODP Diễn giải Over-determined Processing Quy trình xử lý xác định OWL Ontology Web Language Ngôn ngữ ontology dùng cho Web W3C World Wide Web Consortium Tổ chức tiêu chuẩn quốc tế World Wide Web Conflict profile Hồ sơ xung đột Consensus theory Lý thuyết đồng thuận Data property Thuộc tính liệu Domain Miền xác định (của thuộc tính) Object property Thuộc tính đối tượng Open World Assumption Giả thiết giới mở Range Miền giá trị (của thuộc tính) Semantic wiki Wiki ngữ nghĩa v DANH MỤC KÝ HIỆU Ký hiệu Diễn giải ý nghĩa O Ontology Σ Ontology không quán Σ0 , Σ00 Ontology quán với tiên đề chọn từ ontology không quán khác |≈ Phép suy luận không chuẩn |≈Syn Phép suy luận không chuẩn sử dụng hàm chọn dựa độ liên quan cú pháp |≈O Phép suy luận không chuẩn sử dụng hàm chọn dựa khoảng cách ngữ nghĩa ontology tham chiếu O R, S Các tên vai trị, thuộc tính A, B Các tên cá thể DPO (C) Tập khái niệm cha trực tiếp khái niệm ontology DCO (C) Tập khái niệm trực tiếp khái niệm ontology LCPO (C, D) Tập khái niệm cha chung tối thiểu hai khái niệm ontology C, D Các tên khái niệm CE , CE Các biểu thức khái niệm DR1 , DR2 Các khoảng liệu DT Kiểu liệu U Tập vũ trụ X, Y Các hồ sơ xung đột P1a , P1b Các tiêu chuẩn cho hàm quán T1 , T2 Các tiêu chuẩn cho tri thức tích hợp H1 , H2 Các tiêu chuẩn cho công thức hội vi DANH MỤC BẢNG, BIỂU Bảng 1.1 Tính thoả tiêu chuẩn số hàm quán thông dụng 40 Bảng 2.1 Các tiên đề biểu thức khái niệm Bảng 2.2 Các tiên đề thuộc tính đối tượng Bảng 2.3 Các tiên đề thuộc tính liệu, định nghĩa kiểu liệu, khoá 58 59 biểu thức khái niệm, phát biểu kiện Bảng 2.4 Các ontology thực nghiệm Bảng 2.5 So sánh theo số lượng kết xác định truy Bảng 2.6 So sánh phát triển tập tiên đề diễn giải 60 68 69 69 Bảng 3.1 Cấu trúc khái niệm Course ontology 91 vấn Bảng 4.1 Ví dụ cơng thức hội tác tử mơ tả tính chất thuộc tính hasSpouse 96 Bảng 4.2 Trạng thái tri thức tác tử cho toán minh hoạ 114 vii DANH MỤC HÌNH VẼ Hình 1.1 Hình 1.2 Hình 1.3 Hình 1.4 Hình 1.5 Truy vấn với ontology không quán Chiến lược mở rộng tuyến tính [21] Sơ đồ áp dụng hàm đồng thuận Trích dẫn ontology tham chiếu OREF −T REE Trích dẫn ontology chuyên gia 13 21 43 44 45 Hình 2.1 Cây phân cấp khái niệm minh hoạ Hình 2.2 Ontology tham chiếu O 50 65 viii MỞ ĐẦU Tính cấp thiết đề tài Năm 2001, Tim Berners Lee cộng đưa phác thảo cho “dạng thức nội dung web mà dạng thức có ý nghĩa máy tính” [4] Thế hệ web sử dụng dạng thức nội dung – gọi Web ngữ nghĩa (Semantic Web) – cho phép máy tính “hiểu” tri thức lưu trữ, theo chia sẻ tái sử dụng sở tri thức hệ thống thông tin thuộc nhiều lĩnh vực khác So với Web – kho tài liệu liên kết với – Web ngữ nghĩa tảng liệu mà thơng tin lưu dạng định nghĩa tường minh, cho phép máy tính người làm việc [4] Web ngữ nghĩa lĩnh vực nghiên cứu phát triển nhanh nhận quan tâm cộng đồng nghiên cứu thập niên vừa qua Công nghệ Web ngữ nghĩa áp dụng vào nhiều lĩnh vực khác thực tế tin-sinh học, tin học y tế, quản trị tri thức, công nghệ phần mềm, Thành phần quan trọng ứng dụng web ngữ nghĩa ontology Trong ontology người ta định nghĩa thực thể (bao gồm khái niệm, thuộc tính, cá thể) mối quan hệ thực thể theo ngữ nghĩa quy định tường minh ngôn ngữ logic xác định Ngôn ngữ ontology sử dụng phổ biến chuẩn hoá tổ chức tiêu chuẩn quốc tế W3C (World Wide Web Consortium) OWL, xây dựng dựa logic mô tả: Phiên OWL (được giới thiệu vào năm 2004) dựa logic mô tả SHOIN (D), phiên thứ hai OWL (được giới thiệu vào năm 2009) dựa logic mô tả SROIQ(D) Các tác vụ lập luận với ontology OWL – bao gồm kiểm tra tính quán truy vấn tri thức không phát biểu tường minh ontology – cài đặt lập luận RACER [15], FaCT+ [59], Pellet [56], HermiT [36], Danh sách đầy đủ lập luận dùng với ontology OWL tổ chức W3C cập nhật thường xuyên địa https://www.w3.org/2001/sw/wiki/OWL/Implementations Theo [13], vấn đề quan trọng Web ngữ nghĩa phải xử lý tri thức không quán ontology Điều bắt nguồn từ đặc điểm xây dựng sử dụng ontology ứng dụng Web ngữ nghĩa: Đặc tính mở rộng, chia sẻ, tái sử dụng, phân tán đa người dùng tiềm ẩn khả làm xuất tri thức không quán ontology [22] Trên thực tế, ontology không quán, truy vấn khơng có nghĩa [26] Điều tiên đề hệ logic ontology khơng qn Nói cách khác, không quán làm ý nghĩa sử dụng ontology ứng dụng Web ngữ nghĩa Chính vậy, xử lý tri thức khơng qn ontology tốn quan trọng, có ý nghĩa thực tiễn cộng đồng khoa học máy tính quan tâm nghiên cứu Động lực nghiên cứu cách tiếp cận nghiên cứu luận án Các phương pháp xử lý tri thức không quán ontology phân làm hai nhóm: (1) nhóm phương pháp chấp nhận tồn tri thức khơng qn ontology, (2) nhóm phương pháp tìm cách loại bỏ tri thức không quán khỏi ontology: (1) Các giải pháp thuộc nhóm thứ – chấp nhận tồn tri thức không quán ontology Một số tiếp cận thuộc nhóm định nghĩa logic mô tả với ngữ nghĩa nửa quán xây dựng ontology dựa logic [31, 32, 38, 50] Tác vụ truy vấn với ontology dựa logic nửa quán sử dụng lập luận dành cho logic mô tả xây dựng nên OWL (bằng cách chuyển toán lập luận logic toán lập luận logic mô tả OWL) Việc sử dụng logic với ngữ nghĩa nửa quán để xây dựng ontology, tạo mơ hình biểu diễn tri thức tồn diện lại khó triển khai thực tế tính phổ biến ngơn ngữ ontology chuẩn hoá khuyến nghị sử dụng tổ chức W3C Trong nhiều trường hợp thực tế, ứng dụng Web ngữ nghĩa cần truy vấn thông tin tổng hợp từ ontology đến từ nhiều nguồn khác (và khơng qn) mà không phép chỉnh sửa hay tạo ontology Một giải pháp phù hợp cho vấn đề khung lập luận với ontology không quán sử dụng chiến lược phát triển tuyến tính tập tiên đề diễn giải, Với x ∈ X, ta có: + card(x0∗ x+ ) card(L) card((x∗ + \ {t}) x+ ) = card(L) + η(x0∗ , x+ ) = Do t ∈ x∗ + t ∈ / S x∈X x + (theo giả thiết) nên ta có ∀x ∈ X: card((x∗ + \ {t}) x+ ) = card(x∗ + x+ ) − Như vậy, ∀x ∈ X: card((x∗ + \ {t}) x+ ) card(L) ∗ card(x + x+ ) + = card(L) card(x∗ + x+ ) = η(x∗ + , x+ ) < card(L) + η(x0∗ , x+ ) = Do đó: X + η(x0∗ , x+ ) > X x∈X < η(x∗ + , x+ ) x∈X x∈X d∧ (x0∗ , X) = X + η(x0∗ , x+ ) + η(x∗ − , x− ) 2 X x∈X η(x∗ + , x+ ) + η(x∗ − , x− ) 2 = d∧ (x∗ , X) Điều trái với giả thiết (x∗ + , x∗ − ) ∈ C(X) ∧ C(X) ` H5 Do đó, giả thiết (4.8) sai Vậy (4.6) (đpcm) Chứng minh tương tự ta có (4.7) Định lý 4.3 Thành phần khẳng định thành phần phủ định đồng thuận thoả tiêu chuẩn H5 xác định độc lập nhau; nghĩa là, công thức hội (x∗ + , x∗ − ) đồng thuận X công thức hội (x∗ + , ∅) đồng thuận X0 = {(xi + , ∅) | i = 1, 2, , n}, công thức hội (∅, x∗ − ) đồng thuận X00 = {(∅, xi − ) | i = 1, 2, , n} 104 Chứng minh Định lý chứng minh theo hai chiều (a) (b) sau: (a) Nếu (x∗ + , x∗ − ) đồng thuận H5 hồ sơ X • (x∗ + , ∅) đồng thuận H5 hồ sơ X0 = {(xi + , ∅) | i = 1, 2, , n}, • (∅, x∗ − ) đồng thuận H5 hồ sơ X00 = {(∅, xi − ) | i = 1, 2, , n}; Mệnh đề chứng minh phản chứng Q Với X ∈ (Conj(L)) hồ sơ công thức hội, (x∗ + , x∗ − ) đồng thuận H5 hồ sơ X Giả sử (x∗ + , ∅) đồng thuận H5 hồ sơ X0 = {(xi + , ∅) : i = 1, 2, , n} Gọi y ∗ = (y ∗ + , y ∗ − ) đồng thuận H5 hồ sơ X0 : y ∗ 6= (x∗ + , ∅) Do y ∗ đồng thuận H5 X0 nên theo Định lý 4.2 (C ` H5 ⇒ C ` H2 ), ta có: y ∗ − = ∅ Ngồi ra, theo định nghĩa đồng thuận H5 , ta có: X η(y ∗ + , x+ ) + Điều có nghĩa: X + η(y ∗ , x+ ) < ⇔ ⇔ + η(x0∗ , x+ ) < X x∈X0 n X i=1 i=1 n X n X η(y η(∅, x− ) < ∗+ + , xi ) + i=1 X η(x∗ + , x+ ) + X η(∅, x− ) x∈X0 x∈X0 x∈X0 x∈X0 x∈X0 n X X η(x∗ + , x+ ) η(x∗ + , xi + ) η(x ∗− + , xi ) < i=1 n X i=1 η(x ∗+ + , xi ) + n X η(x∗ − , xi + ) i=1 ⇔ d∧ (y ∗ + , x∗ − ), X < d∧ (x∗ + , x∗ − ), X Như vậy, tồn công thức hội (y ∗ + , x∗ − ) mà d∧ (y ∗ + , x∗ − ), X < d∧ (x∗ + , x∗ − ), X Điều mâu thuẫn với giả thiết (x∗ + , x∗ − ) đồng thuận H5 X Vậy, mệnh đề Một cách tương tự, ta chứng minh mệnh đề thứ hai (b) Nếu • (x∗ + , ∅) đồng thuận H5 hồ sơ X0 = {(xi + , ∅) | i = 1, 2, , n}, • (∅, x∗ − ) đồng thuận H5 hồ sơ X00 = {(∅, xi − ) | i = 1, 2, , n}; 105 (x∗ + , x∗ − ) đồng thuận H5 hồ sơ X = {(xi + , xi − ) | i = 1, 2, , n} Điều chứng minh sau: Với công thức hội (y + , y − ) ∈ Conj(L), ta có: • d∧ (x∗ + , ∅), X0 ) ≤ d∧ ((y + , ∅), X0 , − 00 00 ∗− • d∧ (∅, x ), X ) ≤ d∧ ((∅, y ), X Vì vậy, d∧ (x∗ + , ∅), X0 + d∧ (∅, x∗ − ), X00 ≤ d∧ (y + , ∅), X0 + d∧ (∅, y − ), X00 d∧ (x∗ + , x∗ − ), X ≤ d∧ (y + , y − ), X Bất đẳng thức cuối chứng tỏ (x∗ + , x∗ − ) đồng thuận H5 hồ sơ X Định lý 4.2 cho thấy đồng thuận thoả tiêu chuẩn H5 thoả hai tiêu chuẩn H1 H2 Trong đó, Định lý 4.3 hai thành phần khẳng định phủ định đồng thuận thoả tiêu chuẩn H5 xác định độc lập Định lý cách để xác định đồng thuận thoả tiêu chuẩn H5 hồ sơ xung đột Định lý 4.4 Cho X = {xi ∈ Conj(L) | i = 1, 2, , n} hồ sơ xung đột gồm Q công thức hội, X ∈ (Conj(L)) Gọi: • Z+ (tương ứng, Z− ) tập hợp tất literal xuất thành phần dương (tương ứng, thành phần âm) cơng thức hội thuộc hồ sơ X • f + (z) (tương ứng, f − (z)) số lần xuất phần tử z thành phần dương (tương ứng, thành phần âm) công thức hội thuộc hồ sơ X Giả sử C(X) hàm chọn đồng thuận thoả tiêu chuẩn H5 Khi đó, x∗ = (x∗ + , x∗ − ) ∈ C(X) nếu: n o n (a) x∗ + = z ∈ Z+ | f + (z) >= , 106 n o n + (b) x− = z ∈ Z− | f − (z) >= Chứng minh Theo Định lý 4.3, ta xây dựng đồng thuận x∗ = (x∗ + , x∗ − ) thoả tiêu chuẩn H5 cách xây dựng cách độc lập hai đồng thuận x∗ + x∗ − tương ứng hai hồ sơ X+ = {xi + | i = 1, 2, , n} X− = {xi − | i = 1, 2, , n} o n n Ta phải chứng minh (a) x∗ + = z ∈ Z+ | f + (z) >= Việc chứng minh (b) hoàn toàn tương tự Trước hết, theo Định lý 4.2, x∗ + chứa literal thuộc Z+ Mặt khác, ta chứng minh thêm, với công thức hội x ∈ Conj(L), ta có: (i) Nếu z ∈ Z + thoả f + (z) ≥ n mà z ∈ / x+ d∧ ((x+ , x− ), X+ ) ≤ d∧ (x+ ∪ {z}, x− ), X+ (ii) Nếu z ∈ Z + thoả f + (z) < Q n mà z ∈ / x+ d∧ ((x+ , x− ), X+ ) > d∧ (x+ ∪ {z}, x− ), X+ Thật vậy, với X ∈ (Conj(L)), x ∈ Conj(L), z ∈ L, xét khoảng cách d∧ ((x+ ∪ {z}, x− ), X): − + d∧ ((x ∪ {z}, x ), X) = X card((x+ ∪ {z}) y + ) y∈X card(L) card(x− y − ) + card(L) Nhận thấy: card(x+ y + ) − card((x+ ∪ {z}) y + ) card(L) = + y+) + card(x card(L) card(L) Gọi Xz := {x ∈ X | x+ z} Xz := {x ∈ X | x+ = z} Ta có, card(Xz ) = f + (z) card(Xz ) = n − f + (z) 107 y + z y + = z Như vậy: X card((x+ ∪ {z}) y + ) card(L) y∈X = X card((x+ ∪ {z}) y + ) card(L) y∈Xz = card(L) = X card(x+ y + ) card(L) y∈X = X card(x+ y + ) card(L) y∈X + + X card((x+ ∪ {z}) y + ) y∈Xz X card(x+ y + ) − y∈Xz + + card(L) X card(x+ y + ) + card(L) y∈Xz + −f (z) + n − f + (z) card(L) n − 2.f + (z) card(L) Do đó: d∧ ((x+ ∪ {z}, x− ), X) = X card((x+ ∪ {z}) y + ) y∈X = card(L) X card(x+ y + ) y∈X ( card(L) + card(x− y − ) + card(L) n − 2.f + (z) card(x− y − ) )+ card(L) card(L) n − 2.f + (z) =d∧ (x, X) + card(L) n việc bổ sung z vào x+ n không làm tăng tổng khoảng cách x đến hồ sơ X Ngược lại, f + (z) < việc bổ sung z vào x+ làm tăng tổng khoảng cách x đến hồ sơ X Nói Như vậy, n − 2.f + (z) ≤ 0, hay f + (z) ≥ cách khác, (i) (ii) chứng minh n Trở lại việc chứng minh (a) Có thể thấy rằng, xuất phát từ tập hợp z ∈ o n Z+ | f + (z) >= , ta loại bỏ bớt phần thuộc tập hợp này, bổ sung thêm phần tử Z+ trình thành lập thành phần khẳng định đồng thuận Nói cách khác, thành phần khẳng định đồng thuận Do (a) (đpcm) Nhận xét tiêu chuẩn đồng thuận Trong mục này, luận án phân tích mối liên quan tiêu chuẩn đồng thuận, thể qua định lý 4.1, 4.2, 4.3 4.4 Có điểm lưu ý rằng, 108 mối liên quan có cách xây dựng khoảng cách hai tập hợp ký hiệu Định nghĩa 4.4 Trên thực tế, để đánh giá khoảng cách hai tập hợp, người ta sử dụng tiếp cận khác [45]: η(X1 , X2 ) = card(X1 X2 ) , card(X1 ∪ X2 (4.9) Cách đánh giá khoảng cách hai tập hợp công thức (4.9) có ưu điểm khơng phụ thuộc vào lực lượng tập literal Tuy nhiên áp dụng cách tiếp cận để tính khoảng cách hai cấu trúc hội tốn tìm đồng thuận hồ sơ cấu trúc hội trở nên phức tạp: Định lý 4.4 khơng cịn nữa! Ngồi ra, cơng trình [45] tác giả Nguyễn Ngọc Thành tốn tìm đồng thuận H5 trường hợp toán thuộc lớp NP-đầy đủ! Phần sau đây, luận án trình thuật tốn hiệu để xây dựng đồng thuận cho hồ sơ công thức hội nhờ tận dụng đặc trưng có nhờ Định nghĩa 4.4 4.1.3 Thuật tốn xác định đồng thuận Dựa vào tính chất tiêu chuẩn phân tích Tiểu mục 4.1.2, phần trình bày cách xây dựng đồng thuận x∗ = (x∗ + , x∗ − ) hồ sơ Q xung đột X ∈ (Conj(L)) theo chiến lược ưu tiên tiêu chuẩn với thứ tự sau: H5 , H4 , H1 , H2 , H3 H6 Định lý 4.2 cho thấy điều kiện định nghĩa tiêu chuẩn H5 quan trọng, nói chung đồng thuận thoả tiêu chuẩn thoả tiêu chuẩn H1 H2 Ngoài ra, theo Định lý 4.3, việc xác định thành phần dương âm đồng thuận thực cách độc lập Vì thế, việc tính tốn cơng thức hội tối ưu (x∗ + , x∗ − ) ∈ C(X) mà X = {xi = (xi + , xi − ) ∈ Conj(L) | i = 1, 2, , n} chia làm việc nhỏ tương tự nhau: xác định thành phần dương đồng thuận xác định thành phần âm đồng thuận: X x∈X η(x ∗+ + , x ) = nX x∈X 109 0+ + η(x , x ) | x ⊆ L o X η(x ∗− − , x ) = x∈X nX 0− − η(x , x ) | x ⊆ L o x∈X Định lý 4.4 cách tìm thành phần này, nhiên, định lý lại không đảm bảo đồng thuận tìm thoả tiêu chuẩn H4 Trên sở phân tích này, luận án đề xuất thuật toán xác định đồng thuận Ý tưởng thuật tốn sau: • Trước hết, xác định tập hợp Z+ Z− gồm tương ứng literal âm literal dương có cơng thức hội thuộc hồ sơ xung đột X • Với literal z Z+ Z− thống kê tần số xuất thành phần dương thành phần âm công thức hội thuộc hồ sơ X • Nếu có literal Z+ Z− xuất bán tồn đồng thuận thoả tiêu chuẩn P5 cho hồ sơ xung đột Gọi đồng thuận x∗ , x∗ + chứa literal xuất bán thành phần dương công thức hội thuộc hồ sơ X Tương tự, thành phần âm đồng thuận, x∗ − chứa literal xuất bán thành phần âm công thức hội thuộc X Tuy nhiên, có trường hợp mà literal xuất hai thành phần x∗ + x∗ − (do literal xuất bán thành phần dương âm công thức hội thuộc hồ sơ X) Để đảm bảo đồng thuận x∗ quán (thoả tiêu chuẩn P4), phải loại literal khỏi x∗ + x∗ − Giả sử z ∈ x∗ + ∩ x∗ − Bằng cách xem xét d+ = d∧ (x∗ + \ {z}, x∗ − ), X d− = d∧ (x∗ + , x∗ − \ {z}), X , d+ > d− loại z khỏi thành phần dương x∗ Trong trường hợp ngược lại, z bị loại khỏi thành phần âm x∗ Đồng thuận thu thoả tiêu chuẩn H5 (do thoả tiêu chuẩn H1 , H2 ), H4 H6 • Trong trường hợp khơng có literal xuất bán hai thành phần âm dương cơng thức hội ưu tiên tìm đồng thuận thoả tiêu chuẩn H3 hồ sơ xung đột: − Nếu Z+ ∩ Z− = ∅ x∗ = (Z+ , Z−) đồng thuận H3 hồ sơ 110 − Ngược lại, đồng thuận hồ sơ xung đột công thức chọn từ X có tổng khoảng cách đến công thức khác đạt cực tiểu Các ý tưởng thể Thuật toán 4.1: Thuật toán 4.1: Xác định đồng thuận từ hồ sơ gồm công thức hội Đầu vào: Hồ sơ xung đột X ∈ + − Q (Conj(L)), X = (xi , xi ) | i = 1, 2, , n; n ∈ N∗ , xi + ∩ xi − = ∅ ∀i = 1, 2, , n Đầu ra: Đồng thuận x∗ ∈ Conj(L) thoả nhiều tiêu chuẩn tập hợp {H1 , H2 , H3 , H4 , H5 , H6 } begin Z+ := S x+ ; Z− := x∈X S x− ; x∈X foreach z ∈ Z+ f + (z) := card{x ∈ X | x+ z}; foreach z ∈ Z− Bước Bước f − (z) := card{x ∈ X | x− z}; n x∗ + := {z ∈ Z+ | f + (z) ≥ }; n − ∗ − − x := {z ∈ Z | f (z) ≥ }; + − ∗ ∗ if (x ∪ x 6= ∅) then foreach z ∈ x∗ + ∩ x∗ − if d∧ (x∗ + \ {z}, x∗ − ), X < d∧ (x∗ + , x∗ − \ {z}), X then x∗ + := x∗ + \ {z}; else x∗ − := x∗ − \ {z}; else if (Z+ ∩ Z− = ∅) then Bước x∗ := (Z+ , Z− ); else Bước x∗ := x1 ; for i := to n if d∧ (x∗ , X) > d∧ (x, X) then x∗ := xi 111 Chứng minh tính thuật tốn Theo cách hoạt động Thuật toán 4.1, bắt đầu tìm đồng thuận thoả tiêu chuẩn H5 (phần (a)) Sau đó: (i) Nếu hai thành phần dương âm đồng thuận H5 rỗng, thuật tốn ưu tiên xét tìm đồng thuận thoả tiêu chuẩn H3 (phần (c)) hồ sơ X quán Trong trường hợp hồ sơ không quán, theo phần (d), chọn từ hồ sơ X phần tử có tổng khoảng cách đến phần tử lại hồ sơ cực tiểu Đồng thuận trường hợp luôn thoả tiêu chuẩn H4 (do xi công thức hội thoả xi + ∩ xi − = ∅, ∀i = 1, 2, , n, theo giả thiết) (ii) Nếu phần (a) xác định hai thành phần, phần dương âm đồng thuận khác rỗng, phải tìm cách làm mịn hai thành phần để đảm bảo tiêu chuẩn H4 thoả, đồng thời đảm bảo tổng khoảng cách từ đồng thuận đến phần tử hồ sơ cực tiểu Ngoài ra, tất trường hợp xử lý thuộc hai nhánh phân tích (i) (ii) trên, xây dựng x∗ + (tương ứng, x∗ − ) từ phần tử thuộc Z+ (tương ứng, Z− ) Vì đồng thuận luôn thoả tiêu chuẩn H2 Đồng thuận ln ln thoả tiêu chuẩn H1 xây dựng từ đồng thuận thoả tiêu chuẩn H5 , sau đó, phần tử bị loại phần tử có tần số xuất n Độ phức tạp Thuật toán 4.1 n S + S −o Với n lực lượng hồ sơ X, m = max card( x ), card( x ) Các x∈X x∈X bước thuật tốn có độ phức tạp sau: • Bước khởi tạo: thống kê tần số xuất literal thành phần công thức hội hồ sơ Độ phức tạp thủ tục O(m.n.m) = O(n.m2 ) • Bước dùng để tạo tập hợp khởi đầu cho x∗ + , x∗ − dựa tần số xuất literal Độ phức tạp bước O(m) • Trong Bước 2, với literal chung z x∗ + x∗ − , so sánh 112 khoảng cách với X loại bỏ z hai thành phần để tìm thành phần tốt Độ phức tạp bước O(m.n.m2 ) = O(n.m3 ) • Bước kiểm tra giao hai tập hợp Z+ , Z− , có độ phức tạp O(m2 ) • Bước tính khoảng cách cơng thức hội x với hồ sơ xung đột X (để tìm cơng thức hội đạt cực tiểu khoảng cách đến X) Độ phức tạp bước O(n.n.m2 ) = O(n2 m2 ) Sau bước khởi tạo Bước 1, thuật toán thực ba bước: Bước Bước Bước Độ phức tạp thuật toán tương ứng cho ba trường hợp là: • O(max{n.m2 , m, n.m3 }) = O(n.m3 ) • O(max{n.m2 , m, m2 }) = O(n.m2 ) • O(max{n.m2 , m, n2 m2 }) = O(n2 m2 ) Như vậy, độ phức tạp thuật toán O(max{n.m3 , n.m2 , n2 m2 }) Nếu m < n độ phức tạp thuật tốn O(n2 m2 ) Trong trường hợp lại, độ phức tạp thuật tốn O(n.m3 ) Ví dụ minh hoạ cho Thuật toán 4.1 Sử dụng ký hiệu L = {t1 , t2 , t3 , t4 } để biểu diễn tính chất thuộc tính hasSpouse Ví dụ 4.1, tác tử a1 , a2 , , a6 đưa ý kiến dạng công thức hội Bảng 4.2 bên Chúng ta áp dụng Thuật toán 4.1 để tìm tri thức đồng thuận từ ý kiến tác tử Hồ sơ X thành lập gồm công thức hội sau: n o X = ({t1 , t3 , t4 }, {t2 }), ∗ ({t1 }, {t3 , t4 }), ({t1 }, {t3 }), ({t3 }, {t1 }), ({t3}, ∅) Sau bước (a) thuật tốn, có: x∗ + = {t1 , t3 } x∗ − = {t3 , t4 } Do x∗ + ∪ x∗ − 6= ∅ nên tìm cách loại literal chung hai thành phần đồng thuận (theo bước (b)): Với x∗ + ∩ x∗ − = {t3 }, ta xét hai tổng khoảng cách sau đây: d∧ ({t1 }, {t3 , t4 }), X d∧ ({t1 , t3 }, {t4 }), X 113 Bảng 4.2: Trạng thái tri thức tác tử cho toán minh hoạ Tác tử Trạng thái tri thức a1 t1 ∧ ¬t2 ∧ t3 ∧ t4 a2 t1 ∧ ¬t3 ∧ ¬t4 a3 t1 ∧ ¬t3 a4 t1 ∧ ¬t3 ∧ ¬t4 a5 ¬t1 ∧ t3 ∧ ¬t4 a6 t3 Với ý card(L) = 4, ta tính: d∧ ({t1 }, {t3 , t4 }), ({t1 , t3 , t4 }, {t2 }) card({t1 } {t1 , t3 , t4 }) card({t3 , t4 } {t2 }) = + 4 = Tương tự, • d∧ ({t1 }, {t3 , t4 }), ({t1 }, {t3 , t4 }) = • d∧ ({t1 }, {t3 , t4 }), ({t1 }, {t3 }) = • d∧ ({t1 }, {t3 , t4 }), ({t3 }, {t1 , t4 }) = • d∧ ({t1 }, {t3 , t4 }), ({t3 }, ∅) = 8 • d∧ ({t1 , t3 }, {t4 }), ({t1 , t3 , t4 }, {t2 }) = • d∧ ({t1 , t3 }, {t4 }), ({t1 }, {t3 , t4 }) = • d∧ ({t1 , t3 }, {t4 }), ({t1 }, {t3 }) = • d∧ ({t1 , t3 }, {t4 }), ({t3 }, {t1 , t4 }) = • d∧ ({t1 , t3 }, {t4 }), ({t3 }, ∅) = 8 Như vậy: 114 4 15 +2∗0+ + + = 8 8 2 2 13 • d∧ ({t1 , t3 }, {t4 }), X = + ∗ + + + = 8 8 8 13 15 Do d∧ ({t1 , t3 }, {t4 }), X = < = d∧ ({t1 }, {t3 , t4 }), X nên ta định loại 8 t3 khỏi x∗ − • d∧ ({t1 }, {t3 , t4 }), X = Cuối cùng, đồng thuận hồ sơ X ({t1 , t3 }, {t4 }), t1 ∧ t3 ∧ ¬t4 4.2 Xử lý xung đột mức tiên đề trình tích hợp ontology Một ontology xem xét tập tiên đề biểu diễn tri thức lĩnh vực cụ thể Nếu dùng literal để biểu diễn tiên đề ontology, tri thức ontology biểu diễn dạng cơng thức hội literal Chính vậy, không quán tập tiên đề ontology biểu diễn hồ sơ xung đột công thức hội literal Với nhận xét này, toán xử lý xung đột mức tiên đề q trình tích hợp ontology giải dựa kết Mục 4.1 Xét n (n ∈ N∗ ) ontology O1 , O2 , , On , ontology Oi (i = 1, 2, , n) biểu diễn bốn hCi , Ii , Ri , Zi i, với: • Ci tập khái niệm ontology Oi • Ii tập cá thể ontology Oi • Ri tập mối quan hệ ontology Oi • Zi = {z1i , z2i , , zni i } tập tiên đề ontology Oi , gồm ni tiên đề Ontology Oi (i = 1, 2, , n) thể trạng thái tri thức biểu diễn công thức z1i ∧ z2i ∧ · · · ∧ zni i Việc tích hợp n ontology O1 , O2 , , On hiểu tìm tập tiên đề đại diện cho n tập tiên đề Z1 , Z2 , , Zn Gọi Z := {t1 , t2 , , tm } (m ∈ N∗ ) tập literal cho tiên đề ontology Oi (i = 1, 2, , n) biểu diễn dạng literal phủ định literal Z: ∀α ∈ Zi (i = 1, 2, , n), ∃t ∈ Z : (t ≡ α) ∨ (¬t ≡ α) Với tập hợp Z này, xem ontology Oi trạng thái tri thức biểu diễn công thức hội xi ∈ Conj(Z) với xi ≡ z1i ∧z2i ∧· · ·∧zni i Như vậy, với n ontology O1 , O2 , , On lập hồ sơ 115 X = {x1 , x2 , , xn } xi ≡ z1i ∧ z2i ∧ · · · ∧ zni i Đồng thuận x∗ hồ sơ X xác định Thuật toán 4.1 tập tiên đề tốt mặt cú pháp từ ontology cho Tuy nhiên, x∗ khơng qn mặt ngữ nghĩa Đối với trường hợp này, khắc phục chọn Z1 , Z2 , , Zn tập tiên đề sai khác so với x∗ (tập tiên đề có tổng khoảng cách đến x∗ đạt cực tiểu) Từ phân tích nêu trên, luận án đề xuất Thuật toán 4.2 xác định đồng thuận mặt cú pháp tập tiên đề Z1 , Z2 , , Zn Ý tưởng thuật toán sau: • Xây dựng tập literal Z cho tập tiên đề ontology biểu diễn dạng cơng thức hội Conj(Z) • Với tập tiên đề Zi , (i = 1, 2, , n), cho bổ sung α ∈ L α hệ logic tập tiên đề Zi (nghĩa là, α suy từ tập hợp tiên đề Zi ) Tương tự vậy, bổ sung ¬α vào tập tiên đề Zi ¬α hệ logic tập tiên đề Zi Việc bổ sung tiên đề α ¬α vào tập Zi để đảm bảo tính tần suất xuất thực tiên đề tiềm ẩn ontology Điều quan trọng thuật tốn xác định đồng thuận (Thuật tốn 4.1) có xét đến tần suất xuất literal công thức hội thuộc hồ sơ xung đột Chẳng hạn, β ∧ γ ⇒ α xem tập tiên đề {β, γ} có chứa tiên đề α • Thành lập hồ sơ xung đột X ∈ Conj(Z) từ n tập tiên đề ontology O1 , O2 , , On : X = {Z1 , Z2 , , Zn } • Sử dụng Thuật tốn 4.1 để xây dựng đồng thuận x∗ hồ sơ X Nếu x∗ quán kết luận x∗ tập tiên đề tốt nhất, ngược lại, tìm Zi (i = 1, 2, , n) cho tập tiên đề có khoảng cách nhỏ đến x∗ kết luận tập tiên đề tốt 116 Nội dung thuật tốn trình bày cụ thể sau: Thuật toán 4.2: Xác định tập tiên đề đồng thuận ontology Đầu vào: Ontology O1 , O2 , , On với tập tiên đề Z1 , Z2 , , Zn (n ∈ N∗ ) Đầu ra: Tập tiên đề x∗ đại diện tốt cho tập tiên đề ontology O1 , O2 , , On begin Bước Z := ∅; foreach Oi ∈ {O1 , O2 , , On } foreach α ∈ Zi needAdd := true; foreach z ∈ Z if (z ≡ α) or (¬z ≡ α) then needAdd := f alse; break; if (needAdd = true) then Z := Z ∪ {α}; Bước foreach Oi ∈ {O1 , O2 , , On } foreach z ∈ Z \ Zi if (Zi |= z) then Zi := Zi ∪ {z}; if (Zi |= ¬z) then Zi := Zi ∪ {¬z}; Bước Lập hồ sơ xung đột X := {x1 , x2 , , xn } với xi ∈ Conj(Z) biểu diễn trạng thái tri thức tương ứng tập tiên đề Zi ontology Oi ; Bước Xác định x∗ đồng thuận hồ sơ xung đột X theo Thuật toán 4.1; Bước if (x∗ quán) then Z∗ := x∗ ; else Z∗ := Z1 ; foreach Z0 ∈ {Z2 , Z3 , , Zn } if η(x∗ , Z0 ) < η(x∗ , Z∗ ) then Z∗ := Z0 ; 117 Chúng ta phân tích độ phức tạp Thuật tốn 4.2 Gọi: • m = card(Z) số lượng literal dùng để biểu diễn tiên đề ontology đầu vào; • O(f (m)) độ phức tạp thuật toán lập luận với ontology có chứa m tiên đề Độ phức tạp bước thuật toán xác định sau: • Bước dùng để xác định tập hợp Z, tập cực tiểu literal mà dùng để biểu diễn tiên đề ontology Oi (i = 1, 2, , n) Độ phức tạp bước O(n.m2 ) • Trong Bước 2, với ontology Oi , xem xét bổ sung tiên đề z ∈ Z z hệ logic tập tiên đề Zi (kiểm tra xem z suy từ tập hợp tiên đề Zi hay không) Độ phức tạp bước O n.m.f (m) • Bước lập hồ sơ xung đột X có độ phức tạp O(n) • Bước xác định đồng thuận hồ sơ công thức hội X với n công thức hội sử dụng m literal cách sử dụng Thuật toán 4.1 Độ phức tạp bước O max{n.m3 , n2 m2 } • Bước thuật tốn kiểm tra qn x∗ tìm Nếu x∗ khơng qn, thuật tốn phải duyệt qua n tập tiên đề để tìm tập tiên đề có tổng khoảng cách đến tập tiên đề lại đạt cực tiểu − Độ phức tạp thủ tục kiểm tra quán tập tiên đề tương ứng với x∗ O(f (m)) − Độ phức tạp thủ tục tìm tập tiên đề có khoảng cách cực tiểu đến tập tiên đề cịn lại O(n.m2 ) Do đó, độ phức tạp Bước O(max{f (m), n.m2 }) Các bước nêu thuật toán thực Do độ phức tạp thuật tốn là: O max n.m2 , n.m.f (m), n, n.m3 , n2 m2 , f (m), n.m2 = O max n.m.f (m), n.m3 , n2 m2 118